Bild
Exempel på integrativa matrisfaktoriseringslayouts av låg rang och deras motsvarande grafstrukturer
Exempel på integrativa matrisfaktoriseringslayouts av låg rang och deras motsvarande grafstrukturer.
Foto: Felix Held
Länkstig

Metoder för att hitta struktur i storskaliga data

Felix Helds doktorsavhandling utvecklar olika metoder för att analysera data, främst genetisk sådan. Området kallas oövervakade integrativa metoder (unsupervised integrative methods) och en viktig del av utvecklingen är skalbarhet och flexibilitet.

Oövervakade metoder används för att söka struktur i data. De används för att hitta grupperingar, minska datadimensioner eller få fram tolkningsbar kunskap. Inom oövervakade metoder finns ingen målvariabel, till skillnad från i till exempel regressionsanalys, och ett typiskt exempel är klustring. Man gör modellantaganden om hur det skulle kunna se ut och försöker sedan hitta strukturer.

Bild
Felix Held
Felix Held
Foto: Setta Aspström

En del av doktorsavhandlingen vidareutvecklar sedan tidigare existerande modeller för integrativ dataanalys, det vill säga där man vill analysera flera datakällor samtidigt. Det kan till exempel vara genuttrycksdata som man vill integrera med drogperturbationsexperiment (effekten av ett läkemedel på genuttrycket) och metyleringsdata (där metyleringen styr vilka gener som slås av och på).

Mjukvarupaket nu tillgängliga på GitHub

Den andra delen kommer från en biologisk problemställning och går ut på att hitta samregulerade grupper av gener. Metoden grupperar gener i kluster och sammanbinder dessa med regulatorer (till exempel transkriptionsfaktorer, proteiner involverade i den process där genetisk information i cellens DNA översätts till information i RNA) som har liknande stimulerande eller hämmande effekt på genuttrycket i ett kluster. Sammantaget bidrar metoderna i avhandlingen till utvecklingen av effektiva, flexibla och skalbara oövervakade metoder för integrativ dataanalys. Metoderna har implementerats som mjukvarupaket som finns offentligt tillgängliga på GitHub, i förhoppning om att stimulera tillämpningar inom framtida forskning.

Felix gjorde sin kandidatutbildning i matematik med fysik i Würzburg i Tyskland och började även läsa mastersprogrammet där när han fick möjlighet till ett utbytesår på Chalmers. Han trivdes så bra att han kom att läsa hela mastersprogrammet i Göteborg och fortsatte sedan med en licentiatexamen genom Fraunhofer-Chalmers Centre for Industrial Mathematics, där han arbetade med farmakokinetisk/farmakodynamisk modellering.

– Göteborg är trevligt, det är lugnt men tillräckligt stort för att det ska finnas mycket att göra, och så ligger det ju nära havet. Mastersprogrammet var bra eftersom det fanns mycket tillämpningar av matematiken.

Startade återkommande workshop för unga forskare

Efter licentiatavhandlingen ville Felix lära sig mer om statistik och fortsatte till doktorsexamen på institutionen. Han tycker om att undervisa och föreläste på masterskursen Statistical learning for big data under tre år, en riktig utmaning för en doktorand. Andra och tredje året blev dessutom digitala på grund av pandemin. Felix har också engagerat sig i doktorandrådet, under en tid som dess ordförande, och startade tillsammans med tre andra doktorander den nationella Workshop on Modelling in Biology and Medicine som fortsatt hållas vartannat år för unga forskare i gränsområdet matematik, biologi och medicin.

– Man kan göra mycket som doktorand på matematiska vetenskaper för att få inflytande, det är skönt. Och det var en fin upplevelse att ha varit med och startat en återkommande workshop som första året lockade 70 personer. Nu tänker jag söka mig mot industrin. Det är en ganska ensam resa att doktorera inom matematik, det är så brett så det är ofta svårt att förstå andras forskningsfält, och jag längtar efter mer teamarbete.

Läs Felix avhandling

Felix Held disputerar i matematisk statistik, inriktning tillämpningar, med avhandlingen Unsupervised methods for integrative data analysis fredag den 7 juni kl 13.15 i sal Pascal, Hörsalsvägen 1. Handledare är Rebecka Jörnsten och biträdande handledare är Johan Jonasson.