Bild
Yi Peng på terassen i hus Jupiter, campus Lindholmen
Bra data är avgörande för all typ av AI-tillämpning menar Yi Peng, från utvecklingen av självkörande fordon till miljöforskning.
Foto: Natalija Sako
Länkstig

Hon vill skapa bättre AI genom bättre data

Publicerad

AI är bara så bra som den data som matats in, det är utgångspunkten för doktoranden YI Pengs forskning. Hon började sina forskarstudier inom programvaruteknik utan tidigare erfarenhet av fältet. Nu studerar hon hur man ser till att data i nya AI-system håller måttet. 

– Många AI-forskare fokuserar på att förbättra modellernas prestanda men om informationen som modellen tränats på är snedvriden eller partisk blir modellen inte användbar i praktiken, säger doktoranden Yi Peng. 

Fokuset för hennes forskning är datakrav inom AI-system. Det handlar bland annat om vilken typ av data ett system behöver, hur den ska samlas in och dokumenteras och när man behöver gå tillbaka och samla in mer. Bra data är avgörande för all typ av AI-tillämpning menar Yi Peng, från utvecklingen av självkörande fordon till miljöforskning där maskininlärning kan användas för att klassificera bilder eller göra prognoser. 

– Miljöforskare har ofta enorma datamängder men lite vägledning kring om deras data är lämplig eller opartisk. Kravhantering kan hjälpa dem att förstå och förbättra den data de arbetar med, säger hon. 

Ett forskningsområde i snabb förändring 

Yi Pengs forskningsområde kravhantering är ett etablerat fält inom programvaruteknik. Det handlar om att utvecklarteam behöver enas om vilka krav ett system ska uppfylla innan man börjar bygga det. Kraven kan exempelvis handla om vad systemet ska göra, hur man säkerställer kvalitet och säkerhet eller när det är dags att uppdatera systemet. Att definiera alla krav är inte alltid enkelt i praktiken – något Yi Peng själv fick uppleva när hon efter masterstudierna fick jobb på ett telekommunikationsföretag i Kina. 

– Jag tillbringade mycket tid i möten för att försöka se till att alla förstod vad vi skulle bygga. Då insåg jag hur mycket tid och energi som går förlorad på otydliga krav. 

En utmaning för forskare inom AI och maskinlärning är de snabba förändringarna inom fältet där en vetenskaplig artikel riskerar att bli inaktuell redan innan den presenteras på en konferens. Inom kravhantering är de traditionella metoderna utformade för system med förutsägbart beteende, medan maskininlärningssystem kräver nya angreppssätt. 

– Data förändras över tid. Om ny data skiljer sig mycket från informationen modellen tränades på kan systemet börja göra fel. Mitt arbete handlar om hur man kan formulera krav så att utvecklare vet när data behöver kontrolleras, ersättas eller när modellen behöver tränas om. 

Bild på doktoranden Yi Peng
Foto: Natalija Sako

Nybörjare inom sitt forskningsområde  

Yi Peng kommer från en akademikerfamilj och har alltid haft en tanke på att forska, men vägen till en doktorandtjänst inom just programvaruteknik var inte självklar. Hon har en masterexamen i elektroteknik och robotik från USA, och det var under robotikstudierna som intresset för maskininlärning väcktes. Hon visste att hon skulle ha svårt att söka doktorandtjänster i USA på grund av amerikanska restriktioner mot kinesiska företag. Men när hon såg en utlysning för en doktorandtjänst i Sverige, med fokus på kravhantering för just maskininlärningssystem, tog hon chansen och sökte. 

– Jag hade besökt Sverige som barn när min pappa arbetade som gästforskare i Stockholm, så när jag fick erbjudandet kändes det lite som att cirkeln slöts. 

Eftersom Yi Peng inte hade tidigare erfarenhet av programvaruteknik började hennes doktorandprojekt med en bred genomgång av befintlig forskning. Det ledde till nya idéer, bland annat att använda insikter från datavetenskap för att stärka kravprocesser, något hon nu utforskar i samarbete med flera företag i regionen. Hon har också lärt sig att uppskatta delar av akademin som tidigare kändes utmanande. 

– Nätverkande faller sig inte naturligt för mig, men att träffa människor på konferenser och workshops ger mig alltid nya perspektiv.  

För Yi Peng handlar motivationen bakom forskningen ytterst om att bidra till något större och föra kunskapen framåt. 

– En doktorandutbildning ger dig möjlighet att arbeta med ett problem som ingen har löst tidigare, vilket känns otroligt spännande. 

 

Text: Natalija Sako

Yi Peng

Är: Doktorand i kravhantering vid institutionen för data- och informationsteknik.

Ålder: 29.

Uppväxt: Dalian, Kina.

Fritidsintressen: Att resa, läsa och lego.

Kuriosa: "Jag började samla på magneter från varje stad jag besökt under min tid som doktorand, och den samlingen har växt oväntat fort. Jag är nu uppe i 13 stycken".