
Grundläggande språkteknologi
Kort om kursen
Kursen ger en teoretisk bakgrund till de huvudsakliga problemen som dyker upp inom Natural Language Processing och några av deras standardlösningar.
Om utbildningen
Parallellt får studenterna en praktisk programmeringserfarenhet av att lösa dessa uppgifter. Vi använder samma programmeringsspråk som på kursen Introduktion till programmering tillsammans med standardbibliotek för NLP.
Kursen är uppdelad i fyra block: ett tar upp grundläggande begrepp och de andra täcker delområden inom NLP– ord, syntax och semantik/pragmatik.
1. Grudläggande begrepp:
- grundbegrepp inom NLP
- grundläggande automatateori och matematisk lingvistik
- grundläggande sannolikhetsteori och maskininlärning
- evalueringsmått, inkluderande korrekthet, precision och täckning
2. Ord:
- korpora och korpusannotering
- finite-state-metoder för segmentering och morfologisk analys
- statistisk språkmodellering med n-gram markovmodeller
3. Syntax:
- ordklasstaggning och chunkning/partiell parsning, med användande av maskininlärning och/eller finite-state-metoder
- vanliga grammatikformalismer, särskilt kontextfria, särdrags- och probabilistiska grammatiker
- syntaktiska parsningsalgoritmer
4.Semantik och pragmatik:
- lexikal semantik, inkluderande lexika, Wordnet och FrameNet
- ordbetydelsedisambiguering med maskininlärning
- textklassificering med maskininlärning
Behörigheter och urval
Förkunskapskrav
För tillträde till kursen krävs kandidatexamen i något av följande:
datavetenskap,
datalingvistik eller språkteknologi,
lingvistik (inklusive motsvarande 30 hp formell lingvistik eller programmering),
angränsande ämne, tex kognitionsvetenskap, språk, filosofi eller matematik, inklusive motsvarande 30 hp formell lingvistik eller programmering
eller motsvarande efter bedömning.
Godkända kunskaper i engelska motsvarande gymnasiekursen Engelska 5/Engelska A.
Så är det att plugga
Lokaler
Undervisningen sker i lektionssalar på Humanisten och i våra datorlabb på plan 2.