Praktisk grundläggande språkteknologi
Kursen ger en praktisk introduktion till olika problem inom språkteknologiområdet, samt några vanliga lösningar. Studenterna kommer att få praktisk programmeringerfarenhet genom att undersöka dessa tillämpningar. Kursen är uppdelad i fyra huvuddelar: en som täcker grundläggande begrepp och tre som tänker delområden inom språkteknologin: grundläggande textbehandling, syntaktisk och morfologisk analys, samt semantik och pragmatik.
Det definitiva urvalet av ämnen som täcks i de fyra delområdena bestäms av den kursansvarige innan kursen startar.
Det följande är ett exempel på ämnen som kan genomgås under kursen:
1. Grundläggande begrepp:
- grundläggande begrepp inom språkteknologin,
- sannolikhetsteori och maskininlärning för språkteknologiska problem,
- vanliga utvärderingsmått, t.ex. korrekthet, precision och täckning.
2. Grundläggande textbehandling:
- korpusar och korpusannotering,
- grundläggande statistisk korpusanalys.
3. Syntax och morfologi:
- morfologisk analys (ordklassanalys) med hjälp av maskininlärning och finite-state teknologi,
- syntaktisk analys med hjälp av regelbaserade och datadrivna metoder.
4. Semantik och pragmatik:
- ordbetydelsedisambiguering med hjälp av maskininlärning,
- textklassificering
- eller topic modeling med hjälp av maskininlärning.
Kommande starter
Förkunskaper
Göteborgs universitet möter samhällets utmaningar med mångsidig kunskap. 37 000 studenter och 6 000 medarbetare gör universitetet till en stor och inspirerande arbetsplats, flödande av kunskap och idéer. Öppenheten är ett signum som genomsyrar verksamheten. Universitetet tar plats i debatten...