Statistik: Analys av textdata
Data är inte bara siffror utan mycket information finns i form av text. Idag finns det enorma mängder text tillgänglig i digital form.
Kursen ger en introduktion till statistisk analys av text. Du kommer att studera både metoder som bygger på både klassiska statistiska ansatser (inklusive Bayesianska modeller) och moderna ansatser som djupinlärning (recurrent neural networks). Ämnen som behandlas är bl.a.
- Olika sätt att representera text så att informationen går att analysera på ett statistiskt vis
- Tekniker för att klassificera texter
- Klusteranalys av textdata
- Tekniker för att identifiera olika ämnen/teman som förekommer i texter (ämnesmodellering)
- Tekniker för att identifiera känslor eller sinnesstämningar (attitydanalys)
- Metoder för textsammanfattning.
Kommande starter
Förkunskaper
Lunds universitet
Lunds universitet har sin naturliga plats bland Europas främsta lärosäten. Som Skandinaviens största enhet för högre utbildning och forskning bedriver universitetet idag verksamhet inom ett brett spektrum av ämnen. På Lunds universitet arbetar cirka 6 800 personer – lärare, forskare, administrativ...