Tänase loengu ja praktikumi teema on peidetud Markovi mudel.
Lugege läbi E. Charniaki artiklist . Statistical techniques for natural language parsing AI Magazine. (1997) esimesed 2 peatükki (teisi võib ka lugeda).
Parem allikas oleks Manning, Shütze, Foundations of Statistical Natural Language Processing, ch 9. (saab raamatukogust).
Võtke ette Harri Kiriku tehtud programm, püüdke mõista, mida see teeb,
pange käima ja mõõtke tulemusi.
Vaadake, mis vahe on lihtsal valideerimisel ja ristvalideerimisel.
Koostage parima märgendaja segaduste maatriks (confusion matrix) Vt linki ning leidke, milline märgend oli õige kergemini tuvastatav ning mis põhjustas massiliselt vigu. Saatke tabel koos analüüsiga mulle.