TigerSearchi praktikum * Avage TigerSearch * Tutvuge olemasolevate testkorpustega (DemoCorpora) + Mitmest erinevast keelest on näidiskorpused olemas? Vaadake erinevaid lausepuid (topeltklõps korpuse avamiseks, ikoon Explore Corpus üleval). Kui erinev on puude sügavus, märgendisüsteemi täpsus eri keeltel? Kuidas eri märgendisüsteemid on lahendanud kordinatsiooni? + Võrrelge ingliskeelseid korpuseid - mida need korpused endast kujutavad, milliseid märgendisüsteeme need kasutavad, miks just selliseid. + Võtke lahti otsinguaken (TigerSearch) - see suur aken, mis teil paremal on. Võite kasutada nii graafilist kui tekstilist välja. Juhendi leiate manuaalist ("Help" alt). + Otsige Browni ja keskaja inglise keele korpusest sama tüüpi fraase Näiteks: omadussõnafraas, millel oleks vähemalt 3 terminali. #n1:[cat="ADJP" | cat="ADJP"] & tokenarity(#n1, 3, 25) NB! Mõttekas on otsisõne tekstikujul endale kuhugi kopeerida, et ei tuleks iga kord uuuesti kirjutada/joonistada. Graafiliselt kujult teksti saamiseks vajutage ikooni "Switch to Textual Mode". Proovige ikooni "Focus on match" * Joonistage lausele "Mehed on erinevad ja täidavad eri rolle." sõltuvuspuu (alternatiiv: est-21: "Anekdoodid , mida Arnoldist räägitakse , meenutavad tšuktši nalju ") * Avage Arboresti XML fail - nii on võimalik teksti kujul puid esitada. Vaadake, kas suudate sealt eelmise lause (est-10) puu rekonstrueerida. * Avage programm TigerRegistry, laadige endale Arboresti korpus. Corpus -> Insert corpus Valida Tiger-XML format, anda talle Corpus ID all nimi, leida TIGER-XML file juures õige fail. * TigerRegistry võib kinni panna, avage TigerSearch. * Vaadake Arborestile otsa, kas saate aru, kuidas puud märgendatud on? Kas leiate vigaselt märgendatud puid? Vaadake näiteks puid, mis ei ole täislaused. #n1:[NT] > [cat!="fcl"] & root(#n1) * Otsige Arborestis lauseid, kus verbi objekt eelneb subjektile. Kui mitu neist tegelikult õiged on? #n1:[NT] >S #n3:[NT] & #n1 >O #n2:[NT] & #n2 .* #n3
Link arboresti korpusele: http://vvv.cs.ut.ee/~kaili/Korpus/puud/
Käsuread:
runTIGERSearch
TIGERRegistry