TigerSearchi praktikum

* Avage TigerSearch
* Tutvuge olemasolevate testkorpustega (DemoCorpora)
  + Mitmest erinevast keelest on näidiskorpused olemas? Vaadake erinevaid
lausepuid (topeltklõps korpuse avamiseks, ikoon Explore Corpus üleval).
Kui erinev on puude sügavus, märgendisüsteemi täpsus eri keeltel? Kuidas
eri märgendisüsteemid on lahendanud kordinatsiooni?
  + Võrrelge ingliskeelseid korpuseid - mida need korpused endast
kujutavad, milliseid märgendisüsteeme need kasutavad, miks just
selliseid.
  + Võtke lahti otsinguaken (TigerSearch) - see suur aken, mis teil
paremal on. Võite kasutada nii graafilist kui tekstilist välja. Juhendi
leiate manuaalist ("Help" alt).
  + Otsige Browni ja keskaja inglise keele korpusest sama tüüpi fraase
     Näiteks: omadussõnafraas, millel oleks vähemalt 3 terminali.
     #n1:[cat="ADJP" | cat="ADJP"] &
     tokenarity(#n1, 3, 25)
     NB! Mõttekas on otsisõne tekstikujul endale kuhugi kopeerida, et ei
tuleks iga kord uuuesti kirjutada/joonistada. Graafiliselt kujult
teksti saamiseks vajutage ikooni "Switch to Textual Mode".
     Proovige ikooni "Focus on match"

* Joonistage lausele "Mehed on erinevad ja täidavad eri rolle." sõltuvuspuu
(alternatiiv: est-21: "Anekdoodid , mida Arnoldist räägitakse , meenutavad
tšuktši nalju ")
* Avage Arboresti XML fail - nii on võimalik teksti kujul puid esitada.
Vaadake, kas suudate sealt eelmise lause (est-10) puu rekonstrueerida.
* Avage programm TigerRegistry, laadige endale Arboresti korpus.
  Corpus -> Insert corpus
  Valida Tiger-XML format, anda talle Corpus ID all nimi, leida TIGER-XML
file juures õige fail.
* TigerRegistry võib kinni panna, avage TigerSearch.
* Vaadake Arborestile otsa, kas saate aru, kuidas puud märgendatud on? Kas
leiate vigaselt märgendatud puid?
Vaadake näiteks puid, mis ei ole täislaused.
#n1:[NT] > [cat!="fcl"] &
root(#n1)
* Otsige Arborestis lauseid, kus verbi objekt eelneb subjektile. Kui mitu
neist tegelikult õiged on?
#n1:[NT] >S #n3:[NT] &
#n1 >O #n2:[NT] &
#n2 .* #n3

Link arboresti korpusele: http://vvv.cs.ut.ee/~kaili/Korpus/puud/


Käsuread:

runTIGERSearch

TIGERRegistry