LINGO grammar matrix
1. praktikum 27.03.2008
Need praktikumid on kavandatud Washingtoni ülikooli kursuse Linguistics 567: Knowledge Engineering for NLP (Emily M. Bender) baasil.
ssh antarctica.mt.ut.ee
1. bashi keskkonnamuutuja
lisage kodukataloogi faili .bashrc rida
export DELPHINHOME=/usr/local/delphin
2. emacsi keskkond
lisage kodukataloogi faili .emacs rida
(let ((root (getenv "DELPHINHOME"))) (if (file-exists-p (format "%s/lkb/etc/dot.emacs" root)) (load (format "%s/lkb/etc/dot.emacs" root) nil t t)))
(let ((root (or (getenv "DELPHINHOME") "/home/oe/delphin"))) (if (file-exists-p (format "%s/lkb/etc/dot.emacs" root)) (load (format "%s/lkb/etc/dot.emacs" root) nil t t)))
Tehke alamkataloog grammatika hoidmiseks
Laadige alla mängugrammatika, mida vaatasime loengus.
Käivitage käsurealt emacs: emacs
Andke käsk: Alt-x lkb
Avanema peaks lkb aken.
Laadige grammatika: starter-grammar/script
Vaadake parse input menüüst lauseid the dog barks, the dog chased the cat.
Vaadake faile types.tdl, rules.tdl, lexicon.tdl, labels.tdl
Mängugrammatika kirjutamine
Muudke faili labels.tdl nii, et puusse tekiksid korrektsed fraasisümbolid
Selleks:
1. Failis globals.lsp muudke rida
(defparameter *simple-tree-display* t)
reaks
(defparameter *simple-tree-display* nil)
See annab süsteemile teada, et tahate kasutada oma tipumärgendeid.
2. Lisage faili labels.tdl märgendite definitsioonid. Näiteks NP on:
np-label := label & [ HEAD noun, SPR < >, COMPS < >, LABEL-NAME "NP" ].
Arvestada tuleb seda, et süsteem katsub kohandada märgendeid nende esinemise järjekorras, seepärast võiks üldisemad märgendid olla tagapool.
Vaja on märgendeid sõna tasandil det, noun, verb, prep jaoks, fraasi tasandil np, vp, pp, ja lause jaoks s.
3. Lisage leksikoni uusi sõnu. John gave the bone to the dog.
Näiteks püüdke leida lause Kaili adores snow in Tartu analüüsid. (Kasutage oma nime parem.)
Selleks tuleb tähele panna, et a) nime ees ei või kasutada artiklit;
tuleb kirjutada reegel, mis sõna tasandil nounist teeb fraasi.
Pange reeglile nimi ja kirjutage reegel, kus fraasil on ainult 1 argument, argumendil ja fraasil peab määratleja väärtus olema tühi list ja muud omadused on samad. Argumendi tüübiks on word, fraasil phrase.