Tartu
Ülikool, eesti ja soome-ugri keeleteaduse osakond, arvutuslingvistika
Siiani eesti keele jaoks loodud programmid on mõeldud proosa
analüüsimiseks, mistõttu nad ei arvesta luulekeele eripärasid (näiteks
ebaharilik sõnajärg, tavatud grammatilised struktuurid ja vormid jms). Minu
arvates pole poeetikas üldse oluline, mitu verbi luuletuses on (v.a
sõnavarastatistika) või kas need on sihilised või mitte, vaid see, millise
tähendus- või stiilivarjundiga verbe autor tarvitab ning mil viisil ta seda
teeb.
Keeletöötlusprogrammide abil luulet analüüsides on näha, et programmid
teevad luule puhul palju vigu. Selle põhjuseks on taas keeletöötlusvahendite
proosakesksus. Tavalise kirjakeelse teksti puhul on võimalik, et arvuti teeb
ära kogu töö, näiteks analüüsib ja ühestab teksti nii morfoloogiliselt kui süntaktiliselt.
Luule puhul oleks seda aga ka ülimalt täpsete reeglite olemasolul väga
keeruline teha. Esiteks oleks tarvis spetsiaalselt luule eripärasid arvestavaid
programme, teiseks on seda raske teha luulekeele mitmekihilisuse tõttu. Samuti
on oluline see, et tavalise argiteksti puhul on ühestaja eesmärgiks tuua välja
sõna või fraasi üks ja ainus tõlgendus, luule puhul on see aga mõttetu –
mitmesused mängivad luules sageli väga suurt tähenduslikku rolli.
Siiski ei saa öelda, et keeletöötlusvahendeist luule analüüsimisel üldse
kasu poleks. Vastupidi – just tänu nimetatud miinustele avanevad
keeletöötlusprogrammide kasutamisel luuleanalüüsis uued võimalused. Suureks
plussiks ongi just arvuti maailmateadmuse puudumine – arvuti paneb tähele
nüansse, mis inimestel sama maailmateadmuse olemasolu tõttu märkamata võivad
jääda. Seega on keeletöötlusprogrammid luuleanalüüsil kasutatavad eelkõige
abivahendina, kuna luule puhul pole oluline niivõrd grammatiline tõlgendus, kuivõrd
just see, milliseid emotsioone ta loob.
L4:
[kus
kasteheinas põlvini me, lapsed,] jooksime
jooksime
jooks+ime //_V_ main indic impf ps1 pl ps
af #FinV // @+FMV
joo+ksime //_V_ main cond pres ps1 pl ps
af #FinV // @+FMV,
mille
esimene tähendus on meile tuttav jooksime
– mitmuse esimese pöörde lihtminevik sõnast jooksma.
Teiseks tähenduseks on aga tingiva kõneviisi tulevik sõnast jooma, mis enamikul lugejaist jääb
märkamata just kontekstitingimustega arvestamise ning maailmateadmuse olemasolu
tõttu. Teise tähenduse üheks mittemärkamise põhjuseks on kindlasti ka Lydia
Koidula kui autori isiksus – mõne kaasaegse popluuletaja puhul oleks jooksime verbi jooma vormiks tõlgendamine võibolla mõeldav. Tegemist on
mitmesusega, mis tuleks lahendada morfoloogilise ühestamise etapis. Mitmesus on
aga alles jäänud semantilise ja pragmaatilise info puudumise tõttu. Kui
süntaktiline ühestaja väljastaks vaid süntaktilisi märgendeid ning jätaks välja
toomata morfoloogilise informatsiooni, mille põhjal süntaktiline väljund on
saadud, saaks sõna jooksime siin
märgendi @+FMV ning mitmesust ei esineks.
L9:
lahke
[meelega mine karjalaps karja]
lahke+0 //_A_ pos sg gen // **CLB @AN>
lahke+0 //_A_ pos sg nom // **CLB @ADVL
lahk+e //_S_ com pl part // **CLB
@OBJ
[lahke]
meelega [mine karjalaps karja]
meelega+0 //_D_ // @ADVL
meel+ga //_S_ com sg kom //
@ADVL @<NN
L7:
[mõlemast]
otsast [sõlmitud elulõng]
otsast+0 //_D_ // @ADVL
ots+st //_S_ com sg el //
@ADVL @<NN
Eesti keele jaoks olemasolevaist keeletöötlusprogrammidest valiti luule
analüüsiks ESTKG. Hoolimata sellest, et tegu on nn tavatekstide uurimiseks
mõeldud programmiga, on see täiesti rakendatav ka luule analüüsimisel, kuigi
tulemused ei ole nii head kui tavatekstide puhul. Luuleanalüüsil annab programm
väljundiks rohkem mitmesusi ning ühestamata vorme, kuna arvutil puudub
kontekstitunnetus.
Kokkuvõtteks võib nentida, et arvuti ei saa ilmselt kunagi luule
analüüsimisel täielikult asendama inimest, kuid kahtlemata võivad keeletöötlusprogrammid luuleuurijaile
suureks abiks olla, sest nad annavad võimaluse mõista luulet sootuks teise
nurga alt.