Automaatne luuleanalüüs

Lilian Ariva

Tartu Ülikool, eesti ja soome-ugri keeleteaduse osakond, arvutuslingvistika

 

Siiani eesti keele jaoks loodud programmid on mõeldud proosa analüüsimiseks, mistõttu nad ei arvesta luulekeele eripärasid (näiteks ebaharilik sõnajärg, tavatud grammatilised struktuurid ja vormid jms). Minu arvates pole poeetikas üldse oluline, mitu verbi luuletuses on (v.a sõnavarastatistika) või kas need on sihilised või mitte, vaid see, millise tähendus- või stiilivarjundiga verbe autor tarvitab ning mil viisil ta seda teeb.

Keeletöötlusprogrammide abil luulet analüüsides on näha, et programmid teevad luule puhul palju vigu. Selle põhjuseks on taas keeletöötlusvahendite proosakesksus. Tavalise kirjakeelse teksti puhul on võimalik, et arvuti teeb ära kogu töö, näiteks analüüsib ja ühestab teksti nii morfoloogiliselt kui süntaktiliselt. Luule puhul oleks seda aga ka ülimalt täpsete reeglite olemasolul väga keeruline teha. Esiteks oleks tarvis spetsiaalselt luule eripärasid arvestavaid programme, teiseks on seda raske teha luulekeele mitmekihilisuse tõttu. Samuti on oluline see, et tavalise argiteksti puhul on ühestaja eesmärgiks tuua välja sõna või fraasi üks ja ainus tõlgendus, luule puhul on see aga mõttetu – mitmesused mängivad luules sageli väga suurt tähenduslikku rolli.

Siiski ei saa öelda, et keeletöötlusvahendeist luule analüüsimisel üldse kasu poleks. Vastupidi – just tänu nimetatud miinustele avanevad keeletöötlusprogrammide kasutamisel luuleanalüüsis uued võimalused. Suureks plussiks ongi just arvuti maailmateadmuse puudumine – arvuti paneb tähele nüansse, mis inimestel sama maailmateadmuse olemasolu tõttu märkamata võivad jääda. Seega on keeletöötlusprogrammid luuleanalüüsil kasutatavad eelkõige abivahendina, kuna luule puhul pole oluline niivõrd grammatiline tõlgendus, kuivõrd just see, milliseid emotsioone ta loob.

 

Näiteid

L4:

[kus kasteheinas põlvini me, lapsed,] jooksime

jooksime

    jooks+ime //_V_ main indic impf ps1 pl ps af  #FinV //  @+FMV

    joo+ksime //_V_ main cond pres ps1 pl ps af  #FinV //  @+FMV,

 

mille esimene tähendus on meile tuttav jooksime – mitmuse esimese pöörde lihtminevik sõnast jooksma. Teiseks tähenduseks on aga tingiva kõneviisi tulevik sõnast jooma, mis enamikul lugejaist jääb märkamata just kontekstitingimustega arvestamise ning maailmateadmuse olemasolu tõttu. Teise tähenduse üheks mittemärkamise põhjuseks on kindlasti ka Lydia Koidula kui autori isiksus – mõne kaasaegse popluuletaja puhul oleks jooksime verbi jooma vormiks tõlgendamine võibolla mõeldav. Tegemist on mitmesusega, mis tuleks lahendada morfoloogilise ühestamise etapis. Mitmesus on aga alles jäänud semantilise ja pragmaatilise info puudumise tõttu. Kui süntaktiline ühestaja väljastaks vaid süntaktilisi märgendeid ning jätaks välja toomata morfoloogilise informatsiooni, mille põhjal süntaktiline väljund on saadud, saaks sõna jooksime siin märgendi @+FMV ning mitmesust ei esineks.

L9:

lahke [meelega mine karjalaps karja]

    lahke+0 //_A_ pos sg gen // **CLB  @AN>

    lahke+0 //_A_ pos sg nom // **CLB  @ADVL

    lahk+e //_S_ com pl part  // **CLB  @OBJ

[lahke] meelega [mine karjalaps karja]

    meelega+0 //_D_ //  @ADVL

    meel+ga //_S_ com sg kom  //  @ADVL @<NN

L7:

[mõlemast] otsast [sõlmitud elulõng]

    otsast+0 //_D_ //  @ADVL

    ots+st //_S_ com sg el  //  @ADVL @<NN

 

Eesti keele jaoks olemasolevaist keeletöötlusprogrammidest valiti luule analüüsiks ESTKG. Hoolimata sellest, et tegu on nn tavatekstide uurimiseks mõeldud programmiga, on see täiesti rakendatav ka luule analüüsimisel, kuigi tulemused ei ole nii head kui tavatekstide puhul. Luuleanalüüsil annab programm väljundiks rohkem mitmesusi ning ühestamata vorme, kuna arvutil puudub kontekstitunnetus.

Kokkuvõtteks võib nentida, et arvuti ei saa ilmselt kunagi luule analüüsimisel täielikult asendama inimest, kuid kahtlemata võivad  keeletöötlusprogrammid luuleuurijaile suureks abiks olla, sest nad annavad võimaluse mõista luulet sootuks teise nurga alt.

 

 

Tagasi