Kompiuterinė lingvistika

Straipsnis iš Vikipedijos, laisvosios enciklopedijos.

Kompiuterinė lingvistika – taikomosios kalbotyros šaka, nukreipta į natūralios kalbos apdorojimą ir analizę įvairiomis kompiuterinėmis technologijomis. Kompiuterinė lingvistika glaudžiai susijusi su dirbtinio intelekto, pažinimo – kognityviniais mokslais. Pagrindinės kryptys: hiperteksto ir informacijos paieškos sistemos, automatinis (mašininis) vertimas, kompiuterinė leksikografija, šnekos atpažinimas ir sintezė, dokumentų vadyba (plagiato vadyba, automatinių santraukų sudarymas, autorystės nustatymas ir kt.).

Istorija[redaguoti | redaguoti vikitekstą]

Kaip savarankiškas mokslas kompiuterinė lingvistika pradėjo formuotis XX a. 7-ame dešimtmetyje. Jos istorija tiesiogiai susijusi su kompiuterinių technologijų raida: nuo 1946 m Pensilvanijos universitete sukurto ENIAC'o, lempinės pirmosios kartos skaičiavimo mašinos, svėrusios 30 tonų ir užimančios 150 m salę, vėliau, puslaidininkinių, mašinų su mikroschemomis, pagaliau - ketvirtosios kartos optinių skaičiavimo sistemų, iki šių dienų naujausių skaitmeninių įrenginių. Kompiuterinės lingvistikos teorija vystėsi ant matematinės lingvistikos, kalbotyros (ypač generatyvizmo), informacijos teorijos pagrindų. D. Hays (jis laikomas kompiuterinės lingvistikos termino autoriumi), R.Kay, J. R. Searle, R. Grishman - žymiausi kompiuterinės lingvistikos mokslo pradininkai, o tikruoju pionieriumi laikytinas italas Roberto Busa, kuris 1946 m IBM kompanijai pasiūlė kompiuteriu išanalizuoti Tomo Akviniečio tekstus, taip pirmą kartą buvo pradėti klasifikuoti žodžiai, o ne skaičiai.

Šiuo metu didžiausia mokslinė kompiuterinės lingvistikos organizacija – Kompiuterinės lingvistikos asociacija – kas dveji metai organizuoja didžiules tarptautines konferencijas – COLING Archyvuota kopija 2012-07-03 iš Wayback Machine projekto.. JAV leidžiamas mokslinis žurnalas „Computational linguistics“.

Studijos[redaguoti | redaguoti vikitekstą]

Lietuvoje kompiuterinės lingvistikos bakalauro studijų programa nuo 2006 metų vykdoma KTU Humanitarinių mokslų fakultete Archyvuota kopija 2012-05-31 iš Wayback Machine projekto.. Studijos yra tarpdalykinės, derinančios kalbotyros ir informatikos mokslus. Nuosekliai ir universitetiniu lygmeniu studijuojama lietuvių kalbos sistema, įgyjama daug anglų kalbos žinių, kurios reikalingos norint kurti gramatikos kategorijų, sintaksinių konstrukcijų, leksemų modelius, sudarant kompiuterinius žodynus. Studentai susipažįsta ir įgyja praktinio darbo su įvairiomis kalbos ir šnekos technologijomis – tekstynais, šnekos sintezatoriais, vertimo atmintimis, programine įranga, reikalinga darbui leidybos, dokumentų, teksto ir hiperteksto tvarkybos, reklamos, automatinio vertimo ir kitose, su natūralia kalba susijusiose srityse.

Studijų programoje dirba daug dėstytojų iš Kalbotyros, Valdymo technologijų, Kompiuterinių tinklų katedrų ir kitų padalinių. Studentai turi galimybę pagal Erasmus mainų programą vieną semestrą studijuoti tarptautinėje, anglų kalba vykdomoje Kompiuterinės lingvistikos programoje Tiubingeno universitete.

KTU leidžiamame žurnale „Kalbų studijos Archyvuota kopija 2012-11-10 iš Wayback Machine projekto.“ skirtas atskiras skyrius straipsniams, nagrinėjantiems įvairius kalbų technologijų panaudojimo analizuojant ar mokant kalbų aspektus.

Nuorodos[redaguoti | redaguoti vikitekstą]