lausandmetöötlus
Lausandmetöötlus on tehisintellekti valdkond, mis tegeleb inimkeele automaatse analüüsimise ja mõistmisega arvuti abil. Tegemist on tehnoloogiaga, mis võimaldab masinatel teksti lugeda, tõlkida, tuvastada tähendusi ja luua uut keelelist sisu.
Lausandmetöötlus ehk natural language processing (NLP) on tehisintellekti ja arvutilingvistika valdkond, mis keskendub inimkeele automaatsele töötlemisele arvutite poolt. See hõlmab meetodeid ja algoritme, mis võimaldavad masinatel mõista, tõlgendada ja genereerida loomulikku keelt nii kõne- kui tekstikujul. Lausandmetöötluse peamised ülesanded hõlmavad teksti analüüsi, tähenduse eraldamist, masintõlget, teksti kokkuvõtete loomist, emotsioonide tuvastamist tekstis, küsimustele vastamist ja keele genereerimist. Kaasaegsed süsteemid kasutavad masinõpet ja sügavõpet, eriti suurte keelemudelite (nagu GPT, BERT) kaudu, mis on treenitud tohututel tekstiandmestikkel. Eesti keele puhul on lausandmetöötlus eriti oluline, kuna eesti keel on väikekeel, mille jaoks tuleb spetsiaalseid tööriistu ja mudeleid arendada. Lausandmetöötlust kasutatakse igapäevaselt paljudes rakendustes: otsingumootorites, vestlusrobotites (chatbot'id), tõlkeprogrammides, õigekirjakontrollides, häälabilistes ja tekstiloomise tööriistades. See valdkond on tehnoloogia arengus kesksel kohal ja võimaldab inimestel suhelda masinatega loomulikus keeles.
Etümoloogia
Eestikeelne termin, mis koosneb sõnadest 'laus' (keeleline väljend) ja 'andmetöötlus' (andmete automaatne töötlemine). Ingliskeelne vaste natural language processing.
Kasutusnäited
Kaasaegsed vestlusrobotid kasutavad lausandmetöötlust, et mõista kasutajate küsimusi ja anda asjakohaseid vastuseid.
Tartu Ülikooli teadlased arendavad eesti keelele spetsialiseeritud lausandmetöötluse tööriistu.
Lausandmetöötlus võimaldab tõlkeprogrammidel automaatselt tekstide tähendust analüüsida ja neid teise keelde üle kanda.