Eesti Keele Instituut testis tehisintellekti: Gemini sai sõnade tähenduste hindamisel 89%

Eesti Keele Instituudi katse näitas, et suured keelemudelid suudavad enamasti eristada sõnade neutraalset, kõnekeelset ja halvustavat kasutust. Parimaks osutus Google'i Gemini, mille hinnangud oleksid sobinud sõnaraamatusse ligi 89 protsendil juhtudest. Tulemusi tutvustas Lydia Risberg.

2026-06-01T05:25:45.507Z Технологии

Eesti Keele Instituut viis läbi katse, et selgitada, kui hästi suudavad suured keelemudelid eristada sõnade erinevaid kasutusviise — neutraalset, kõnekeelset ja halvustavat. Tulemused osutusid üllatavalt paljutõotavateks.

Edukaimaks keelemudeliks osutus Gemini, mille hinnangud oleksid sobinud sõnaraamatutes kasutamiseks ligikaudu 89 protsendil juhtudest. See näitab, et tehisintellekt suudab teatud keelelisi nüansse tuvastada märkimisväärse täpsusega. Tulemusi tutvustas Eesti Keele Instituudi töötaja Lydia Risberg instituudi keelesäutsude sarjas.

Katse tulemused on olulised eelkõige leksikograafia seisukohalt — keeleteadlased ja sõnaraamatute koostajad otsivad üha enam võimalusi, kuidas tehisintellekti töövahendeid keelekirjelduse toetamiseks kasutada. Kui keelemudelid suudavad usaldusväärselt eristada sõna kasutusregistrit, võib see kiirendada leksikaalsete andmebaaside koostamist ja uuendamist.

Samas tuleb arvestada, et isegi 89-protsendine täpsus tähendab, et iga kümnes hinnang võib olla ekslik — mis seab piirid sellele, mil määral saab tehisintellektile keeleteaduslikes otsustes täielikult toetuda. Eesti keele eripärad ja väiksem treeningandmestik võrreldes suurte maailmakeeltega on jätkuvalt väljakutse kõigile keelemudelitele.

Открыть в приложении →