Itzultzaile automatikoak ohiko tresna bihurtu zaizkigu, bai ondo ezagutzen ez ditugun hizkuntzak ulertzen laguntzeko, baina baita ere hobeto dakizkigun hizkuntzen arteko itzulpen lanaren zama arintzeko. Ezagunak dira itzultzaile automatikoek egin ohi dituzten hanka sartu xelebreak, partidu politiko eta denda-kate ospetsuek argitara eman izan dituztenak. Probatu “Trenes mañana y tarde” Eusko Jaurlaritzaren itzultzailean eta hor azaltzen da aspalditik bagenekiena: “Trenak bihar eta berandu”. Tira, halako itzulpen aldrebesak egon izan dira gure inguruan itzulpen automatikoa baina lehenago, baina nahiz eta tresna hauen erabilgarritasuna zalantzan ez jarri, bistan uzten dituzte gaur egungo teknologiaren gabeziak.

Nola egin aurre gabezi horiei? Orain arteko itzulpen teknologia hitzen kontaketa eta probabilitate estimazioetan oinarritu izan da: itzulpen memoriatan egin izan diren itzulpenak aztertu, hitzak nola itzuli izan diren zenbatu, eta testu berri bat itzultzean kontaketa horiek erabili itzulpen probableena sortzeko. Horrela esanda, ez da harritzekoa metodo horiek zailtasunak izatea egitura sintaktikoak (Me lo han dado a mi) edo hitz polisemikoak (tarde)  itzultzeko orduan.

Ikerlari askok uste izan dugu itzulpenen kalitatea hobetzeko bidea testuen egitura sintaktiko eta semantikoa automatikoki atzemateko tekniketatik etorriko zela, baina aldaketa espero ez zen bidetik etorri da. Ikusita sare neuronalek (bereziki ikasketa sakona edo “deep learning” deritzatenek) irudien prozesamenduan eta giza-ahotsaren ezagutzan izan duten arrakasta, ikerlari batzuek horiek aplikatu dituzte itzulpenera. Labur esatearren, metodo berri hauek hitzen esanahia bektoreen bitartez errepresentatzen dute eta egitura sintaktikoa matrizeen biderketa bidez, orain arteko teknologiaren mugak gaindituz.  Denbora gutxian garapen izugarria izan dute, eta egun Google, Microsoft eta Systran enpresek teknologia hau darabilte itzulpenak sortzeko, aurreko 20 urtetan garatutako teknologia alde batera utziaz. Gainera, itzultzaile hauek gai dira esaldien errepresentazioak eraikitzeko, eta horrek ahalbideratu du harreman gutxiago duten hizkuntzen arteko itzultzaileen garapena erraztea (eta hau ez da kontu makala, 100 hizkuntzen artean itzultzeko 10000 itzultzaile ezberdin behar baitira).

Berriki egindako azterketa independente batek erakutsi du ikasketa sakonari esker lexikoan, morfologian, eta hitzen hurrenkeran egin izan diren erroreak %20 inguru gutxitu direla. Hala ere, azterketa berdinak azaleratu du fenomeno sintaktiko eta semantiko ugari oraindik ondo itzuli gabe gelditzen direla – egitura linguistiko aberatsagoak behar direnaren seinale, beharbada. Finean, itzultzaile automatikoak hobetu dira bai, baina makinek gure mundua ulertzen ez duten bitartean beraientzat tren batzuk bihar eta berandu etortzen jarraituko dute.

Esteka interesgarriak

http://aldizkaria.elhuyar.eus/analisiak/itzulpen-automatikoaren-magia-eta-mugak/

https://blog.google/products/translate/found-translation-more-accurate-fluent-sentences-google-translate/https://www.wired.com/2016/12/2016-year-deep-learning-took-internet/

https://www.cnet.com/news/microsoft-translation-app-group-conversation-ai/

https://globenewswire.com/news-release/2016/12/20/899331/0/en/SYSTRAN-Pure-Neural-Machine-Translation-first-positive-customer-feedback-Applications-available-early-2017.html

https://devblogs.nvidia.com/parallelforall/introduction-neural-machine-translation-with-gpus/

 

Share on FacebookTweet about this on TwitterShare on LinkedIn
Aurreko bidalketa

SEO euskaraz .eus domeinuetarako weba bilaketa optimizazioa. Aurreko kontzeptuak

Hurrengo bidalketa

Teknologia, behar handiena dutenentzat

Egilea

Eneko Agirre

Eneko Agirre

@eagirre
Eneko Agirre EHUko Informatika fakultateko irakasle-ikerlaria da. Hizkuntzaren prozesamenduaren arloan ikertzen du, IXA taldearen baitan.

Iñaki Alegria

Iñaki Alegria

@inakialegria
Iñaki Alegria EHUko Informatika fakultateko irakasle-ikerlaria da. Hizkuntzaren prozesamenduaren arloan ikertzen du, IXA taldearen baitan. UEUko zuzendaria da momentu honetan.

Iruzkinik ez

Utzi erantzun bat

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude