Aurreko post batean aipatu izan genuen sare neuronalen eta ikasketa sakonaren bitartez  itzulpen automatikoan aurrerapen handiak gertatzen ari direla. Hobekuntza itzulpenaren naturaltasunean nabarmentzen da, batez ere, irakurtzeko eta ulertzeko errazagoak diren testuak lortzen bait dira. Bestalde,  arazo batzuk agertzen dira fidagarritasunaren aldetik. Adibidez, itzuli gabeko hutsuneak gertatzen dira eta batzuetan itzulitakoak ez du islatzen jatorriaren esanahia, batez ere hainbat adjektibo eta zenbakiekin.

Google translate itzultzaile automatiko ezagunena teknologia horretara egokitzen ari bada ere, lehiakide interesgarri bat sortu zaio  deepl.com. Europan sortutako proiektua da eta, aipatutako teknologiaz gain, bi indargune garrantzitsu ditu: urtetan zehar bildutako itzulpen-memoriak (enpresa berak kudeatzen duen  linguee.com gunea horren lekuko da) eta superkonputagailuen erabilera (batez ere Eskandinavian ezarritako azpiegitura). Gaztelaniatik edo frantsesetik ingelesera zerbait itzuli behar baduzu, probatu eta harrituta geratuko zara. Hizkuntza-bikoteetan mugatuagoa da google baino, eta zoritxarrez euskara ez dago tratatzen dituen hizkuntzen artean.

Euskal Herrian ere arlo horretan ikertzen ari gara euskararako, eta lehen emaitza ikusgarriak kontsulta daitezke Modela proiektuari esker. Hainbat erakunderen artean burututako proiektua da (ISEA, Ametzagaiña, Vicomtech, Elhuyar eta UPV/EHUko IXA taldea) eta demo moduan erabilgarri dago (laster zerbitzu moduan merkaturatuko da).

Probak egin daitezkeenez ikus dezagun adibide bat. Irailaren 7an Berria-tik hartutako paragrafo bat itzuliko dugu gaztelaniara:

Uda beltza izaten ari da aurtengoa laneko istripuei dagokienez. Oraindik ez da amaitu, eta beste hildako bat gehitu behar zaio zerrenda ilun horri, gaur goizean beste langile bat hil baita, Trapagarango (Bizkaia) Salcedillo industrialdean, Cable Recycling Industries enpresan, albiste agentziek jakinarazi dutenez.

–>

Este año está siendo un verano negro en los accidentes laborales. A esta oscura lista se suma la muerte de otro trabajador, que ha fallecido esta mañana en la empresa Cable Recycling Industries de Trapagaran (Bizkaia), según informan las agencias de noticias.

Aurreko belaunaldiko tresna batez itzultzean (EJren zerbitzuan dagoena) emaitza hau da:

El verano negro está siendo de este año en cuanto a los accidentes laborales. Todavía no se ha terminado, y otro muerto se le tiene que añadir a esa lista oscura, hoy por la mañana otro trabajador muerto incluso, de Valle de Trápaga (Bizkaia) Salcedillo en el polígono industrial, Cable Recycling Industries en la empresa, como las agencias de noticia han hecho saber.

 

Sortutako prototipoan hobekuntzak behar dituen arren, argi dago aurrerapen handia dela hizkuntzaren naturaltasunaren aldetik.

Sistema hauen guztien muga garrantzitsu bat domeinu-egokitzapena deitzen dena da. Gerta daiteke ondo ibiltzea testu mota batzuekin baina beste mota batzuekin ez horrenbeste. Zer gertatuko litzateke medikuntzari buruzko testu batekin? Gune espezializatu batetik testu bat hartu eta hauek dira emaitzak Modela erabiliz:

64 urteko gizona, ospitaleko larrialdi zerbitzura doa azken egunetan sukarra eta ahulezia zuelako. Pazientearen aurrekari garrantzitsuenak ondokoak ziren: kimioterapia eta erradioterapiarekin tratatutako kolangio kartzinoma eta lau jejuno-duodenoetako anastomosi duodenoko ultzerak zirela-eta.

–>

El hombre, de 64 años, se encuentra al servicio de urgencias del hospital por su fiebre y debilidad en los últimos días. Los antecedentes más importantes del paciente eran los siguientes: colangio cartzinoma tratado con quimioterapia y radioterapia, con las úlceras de la anastomosis duodenal de los cuatro duodes jejones.

Kontuan izanik jatorrizko testuaren izaera espezifikoa, eta Modela itzultzailea ez dela entrenatu medikuntzan aritzeko, itzulpena espero baino hobea da: irakurgarria eta ulergarria. Domeinu berrietara nola egokitu aztertzen ari gara ikerlerro honetan.

Euskararako lortu den kalitate-maila honekin, lehen aldiz gure ustetan, aplikazio errealetarako atea irekitzen da; itzultzaileen produktibitatea handitzeko batetik, eta euskaraz bizi nahi duten erakunde, enpresa edo taldeentzat bestetik.  Bigarren aukera hau askoz gutxiago aipatu izan da itzulpen automatikoari buruz hitz egiten dugunean, baina bere momentua izan daiteke. Pentsa dezagun enpresa batean pertsona gehienak euskaldunak direla baina badaudela gutxi batzuk euskaraz nekez moldatzen direnak. Dokumentu garrantzitsuenak bi hizkuntzetan mantenduta ere eguneroko komunikazioa, e-posta adibidez, euskaraz egin liteke pertsona horiei itzulpen-zerbitzu automatikoa haien aplikazioetan integratuz. Edo euskara hutsez argitaratzen den blog batek irakurle/babesle gehiago lor lezake zerbitzu hori eskainiz eta inguruko erdaldunei edukien nondik norakoak hurbilduz. Beti ere garbi utziz itzultzaile automatiko batek sortu duela itzulpen hori, noski.

Ez dakigu orain izango den momentua, baina halakoak laister ikusiko ditugulakoan gaude.

 

Aurreko bidalketa

Marka edo profesionalen monitorizazioaren garrantzia. Badakizu zer esaten den zuri buruz?

Hurrengo bidalketa

Titiak desagertu zirenekoa

Egilea

Iñaki Alegria

Iñaki Alegria

@inakialegria
Iñaki Alegria EHUko Informatika fakultateko irakasle-ikerlaria da. Hizkuntzaren prozesamenduaren arloan ikertzen du, IXA taldearen baitan. UEUko zuzendaria da momentu honetan.

Eneko Agirre

Eneko Agirre

@eagirre
Eneko Agirre EHUko Informatika fakultateko irakasle-ikerlaria da. Hizkuntzaren prozesamenduaren arloan ikertzen du, IXA taldearen baitan.

Iruzkinik ez

Utzi erantzun bat

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude