Komunikazio eta eduki digitalak gero eta gehiago ikus-entzunezkoak diren eta ordenagailuekiko elkarrekintza gero eta gehiago hizketa bidez egiten dugun garaiotan, hizketa-ezagutzako teknologia gero eta garrantzitsuagoa bihurtzen ari da. Izan ere, teknologia hori da Youtube-ko bideoen azpititulu automatikoak sortzen dituena eta Alexa bezalako bozgorailu adimendunek esaten dieguna ulertzea ahalbidetzen duena. Aipatutako adibide horietako batek ere ez du euskaraz funtzionatzen. Baina behintzat aurrerantzean bideo bat azpititulatu nahi duen sortzaile euskaldunak edo euskarazko hizketa bidezko interakziodun gailu bat egin nahi duen enpresak badu nora jo. Izan ere, Elhuyar Fundazioan abian jarri dugu Aditu.eus, hizketa-ezagutzako teknologia baliatuz ikus-entzunezkoak azpititulatzeko edota mikrofonoari esaten dioguna zuzenean transkribatzeko online zerbitzua, euskaraz dakiena.

 

Aditu.eus, euskarazko hizketa-ezagutza zerbitzua

Aditu.eus zerbitzua baliatu ahal izateko, gure nabigatzailean https://aditu.eus/ helbidera joan eta bertan kontu bat ireki besterik ez dugu egin behar. Adituk euskarazko hizketa ezagutzen du, eta baita gaztelaniazkoa ere; azken finean egungo testuinguru elebidun diglosikoan euskal gizarteak eta bertako erakunde eta eragileek balia dezaten beharrezkoa ikusi dugu gutxienez bi hizkuntza horiekin ibiltzea.

Hala, euskaraz zein gaztelaniaz dagoen audio edo bideo fitxategi bat eman diezaiokegu (edo audio edo bideo bat daukan onlineko esteka bat ere bai, hala nola, EITB Nahieran, Youtube, Facebook edo Instagrameko esteka bat), eta bertan esaten dena idatziz emango digu Adituk, hiru formatutan: transkripzioa testu hutsean, azpitituluen fitxategia (SRT edo VTT formatuetan) eta transkripzioa hitz bakoitzaren denbora-markekin (bideoen gaineko bilaketan hitz bat esan den segundo zehatza jakitea ahalbidetzeko, adibidez). Jaitsi aurretik, azpitituluak editatu daitezke eskaintzen den interfazearen bidez.

Horrez gain, ordenagailuaren edo telefonoaren mikrofonoari esaten dioguna zuzenean eta aldiberean transkribatu ere egiten digu Adituk.

 

Aplikazio ugari, eta neurrirako soluzioak ere bai

Aditu web zerbitzua zuzenean baliatu daiteke hainbat erabilerarako. Ikus-entzunezkoen ekoiztetxeek dokumental eta saioak edo komunikazio-enpresek bideo korporatiboak, hitzaldiak edo ikastaroak azpititulatzeko balia dezakete, hedabideek eta kazetariek elkarrizketen grabazioak transkribatu ditzakete, administrazio publikoek udalbatzar edo bestelako bileren aktak jaso, ordenagailuan testuak idatz ditzakegu tekleatu beharrean hizketa baliatuta…

Horrez gain, enpresek edo erakundeek transkribatzailea edo azpititulazioa euren laneko fluxuan, aplikazioan, CMSan… integratu ahal izango dute eskaintzen den APIaren bidez. Aldibereko transkribatzaileak ere eskaintzen du APIa, zeinari audio seinalea bidaltzen joango garen eta berak ezagututako hitz eta esaldiak itzuliko dizkigun. Hau baliatuta, hitzaldiak, udal saio publikoak edo bestelako ekitaldiak zuzenean azpititulatu daitezke, edo hizketaz gidatutako makinak, domotika-sistemak, elkarrizketa-agenteak, laguntzaile birtualak, bozgorailu adimendunak, dei-zentroak eta antzekoak eraiki ere bai. Transkripzio-zerbitzua bezeroarenean ere instalatu daiteke behar izanez gero.

 

Hasiera besterik ez

Aditu.eus-ek ematen dituen aukerak eta irekitzen dituen ateak ugariak dira, eta mugarria da euskararentzat. Hala ere, ez dago dena eginda, hau hasiera besterik ez da.

Aditu.eus-ek ematen dituen aukerak eta irekitzen dituen ateak ugariak dira, eta mugarria da euskararentzat. Click To Tweet

Izan ere, Adituren transkripzioaren kalitatea edo asmatze-tasa orokorrean ona eta oso baliagarria bada ere, aldakorra da hainbat faktoreren arabera: audio-grabazioaren kalitatea, mikrofonoen kalitatea, oihartzuna, zarata edo musika altua dagoen atzetik, hizketa-mota, erregistroa, hizkuntza estandarrean edo aldaera batean den, bolumena, abiadura… Hobekien dabilen kasuetan (hitzaldiak, udalbatzarrak, albistegiak, dokumentalak, erreportajeak… zeintzuk normalean mikrofono onekin, irakurrita, euskara batuan… egiten diren), % 95etik gorakoa izan daiteke asmatze-tasa. Aldiz, okerrago dabil euskalkietan (eta euskalkiaren arabera ere ez da berdina), elkarrizketa espontaneo eta informaletan, filmetan… Horrez gain, emaitzak beti okerxeagoak dira aldibereko transkripzioaren kasuan. Aditu hobetzen jarraitu behar dugu, ezagutza hobeto egin dezan elkarrizketa informalekin, audio kalitate txarrarekin, euskalkiekin, filmekin… edo, zergatik ez, bertsoekin.

Bestalde, gorago aipatu ditugun integrazioak (CMSetan, aplikazioetan, sektore ezberdinetan erabiltzen diren softwareetan, makinetan, domotika-sistemetan, laguntzaile birtualetan, bozgorailu adimendunetan…) egiten joan beharko dugu, euskarazko hizketa bidezko zerbitzuak azken erabiltzailera iritsi daitezen. Gainera, Adituren hizketa-ezagutza Elhuyarren eta euskararentzat lantzen ditugun beste hizkuntza- eta hizketa-teknologiekin konbinatuz gero (itzulpen automatikoa, txatbot-ak, hizketaren sintesia edo sorkuntza…), zabaltzen diren aukerak ikaragarriak dira. Euskarak mundu digitalean izango duen etorkizunarekiko itxaropentsu (optimismo inozorik gabe, baina behintzat itxaropentsu) izateko beste motibo bat da Aditu.

Aurreko bidalketa

PODCAST. "Aditu.eus", Igor Leturia Elhuyar fundaziotik

Hurrengo bidalketa

PODCAST. Sakelekoak eta gazteak. Lorea Argarate

Egilea

Igor Leturia

Igor Leturia

@ileturia
Ingeniaria informatikan eta elektronikan eta doktorea hizkuntza-teknologietan. Gaur egun Elhuyarren dihardut lanean, hizkuntza-teknologien sailean, ikertzaile, garatzaile eta hizketa-teknologien lerroaren arduradun gisa. UEUn eta beste erakunde batzuetan ikastaroak eta hitzaldiak eman ditut. Elhuyar aldizkarian Mundu Digitala atala egin dut azken 10 urteetan. e-gorblog blogean informatikari eta nire beste zaletasun handiari buruz (komikiak, alegia) idazten dut.

Iruzkinik ez

Utzi erantzun bat

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude