Gizakien portaera adimenduna imitatzea da Adimen Artifizialaren helburua. Informatikaren hasieran planteatu ziren erronkak halakoak ziren, xake-jokoan irabaztea eta hizkuntzen artean itzulpen txukunak egitea. Lehen helburua Deep Bluek duela 20 urte baino gehiago lortu zuen. Bigarrena lortzeko bidean gaude, baina dagoeneko, hizkuntza batzuen artean eta testu sinple samarretan, betetako helburutzat jotzen hasi da.

Adimen artifizialaren inguruko teknologia aurreratuz doan heinean, bestelako abileziak ere lortzen ari dira. Horren erakusle, berriki, makinek benetakoak diruditen testuak, irudiak eta ahotsak sortzen hasi dira. Adibidez, bizitza laburrekoa izan bazen ere, duela bi urte Euskal Herrian ospetsua egin zen Iñigo Urkullu-ren ahoskerarekin edozein testu imitatzen zuen webgunea, UPV/EHUko Aholab ikertaldeak sortutakoa. Teknologia horrek imitatu nahi den pertsonaren ahotsaren grabazioak besterik ez ditu behar, eta beharrezko den grabazioen denbora laburtzen joan da azken aldian: egun nahikoa da minutu inguruko grabazioa makinak pertsona horren ahotsa imitatzen ikas dezan. Aldi berean, irudi eta bideo artifizialak ere sortu izan dira, deepfake deritzan bideo faltsuak, adibidez Obamak Trump tontolapikoa dela esaten duenekoa.

Audio edo bideo izan gabe, testu faltsu sinesgarriak sortzeko gaitasuna ere iritsi da. Interneteko hainbat forotako iritzi ustez original asko ez omen dira originalak, eta spam mota berri batean aurrean gaudela esan daiteke, non makinak automatikoki sortzen dituen mezu jakina duten hainbat testu ezberdin. Spam-mezu horien eragina egungo gizartea eta politikagintzan neurtu izan da berriki. Estatu Batuetako kongresuak sarearen neutraltasunaren inguruan hartu beharreko erabaki baten aurrean sare sozialetan egondako eztabaidan erakutsi da mezuen %50 bot direlako erabiltzaile faltsuen bidez zabaldutako mezu artifizialak direla, gehienbat neutraltasuna bertan behera gelditu zedin argudiatzen zutenak. Horrekin neutraltasunaren kontrako eragileek jendetza handia beraiekin bat zegoela irudikatzea lortu zuten.

Testu berriak sortzeko hainbat teknika erabili izan dira. Errazena, jatorrizko testu baten gainean azaleko aldaketak egitea. Baina gaur egun adimen artifizialeko teknika aurreratuenak eta datu handiak erabiliz makinak zuzenean istorio berriak asmatzeko gai dira. OpenAI irabazi asmorik gabeko ikerguneak halako sistema berritzaile bat kaleratu du duela gutxi. GPT2 izena du sistema berriak, eta gai da, abiapuntu bezala testu baten hasiera motza emanda, istorio oso bat osatzeko bere kabuz emandako hasierarekin koherentzia mantenduz estilo zein semantikaren aldetik. Adibide bezala, George Orwell-en 1984 eleberriaren hasierako esaldia emanda:

– “It was a bright cold day in April, and the clocks were striking thirteen.”

Sistemak estilo berean eta zientzia fikziozko doinuan jarraitzen du:

– “I was in my car on my way to a new job in Seattle. I put the gas in, put the key in, and then I let it run. I just imagined what the day would be like. A hundred years from now. In 2045, I was a teacher in some school in a poor part of rural China. I started with Chinese history and history of science.

Sistema honek lengoaia naturalaren prozesamenduan ezagunak diren teknikak pauso bat haratago eraman du. Testu kopuru erraldoiak irakurrita gu imitatzeko gaitasuna bereganatu du. Oraindik ere testuak errepikakorrak izan daitezke, eta ezinezko egoerak deskribatu ditzake, adibidez “ur azpiko suak”, eta koherentzia hobetzea badago. Hala ere oso zaila da  testu bat pertsona batek edo makinak sortu duen bereiztea, eta horrek arrisku handiak ekarri ditzakeela uste dute autoreek beraiek. Hori dela eta ez dute sistema bera publiko egin, beldur baitira testu faltsuak sortzeko erabiliko dela, eta post-egiaren garai hauetan berri faltsuak zabaltzeko gaitasuna areagotzen baitu, bot-en askoren bidez kanpaina koordinatuekin mezu beraren aldaera detektaezinak zabaltzea ahalbideratuz. Eman dioten  “deepfakes for text” izenak aurreratzen digu arriskuaren nondik norakoa. Momentuz eduki ditzakeen erabilpen gaiztoak aztertzen ari dira eta eredu sinpleago bat banatzen dute ikerketarako.

 

Aurreko bidalketa

[PODCAST} Wikipedia eta Mikel Artetxe

Hurrengo bidalketa

[PODCAST] Errealitate areagotua

Egilea

Iñaki Alegria

Iñaki Alegria

@inakialegria
Iñaki Alegria EHUko Informatika fakultateko irakasle-ikerlaria da. Hizkuntzaren prozesamenduaren arloan ikertzen du, IXA taldearen baitan. UEUko zuzendaria da momentu honetan.

Eneko Agirre

Eneko Agirre

@eagirre
Eneko Agirre EHUko Informatika fakultateko irakasle-ikerlaria da. Hizkuntzaren prozesamenduaren arloan ikertzen du, IXA taldearen baitan.

Iruzkinik ez

Utzi erantzun bat

Zure e-posta helbidea ez da argitaratuko. Beharrezko eremuak * markatuta daude