GPT3, 4×4 IA eredua
2020. urtearen amaieran, albiste bat irakurri nuen, IA OpenAI – GPT3 eredua Adimen Artifizialaren mundua iraultzen ari zela bere gaitasun harrigarriengatik, hizkuntzaren esparruan.
Baina…Zer dira OpenAI eta GPT-3?
OpenAI Adimen Artifizialeko ikerketa-enpresa bat da, Elon Muskek 2015ean sortua, eta irabazi-asmorik gabeko erakunde gisa sortu zen. Erakunde horren esanetan, posiblea da gizateria osoarentzat onuragarria den AA sortzea, eta bere helburu nagusia AArako sarbidea demokratizatzea da, bere ereduen bidez.
2020an Microsoftekin elkartzen da AA algoritmoak bultzatzeko, eta urte horretan bertan GPT-3 merkaturatzen dute, orain arteko lengoaiaren prozesamendu naturaleko eredu osatuenetako bat dena.
Esan bezala, GPT3 hizkuntza idatzia sortzeko aukera ematen duen AA eredua da. Algoritmo hori hizkuntza auto-erregresiboaren ereduen barruan sartzen da, eta horrek esan nahi du bere ezaugarri nagusia honako hau dela: “testu jakin bati jarraituko liokeen hurrengo hitzik egokienak sortzeko aukera ematen duen algoritmoa”, edo, bestela esanda, testuak erdi automatikoki sortzeko aukera ematen duena.
Elkarrizketa-asistentetarako (chatbots) bereziki da erabilgarria, edukia idazteko lagungarria (berriak, postak, etab.), informazio bilaketarako tresna, bukatu gabeko testu bat osatzen laguntzen duena.
Gaur egun, erabilera ikerketa-komunitatera mugatzen da batez ere. Komunitate horrek API sarbide mugatua du, eta aldez aurretik eskatu behar da. Egia da dagoeneko posible dela erabilera plan batzuk kontratatzea, baina gaur egun ez dago mundu osorako zabalik.
GPT-3ri buruzko datu interesgarriak
GPT-3 eredua sortzeko erabilitako baliabideak ikaragarriak dira:
- 175.000 milioi parametro dituen eredu trebatua da.
- 500 mila milioi hitz erabili dira webguneko testuetatik, Wikipediatik eta hainbat liburu-bildumetatik, corpus gisa.
- Batez ere ingelesez, nahiz eta beste hizkuntzaren bat identifikatzeko gai den, hala nola frantsesa edo gaztelania.
- Gaur egun 300 bat aplikazio erabiltzen dira.
- 4.5 mila milioi hitz sortzen dira egunean.
GPT-3ren gaitasun nagusiak
- Testuak automatikoki sortzea.
- Sailkapena.
- Informazioa bilatzea.
- Galderak eta erantzunak.
- Txata.
- Testuen sentimendua.
- Laburpenak
- Eraldaketak (deskribapenak: programazio-kodea, taulak, excels, errezetak, eta abar)
GPT-3 motorrak
Gaur egun, GPT-3k lau “engin” ditu, hainbat funtzionalitatetan espezializatzen direnak:
Davinci. Asmo konplexuetarako osoena eta moldakorrena da. Edukia ulertu behar duten aplikazioetarako:
- Testuen laburpena.
- Edukiaren sormena.
- Problema logikoak ebaztea.
Curie. Oso eraginkorra da testua sailkatzeko. Halaber, galderak erantzuten espezializatuta dago, chatbots ezin hobea.
Babbage. Lan errazagoak egiten ditu, hala nola testuen eta dokumentuen sailkapen sinpleak eta semantikoak.
Ada. Oso azkar gauzatzen ari den eredua, zehaztasun handirik behar ez duten zereginak egin ditzakeena:
- Testuen parseoa.
- Helbideak edo hitzak zuzentzea.
- Sailkapen sinplea.
- Hitzak ateratzea.
Ondorioak
GPT-3aren ezaugarri bat aukeratu behar izanez gero, zalantzarik gabe, haren aldakortasun harrigarria izango litzateke hainbat lan egiteko orduan. Testu automatikoak sortzetik galderak edo problemak ebaztera, osagaietatik abiatuta sukaldeko errezetak sortzera, edo baita hizkuntza natural idatzizko sententzia bat Python kodea bihurtzera ere. Ia edozer gauza egiteko gai da.
Azpimarragarriena da testuak automatikoki sortzeko gaitasuna, sarrerako testu txiki batetik abiatuta, eta elkarrizketa baten testuingurua “ulertzeko” gaitasuna.
Jakina, dena ez da perfektua, eta ikusi da alderdiren bat hobetu daitekeena. Adibidez, elkarrizketa baten barruko gai aldaketak edo gai “eztabaidagarri” bati buruzko testu irteerak: hor nabari da oraindik ez dagoela erabat fin edo oso naturalak ez diren esaldiekin erantzuten dizu.
Azken ondorio gisa, helburu orokorreko algoritmo horiek interesgarriak direla eta onuragarriak izan daitezkeela modu egokian erabiltzen badira. Ziur nago etorkizun ez oso urrun batean erabilgarri izango ditugula eta gure eguneroko bizitzan presente egongo direla. Hala ere, kezkagarria da eredu mota horiek edukia automatikoki sortzeko duten erraztasuna… Iritsiko al da pertsona edo makina batek hitz egiten digun bereiziko ez dugula?