Irakurri dugu liburua, bukatu da. Hurrengoan zein irakurri pentsatzen ari gara, ezer okurritu ez, baina. Normalean gure lagun minak, gure antzeko gustuak dituenak, gomendatu izan dizkigu liburuak, baina oporretan da, eta bitartean ezin erabaki zer irakurri. Bagoaz liburu-denda edo liburutegira, eta han gabiltza apaletan kuxkuxeatzen, aurrera eta atzera. Gaur ez dugu egun ona ordea, eta azkenean ezer hartu gabe iritsi gara etxera. Sarritan zaila da liburu bat aukeratzea, eta asko eskertzen da gomendio bat egiten digutenean, batez ere gure antzeko zaletasunak dituen lagun batengandik. Liburua esaten dugunean, gauza bera esan daiteke komiki, abesti, disko, pelikula, serie, opari edo dena delakoaz. Ohikoak gustatzen zaizkigu, baina berritasunak ere nahi ditugu, gure zaletasunetatik gertu daudenak bai, baina bestelakoak ere.
Denda eta zerbitzu digitaletan, Internetekoetan, ohartu ziren aspaldi horretaz. Liburua erosteko Elkar edo Amazon, musikarako YouTube, Itunes edo Spotify, pelikula eta serietarako Euskaltel edo Netflix, guztiak saiatzen dira erabiltzaileari eduki digital berriak gomendatzen, erabiltzailearen gogoa asetzeko asmotan, eta, bide batez, salmentak handitzeko. Izan ere, are eta gomendio hobeak, hobeto denentzat, eta horretarako sortu ziren gomendio sistemak.
Nola lortzen dute ordea jakitea zuri zer gustatzen zaizun? Ideia berez oso sinplea da: liburu bat erostean, liburu hori erosi dutenek zein beste liburu erosten dituzten aztertzen dute, eta horien artean bereziki agertzen dena da gomendatzen dizutena. Hori da funtsean duela 14 urte Amazon-eko ikerlari hirukote batek martxan jarri zuten gomendio sistema, eta duela gutxi errekonozimendua jaso dute [1], urteak pasa ahala garrantzia areagotu duen teknika delako. Gomendio onak egitea dirudiena baina zailagoa da, eta hori ondo ikusten da sistemak erratzen direnean. Adibidez, besterik gabe, liburu salduena gomendatzen digutenean beti (ez dudala nahi Harry Potter!), edo Harry Potter irakurri badut, Harry Potter 2 eta 3 gomendatzen dizkidanean.
Ikerlari horien ideia nagusia bi libururen arteko erlazioa eredu estatistikoen bidez formalizatzea izan zen: X eta Y liburuen arteko erlazioa pertsonen erosketen arabera estimatzea. Lehen hurbilpen batean, nahikoa litzateke begiratzea zenbat pertsonek erosi izan dituzten bai X eta bai Y (NXY), baina horrek arazo bat du, iadanik aipatu duguna: Y asko saldu bada (Harry Potter), X erosi duten pertsona askok erosi izango zuten. Hau da, liburu salduenak gomendatuko genituzke etengabe. Bigarren hurbilpena sotilagoa da: kalkulatu zein den X eta Y liburuak erosteko probabilitatea bien artean inongo erlaziorik ez balego (EXY), eta benetako kopuruarekin erkatu (adibidez NXY-EXY). Liburu salduenen efektua areago apaltzeko, zatitzea komeni da (NXY-EXY)/EXY, eta orain bai, liburu salduenak ez ezik, interesgarriagoak ere hasiko dira azaltzen gure gomendio zerrendan. Formula matematikoak inpresionantea badirudi ere (ikusi 1. irudia [1]), salmenta kopuru jakin batzuen batuketa, biderketa, kenketa eta zatiketa besterik ez da. Estatistika fidagarriak izateko, hori bai, lagin handiak behar dira: gure dendak gutxi saltzen badu ezin izango dugu gomendio fidagarririk egin, eta, kontrakoan, horregatik dira hain gomendio onak enpresa erraldoietakoak.
Izan ere, egungo sistemak oso zehatzak izan daitezke. Youtuben, adibidez, Esne Beltza entzuten badugu, gomendatuko dizkigu Betagarri, Huntza, Zea Mays, Alaitz eta Maider, Vendetta, Zirkorrika, Itoiz, Exkixu – demontre! Nola da posible, Youtuben Euskal musikan aditua den inor dute ala? Eta arraskastatzuak ere badira: Netflix-ek duela gutxi esan duenez, bere zerbitzuan ikusten diren pelikula eta serie guztien artean %80 dira beraiek erabiltzaileari zuzenean gomendatutakoak [2]. Amazon-eko bisiten %30 beraien gomendio sistemasi esker dela estimatu da [3].
Gomendio sistemak lagungarriak dira, bai literatura, musika edo ikus-entzunezkoetan, baita ere erosketak egitean ere [4]. Tamalez, badago zerbitzu honen beste aldea: publizitate konpainiak gomendio sistemen parekoak erabiltzen dituzte guri publizitate pertsonalizatua eskaintzen saiatzeko. Nork zer erosten duen jakitea oso garrantzitsua da horretarako, eta guri guruzko datuak ordainpeko merkantzia bihurtu dira ezkutuko merkatu ilunetan. Hala ere, datuak ez dira errazak lortzeko, eta horregatik, guri buruz gutxi dakitelako, tematu ere egiten dira askotan: behin Lisboako hegaldi bat erosi, eta han arituko dira Lisboarako hegaldien anuntzio berdina gure pantailan etengabe jartzen.
Erreferentziak:
[1] https://www.computer.org/csdl/mags/ic/2017/03/mic2017030012.html Brent Smith, Greg Linden, “Two Decades of Recommender Systems at Amazon.com”, IEEE Internet Computing vol. 21 no. 3, p. 12-18, , 2017
[2] https://www.semanticscholar.org/paper/The-Netflix-Recommender-System-Algorithms-Business-Gomez-Uribe-Hunt/e9dd899f0e599eafb4fe47696c83d07d971c0088 C.A. Gomez-Uribe and N. Hunt, “The Netflix Recommender System: Algorithms, Business Value, and Innovation,” ACM Trans. Management Information Systems, vol. 6, no. 4, 2016, pp. 1–19.
[3] https://arxiv.org/abs/1510.05569 A. Sharma, J.M. Hofman, D.J. Watts, “Estimating the Causal Impact of Recommendation Systems from Observational Data,” Proc. 16th ACM Conf. Economics and Computation, 2015, pp. 453–470.