Big data

Egun, arlo askotariko informazio digitalizatua aurkitu daiteke nonahi, izan ere, segundoko Youtubera 5 bideo-ordu igotzen dira, Twitterren 5.700 milioi txio argitaratzen dira eta Facebooken 28 milioi eduki partekatzen dira.

Internet, M2M teknologiak edo Gauzen Internet, eta Sare Sozialek informazio oso baliotsua eskaintzen diete gaur egungo erakunde eta enpresei beraien inguruneaz eta erabiltzaileez. Baina informazio hori guztia erabat sakabanatuta dago hainbat iturrietako zerbitzarietan eta interneteko hodeian bertan ere. Gainera, informazioa mota askotariko datuez osaturik dago: idatzizko agiriak, datu-taulak, eduki grafikoak, ikus-entzunezkoak …, eta ohiko datu-analisi eta datu-base sistemek ez dute balio informazio hori guztia aztertu eta kudeatzeko.

Big Data datu-kopuru handia kudeatzeaz arduratzen den Informazio eta Komunikazio Teknologien esparrua da, hau da, datu horiek guztiak denbora errealean bilatu, aztertu eta erabiltzeko beharrezkoak diren teknikak eta teknologiak.

Big datako teknologia

Big data lantzeko tresna asko daude, adibidez, Hadoop, NoSQL, Cassandra,MongoDB, MapReduce,…, baina funtzean denak antzeko oinarria dute: makina edo nodo bat maisu bezala aritzen da, informazioa eta exekutatu beharreko algoritmoak gainontzeko nodo-langileen artean banatuz. Ondoren, batera, nodo-langile guztietan jasotako lana exekutatzen da, eta bukatzerakoan,emaitza maisu-lanak egiten dituen nodoari itzultzen diote. Nodo-langile batek, aldi berean, eta behar adina aldiz, bere lana beste azpinodo batzuentan bana dezake, zuhaitz itsurako egitura sortuz, exekutatu beharreko lana era eraginkor batean gauzatzeko tamaina aproposa izan arte. Egin beharreko lanaren zatiketa horri esker, nodo bakoitzaren lan-karga arinagoa da, eta egokiago gauzatu daiteke.

Big datako arkitektura

Orokorrean Big datako teknikak erabiltzen ditugunean, proiektu konplexuen aurrean gaude, eta lau ataletan banatzen ohi dira, atal bakoitzak bere nodo-egitura duelarik.

Big Data Arkitektura

Txertatze fasea: Informazio iturriak anitzak izan daitezke eta API baten bidez txertatzen dira gure sisteman.

Moldaketa fasea: Txertatze fasetik gure sistemara heltzen diren landugabeko datuak eraldatu edo moldatu behar dira erabilgarri bihurtzeko. Zeregin horretan ETL (Extract, Transform and Load) tresnak erabiliko dira, datuetatik balioa duen informazioa ateratzeko eta hurrengo fasera bidaltzeko. Baliorik gabeko informazioa, berriz, arbuiatzen da memoria aurrezteko eta metatze fasea arintzeko.

Metatze fasea: Moldaketa fasetik datorren informazioa metatze-faseko nodoen artean banatzen da NoSQL –Not only SQL– tresnak erabiliz. Big datako datuak gordetzen dituen nodo taldeari Datu-Lakua edo Data-Lake deitu ohi zaio.

Analisi fasea: Big datako tresnekin metaturiko datuak aztertzeko algoritmo matematiko anitzetan oinarrituriko analisi-teknika bereziak erabiltzen dira, esaterako, datu-asoziazioa, datu-meatzaritza, multzokatze teknika, …

Teknologia hauek erabiltzen dituzten adibide ugari ditugu inguruan, baina nabarmenenak IKT mundutik datoz, hala nola Google, Facebook edota Amazon. Enpresa hauek beren erabiltzaileen bilioika bilaketak erabiltzen dituzte pertsonen gurariak iragartzeko eta asebete ditzaketen produktuak eskaintzeko. Eta maiz asmatzen dute.

Big data errealitate bat da gaur egun eta eskuragarri ditugun tresnei esker, edozein prozesutan eragina izan dezaketen aldagai gehienak irudika daitezke, denboran neurtu, aztertu eta hurrengo gertaerak iragarri litezke.

Big Data Analisia

Cookie	Duration	Description
cookielawinfo-checkbox-necessary	11 months	Cookie hau RGPDren cookieen onespen-pluginak osatzen du. "Beharrezkoak" kategoriako cookieen onespena gordetzeko erabiltzen dira.
cookielawinfo-checkbox-non-necessary	11 months	Cookie hau RGPDren cookieen onespen-pluginak osatzen du. "Ez-beharrezkoak" kategoriako cookieen onespena gordetzeko erabiltzen dira.
PHPSESSID	15 days	Cookie hau PHP aplikazioen oinarria da. Erabiltzaileen saio bakarreko ID gorde eta identifikatzeko erabiltzen da cookiea, web guneko erabiltzaile-saioa kudeatzeko. Cookie-a leihoa ixtean ezabatzen da.
sonaar_mp3_player_settings	session	Podcastak entzuteko erabiltzen den erreproduzitzailearen ezarpenak gordetzeko erabiltzen da.
sonaar_mp3_player_time	session	Podcastak erreproduzitzailean erabiltzailea entzuten ari den momentua gordetzeko erabiltzen da, orrialdez aldatzean berriz hasieratik hasi behar ez izateko.
sonaar_mp3_player_volume	session	Podcastak entzuteko erabiltzen den erreproduzitzailean hautatutako musika bolumena gordetzeko erabiltzen da.
viewed_cookie_policy	11 months	RGPDren cookieen onespen-pluginak finkatzen du cookiea, eta erabiltzaileak cookieak erabiltzea onartu duen ala ez gordetzeko erabiltzen da. Ez du datu pertsonalik.

Cookie	Duration	Description
DoNotCheckThemeUpdate	3 days	Deskribapenik gabe.
GoogleAdServingTest	session	Deskribapenik gabe.
isg	5 months 27 days	Deskribapenik gabe.
st_samesite	session	Deskribapenik gabe.
test_cookie	11 months	Cookie hau doubleclick.net-ek ezartzen du. Cookiearen helburua erabiltzailearen nabigatzaileak cookieak onartzen dituen zehaztea da.
xlly_s	1 day	Deskribapenik gabe.
__gpi	1 year 24 days	Deskribapenik gabe.

Cookie	Duration	Description
Google Ads	never	Google AdSensek erabiltzen du bere zerbitzuak erabiliz web guneetan publizitatean jartzen duten webguneen eraginkortasunarekin probak egiteko.
Google Adwords remarketing	12000
IDE	1 year 24 days	Google DoubleClick-ek erabiltzen du, erabiltzaileak webgunea bisitatu aurretik webgunea eta beste edozein iragarki nola erabiltzen dituen azaltzen duen informazioa gordetzeko. Erabiltzaileentzat garrantzitsuak diren iragarkiak erabiltzailearen profilaren arabera aurkezteko erabiltzen da.
VISITOR_INFO1_LIVE	5 months 27 days	Cookie hau Youtube bidez konfiguratzen da. Webgune batean txertatutako YouTubeko bideoen informazioa arakatzeko erabiltzen da.
YSC	session	Cookie hau Youtube bidez konfiguratzen da eta txertatutako bideoen ikustaldien jarraipena egiteko erabiltzen da.
yt-remote-connected-devices	never	These cookies are set via embedded youtube-videos.
yt-remote-device-id	never	Cookie hauek txertatutako Youtube bideoen bidez gehitzen dira.
yt.innertube::nextId	never	Cookie hauek txertatutako Youtube bideoen bidez gehitzen dira.
yt.innertube::requests	never	Cookie hauek txertatutako Youtube bideoen bidez gehitzen dira.

Cookie	Duration	Description
CONSENT	16 years 5 months 4 days 13 hours 16 minutes	Cookie hauek youtube-bideo txertatuen bidez ezartzen dira. Datu estatistiko anonimoak erregistratzen dituzte; adibidez, bideoa zenbat aldiz erakusten den eta erreprodukziorako zer doikuntza erabiltzen diren. Ez da datu sentikorrik biltzen Googleko zure kontuan saioa hasi ezean; kasu horretan, zure aukerak zure kontuarekin lotuta daude, adibidez, bideo batean “Atsegin dut” sakatuz gero.
vuid	2 years	Cookie hau Vimeok erabiltzen du jarraipen-informazioa biltzeko. Identifikazio bakarra ezartzen du web gunean bideoak txertatzeko.
_ga	2 years	Cookie hau Google Analytics-ek instalatzen du. Bisitaren, saioaren, kanpainaren datuak kalkulatzeko eta gunearen erabileraren erregistroa eramateko erabiltzen da cookiea, gunearen txosten analitikoa egiteko. Cookiek informazioa modu anonimoan gordetzen dute eta zoriz sortutako zenbaki bat esleitzen dute, bisitari bakarrak identifikatzeko.
_gid	1 day	Cookie hau Google Analytics-ek ezartzen du. Bisitariek web gune bat nola erabiltzen duten jakiteko eta web gunearen errendimendua azaltzen duen txosten analitikoa sortzen laguntzeko erabiltzen da cookiea. Bildutako datuek bisitari-kopurua, jatorri-iturria eta modu anonimoan ikusitako orriak barne hartzen dituzte.
__gads	1 year 24 days	Cookie hau Googlek finkatzen du eta dounleclick.com izenarekin biltegiratzen da. Erabiltzaileek iragarki jakin bat zenbat aldiz ikusten duten arakatzeko erabiltzen da cookie hau. Iragarki horrek kanpainaren arrakasta neurtzen eta kanpainak sortutako diru-sarrerak kalkulatzen laguntzen du. Cookie hauek konfiguratzen den domeinutik bakarrik irakur daitezke, ez da informaziorik bilduko beste leku batzuetan nabigatzean.

Big datako teknologia

Big datako arkitektura

4G-LTE konexioak, haririk gabeko konexio bizkorra