Posible al da neurtzea hizkuntzen arteko distantzia? Eta hizkuntzaren barruko dialektoen artekoa? Eta historian zehar hizkuntzak izan duen bilakaera? Eta euskara estandarra eta euskalkien artekoa?

Max Weinreich hizkuntzalariak hau dio: “Hizkuntza bat armada duen dialekto bat da”. Hizkuntza eta dialektoaren arteko banaketa, beraz, politikoa da, linguistikoa bainoago.

Aurrekoa egia izanda ere hizkuntzalaritza arloko ikerlariak aspalditik saiatzen dira hizkuntzen arteko erlazioak modu objektiboan baloratzen. Ikerlerro tradizionala hizkuntzen genealogia izan da, non hizkuntza-familiak eta haien eboluzio historikoa identifikatzen diren, oinarrizko hiztegietan eta fonologian oinarrituta. Dialektologian ere antzeko prozedura jarraitzen da dialektoen bilakaera aztertzeko.

Azken urteotan, hizkuntzalaritza konputazionalaren garapenarekin, zerrendetan oinarritutako azterketez gain, testuetan oinarritutako neurriak proposatu dira hizkuntzen arteko distantziak kuantifikatzeko. Perplexity (txundidura izan liteke ordain egokia) proposatu da nahiko arrakasta handiaz hizkuntza, dialekto eta aldaeren arteko distantzia emateko neurri bakar batean. Informazioaren teoriaren barruko neurri hori entropiarekin lotuta dago, eta, hizkuntzalaritzan aplikatuta, bi testu edo hizkuntza-eredu emanda neurtzen du batek bestea zenbateraino aurresan dezakeen. Hizkuntza bereko dialektoen arteko txundidura txikiago izan ohi da hizkuntzen artekoa baino. Erabiltzen diren hizkuntza-ereduak n-grametan (1, 2, 3… karaktereko multzoak) oinarritzen direnez, metodo matematiko hau lexikoaz gain morfologia eta azaleko sintaxia identifikatzeko gai da, modu inplizituan bada ere.

Hizkuntzen arteko distantziak eta hizkuntza-familiak

Neurriaren egokitasuna frogatu zuen ikerkuntzan egiaztatu zen txundiduran oinarrituta eraiki zen hizkuntzen arteko sarea (hizkuntza bakoitzak gertuen daukanarekin lotuz, ik. 1. irudia) bat datorrela adituen proposamenekin.

1. irudia: hizkuntzen arteko sarean distantzian oinarrituta

Distantzia txikienak familia bereko hizkuntzen artekoak dira (bosniera-kroaziera: 5, espainiera-portugesa: 8, suediera-daniera: 12). Euskara oso urrun geratzen da hizkuntza guztietatik eta hizkuntza erromanikoak aparte utzita georgiera da gertuen dagoena (oso urrun hala ere, 37).

Hizkuntzen bilakaera diakronikoa

Neurri egokia edukita esperimentu berriak egiteko testu fidagarriak behar dira. José Ramom Piche-en tesian neurria aplikatzen da galegoaren, portugesaren, espainieraren eta ingelesaren bilakaera aztertzeko. Horrez gain hizkuntzen arteko distantziaren eboluzioa ere kalkulatzen da.

2. irudia: (a) Erdi Aroko eta gaur egungo testuen arteko distantzia hizkuntza bakoitzean

(b) Erdi Arotik gaur egun arteko distantziak hizkuntzen artean

Erdi Arotik gaur egunera arte hizkuntza bakoitzeko distantzia islatzen da 2. irudiko (a) taulan (bi kodeketa desberdin erabilita). Zenbakitan adierazita ezaguna dena ondorioztatzen da: ingelesa askoz gehiago aldatu dela mendetan zehar espainiera edo portugesa baino. Hizkuntzen arteko distantziaren bilakaera islatzen da (b) grafikoan, agerian geratuz portugesa eta galegoa gertuago zeudela Erdi Aroan.

Euskararen bilakaera historikoa

Aurreko ikerketa horiek kontuan hartuta euskararen bilakaera historikoaren gainerako esperimentuak egin dituzte UPV/EHUko Ainara Estarrona, Izaskun Etxeberria, Manuel Padilla-Moyano eta Ander Soraluzek distantziak kalkulatzeko asmoz.

Egileek gaur egungo euskara estandarrean idatzitako bi testu-bilduma (Biblia eta EPEC testu-bilduma) eta 9 idazlan historiko alderatu dituzte distantzia kalkulatzeko. Testu historikoak honako hauek dira: Lazarraga (1565), Leizarraga (1571), Materra (1617), Axula (Gvero) (1643), Pouvreau (1669), Beriain (1621), Kapanaga (1656), Tartas (1666) eta Belapeire (1696).

Emaitzetan (3. irudia) agerian geratu da, zenbakitan, aurretik dakiguna, dialekto zentralak gertuago daudela haien artean eta mendebaldeko eta ekialdeko dialektoak (bizkaiera zein zuberera) idiosinkrasia handia dutela eta euskalki hauek askoz eragin gehiago dutela distantzian, garai historikoen gainetik. Zubereraren kasuan (eta neurri txikiagoan bizkaierarenean) neurtu den distantzia handiagoa da hizkuntza askoren artean dagoena baino.

3.irudia: Testu zaharren eta gaur egungoen arteko distantzia euskararako

Neurriaren sendotasunak aukera ematen du ikertzen jarraitzeko eta distantziak kalkulatzeko hizkuntzetako aldaeren artean: formala/ez-formala, hizkuntza bereko zona geografikoen artean… Zailena testu-bilduma esanguratsuak eta fidagarriak eskuratzea da. Erabili beharreko programak libreak dira eta horrela emaitzak argitaratutakoekin aldera daitezke.