“Ez dago atzoko egunkaria baino gauza zaharragorik”. Egunkaria paperean saltzen zenean, behin irakurrita eta, akaso, albisteren bat moztu eta gorde ondoren, leihoak garbitzeko, zapatak lehortzeko edota letrak moztuta bahitu baten erreskatea eskatzeko baino ez zuen balio. Egunkari batek ere ez luke bezperako egunkari irakurriak bigarren eskuko merkatu batean saltzen zituen saltzailea jazarriko.
Albiste horiek sinadura bat zuten, autore jakin bat, bere egile eskubide guztiak barne, baina egunkaria behin ordaindu eta hamaika aldiz irakurri zitekeen. Egun, ordea, internet bidez irakur daitezkeen egunkari asko eta asko harpidedunentzat baino ez daude eskuragarri, eta zaharraren zaharragatik dagoeneko albiste ez diren kazetaritza-testuek ere mundura jaio ziren unean zituzten irakurketarako eta banaketarako baldintza berberak dituzte.
Horrek traba handiak jartzen dizkio adimen artifizialak behar duen datu masa handien bilketari, hainbat egunkarik biltegiratze mota guztiak debekatzen baitituzte. Euskararen kasuan zortedunak gara Berria eta Argia hedabideek Creative Commons lizentziapean lagatzen baitituzte haien edukiak. Gaztelaniaren kasuan, CEDRO zentroa prest dago ikertzaileekin akordioak sinatzeko, kontziente baitira haien datuekin entrenatutako adimen artifizialak onura handiak ekar ditzakeela.
Ekain amaieran NBC katean egindako elkarrizketa batean Microsofteko zuzendari den Mustafa Suleymanek esan zuen erabilera egokia zela interneten irekian dagoen edukia adimen artifiziala entrenatzeko erabiltzea. Nolabait, interneten inolako giltzarraporik jarri badugu, besteek goza dezaten izan da, ezta? Egia esan, konpainia teknologiko handiek hamarkadak daramatzate besteek sortutako edukia inolako baimenik eskatu gabe erabiltzen, baina hain modu lasaian milioika pertsonaren aurrean egia baieztatzeak hautsak harrotu ditu.
Eduki batzuk esplizituki babestu dira copyright edo Creative Commons estandarrei jarraituta, nahiz eta irekian eta internauten gozamenerako klik baten distantziara egon. Askok, ordea, argudiatzen dutena da artefaktu bat sinatzeak egile eskubideen jabe egiten zaituela, eta ez zaiola dena delakoari babes-araudirik atxiki behar. Zer pentsatuko dute interneten sorreran denontzako plaza izango zela uste izan zuten haiek?
Egia esan, interneteko edukiak masiboki biltzea oso praktika orokortua da, eta ez dago benetan bide hori guztiz oztopatuko duen mekanismorik. Nire aburuz, gainera, gaurkotasunik gabeko edukien erreproduziorako trabak guztiz antzuak dira, berez publiko batentzako sortu baitziren, baina publiko horrek ez ditu berriz irakurriko, aurreko eguneko egunkariarekin gertatzen den bezala.
Arazo larriena da, ordea, eredu handiek gure datuetatik ikasten dutena. Nork ez du esaten adimen artifizial batek osasun-aseguru bat garestituko digula duela 20 urteko gizenak gineneko argazkiak gure izenarekin lotu dituelako? Ez al da posible adimen artifizial batek gure ahots eta irudiarekin bideo faltsuak sortzea herriko poesia jaialdian irakurri genituen olerki horien bideotik ikasita? Utikan copyrighta eta utikan egile-eskubideengatik irabazi zitezkeen azken bi sosak, adimen artifizial batek guk egiten duguna gure molde, ahots eta sentsibilitate beraz egiten badu, guk ezer egin ezin dezakegun bitartean.