Aitzol Astigarraga Orai NLPko koordinatzailea | Argazkia: utzitakoa

BERRIKUNTZA

Aitzol Astigarraga: "2025ean euskararentzako LLM propioaren garapenari lotuko gatzaizkio"

Adimen artifizialaren bilakaera ikusita, hori moldatu eta 2025ean edozein titular idazteko aukera izango balu, honakoa aukeratuko luke Aitzol Astigarraga Orai NLPko koordinatzaileak: "Kontsumo baxuko LLM ereduek hizkuntza prozesatzeko gaitasuna erakutsi dute baliabide askoz gutxiagorekin. Euskara eta beste hizkuntza gutxituak handienen pare jarri dira horri esker". Egungo errealitatean, baina, adimen artifizialaren olatuan Orai NLP zutik surfeatzen ari dela dio Aitzol Astigarraga Oraiko koordinatzaileak. Elhuyarrek sustatutako adimen artifizialeko zentroak euskararentzako LLM propioa kaleratu du 2024ean, Llama-eus 8B, "eta horren garapenari lotuko gatzaizkio".

Zein da adimen artifizial/lengoaia prozesamenduarekin harremana duen 2024ko albiste ekonomiko garrantzitsuena? Zergatik?

Erantzuna ez da erraza; izan ere, adimen artifizialaren eremua ikaragarri eboluzionatzen ari da eta albiste berriak uneoro sortzen dira. Dena den, 2024tik zerbait nabarmendu beharko banu, esango nuke adimen artifizial sortzaile deiturikoak dantzalekuaren erdigunea hartu duela. Horri lotutako albiste ekonomikoa berriz, hauxe: 2024an LLM gero eta handiagoen eta garestiagoen garapena moteldu izana. Datu berriak lortzeko ahalmena gero eta urriagoa da, eta horrek inflexio-puntu bat ezarri du, datuen kalitateak eta eraginkortasun algoritmikoak garrantzi handia hartu dutelarik.

2025era begira titular edo albiste hori moldatu ahalko bazenu, zein nahiko zenuke titularra edo albistea izatea?

Zalantzarik gabe kontsumo energetikoarekin eta hizkuntza gutxiagotuekin izango luke lotura. Adibidez: "Kontsumo baxuko LLM ereduek hizkuntza prozesatzeko gaitasuna erakutsi dute baliabide askoz gutxiagorekin. Euskara eta beste hizkuntza gutxituak handienen pare jarri dira horri esker".

"Datu berriak lortzeko ahalmena gero eta urriagoa da, eta horrek inflexio-puntu bat ezarri du, datuen kalitateak eta eraginkortasun algoritmikoak garrantzi handia hartu dute"

Nola ikusten duzue 2025a zuen esparruan?

Bada, urte mugitua eta ekarpenez betetakoa espero dugu. 2024an euskararentzako LLM propioa kaleratu genuen, Llama-eus 8B, eta horren garapenari lotuko gatzaizkio. ChatGPTren gisan, agindu zehatzei erantzungo dien eredua izan nahi dugu, ataza ugari egiteko gai izango dena: testu berriak sortu, euskara ikasten lagundu, gomendioak eman... eta beste hainbat. Beste alde batetik, aldibereko itzulpena ere gure erronketako bat izango da, denbora errealean ahotsetik ahotsera itzuliko duen sistema lortzea baita gure helburuetako bat. Hizkuntza-teknologiak esparru berrietara zabaltzeko ahaleginean ere segiko dugu: industria, osasungintza, kazetaritza...

Adimen artifizialari loturiko guztia badirudi ziztu bizian doala, baina zuek urteak daramatzazue honetan lanean, lengoaia prozesamenduaren eta abarren ikuspegitik. Aurrea hartu diozuen sentsazioa duzue ala atzean gelditzeko beldur zarete?

Aurrea hartu diogunik ez nuke esango, baina olatuaren gainean zutik gabiltzala bai, 20 urte baino gehiagoko esperientziari esker. Lantalde gaztea eta ondo prestatua daukagu, eta ilusioz eta ideiaz beteta begiratzen diogu etorkizun hurbilari. Ea ba!