Arantza del Pozo: "Guk teknologia aurreratu nahi dugu, baina enpresek dituzten beharretara egokituz"
Orain arte laguntzaile birtualak, itzultzaile sistemak edota adimen artifizial sortzailea erabili ez duten zenbait sektore eta enpresa hasi dira erabilera kasuak planteatzen. Del Pozoren hitzetan, makinekin era naturalean elkarrekintzak egin ahal izateko teknologia da ahotsa eta lengoaia naturalaren prozesamendua
Vicomtech zentro teknologikoko ahotsaren eta lengoaia naturalaren prozesamendurako teknologien arloko zuzendaria da Arantza del Pozo. Teknologia azken urteotan oso azkar garatzen ari dela dio, eta garapen horrek sektore askotara hedatzea ahalbidetu duela. Itzultzaile neuronalak, laguntzaileak, bilatzaileak, audioen transkripzioa... hizkuntzen industria izan da ahotsaren eta lengoaia naturalaren prozesamendurako teknologiaren sektore tradizionala, baina egun industrian edo osasun sektorean ere erabilera kasu ugari antzeman dituzte, makinekin elkarrekintza erraztuz. Euskara ere ari da bere bidea egiten merkatuan.
Zertan datza ahotsa eta lengoaia naturalaren prozesamendurako teknologia?
Ahotsak eta testuak automatikoki prozesatzen saiatzen da. Norbaitek hitz egin edo testu bat bidaltzen digunean, gure burmuina mezua ulertzeko gai da. Teknologia horiek gure burmuinak egiten duen prozesu hori errepikatzen dute, makina baten bidez. Adibidez, testu bat audiora pasa edo audio bat testura pasa, gero testuan daukaguna ulertzeko. Zer da testu bat ulertzea? Aplikazioaren arabera desberdina da prozesamendua. Kasu batzuetan, testua ulertzea da testu horretan dagoen informazio bereizgarria hartzea. Hori beste hezkuntza batean esan ahal izatea beste prozesamendu mota litzateke.
Beste erabilera kasu bat elkarrizketa sistemak dira, pertsona batek egiten dituen elkarrizketak makina batek egin ahal izatea. Zuk pertsona bati zerbait esaten diozunean, pertsona horrek ulertzen du zer esan nahi duzun eta gero erantzun bat ematen dizu. Ahots eta hizkuntza teknologiak ere hori era automatiko batean egiten saiatzen dira. Hitz egiten ari denak zer esan nahi duen ulertu, hori nolabait prozesatu eta erantzun egoki bat eman. Erantzun hori testu bidez edo ahots bidez eman daiteke. Azken finean, gailu edo makinekin era naturalean elkarrekintzak egin ahal izateko teknologia da.
Teknologia hori guztia garatzeak zer nolako garrantzia du? Zer abantaila ekar ditzake?
Aplikazio pila bat dituzten teknologiak dira, azken urteotan asko aurreratu direnak. Informazio digitala kudeatzeko erabiltzen dira gehienbat. Gure mundua geroz eta digitalagoa da, eta mundu digital horretan hizkuntza etengabe erabiltzen dugu. Izan ere, gure gizartea informazio gizartea da, eta dagoen informazio pila hori kudeatzeko ahots eta hizkuntza teknologiak erabili daitezke.
Teknologiaren aplikazio askok gure inguruan dauden gailuekin modu naturalago batean aritzeko balio dute. Pantaila klikatu ordez, pantaila bati esan ahal badiozu nora joan eta zer bilatu, pertsonekin egiten duzun bezala, elkarrekintza askoz ere naturalagoa izango da. Pantaila eta gailuekin elkar eragiteko ere hitzak erabiltzea baimentzen duten teknologiak dira.
Aipatu duzu azken urteotan bilakaera handia izan duela teknologia horrek. Nolakoa izan da?
Ahots eta lengoaiaren teknologia adimen artifizialaren barruko teknologia da. Adimen artifiziala 1940ko edo 1950eko hamarkadan hasi zen lantzen, baina hasierako eremuak mugatuak ziren. Hurrengo urteetan datu gehiago eta konputazio azpiegitura indartsuagoak etorri dira. Adimen artifizialak datuetatik ikasten du, beraz, munduaren digitalizazioak teknologia azkar aurreratzen lagundu du. Mundu digitaleko datu horiek erabili ahal izan dira adimen artifizialeko teknologia garatzeko.
Konputazio azpiegiturak eta ordenagailuak ere asko garatu dira. Gaur egun erabiltzen ditugun hardwareak geroz eta azkarragoak eta txikiagoak dira. Datu digitalizatu kopuru handi bat eta konputazio azpiegitura aurreratuekin, sare neuronal sakonetan oinarritutako algoritmoak probatu ahal izan direnean, etorri da aurrerapen teknologiko handi bat, ahotsaren transkripziorako, sintesirako, itzulpen automatikorako, elkarrizketa sistemak garatzeko… Teknologia ikertzailea izatetik erabilgarria izatera pasa da.
"Datu digitalizatu kopuru handi eta konputazio azpiegitura aurreratuekin, sare neuronal sakonetan oinarritutako algoritmoak probatu ahal izan direnean, etorri da aurrerapen teknologiko handi bat"
Adimen artifizialak sona handiagoa hartu du. Garapena bizkortu da azken urteetan?
2014tik sare neuronal sakonak hasi ziren lantzen eta adimen artifizialaren bizkortze bat eman zen. Lehenengo itzultzaile neuronalak sortu ziren eta erabilgarriagoa bilakatu zen teknologia. Baina orain adimen artifizial sortzailearekin gauzak askoz ere azkarrago doaz. Ahots eta hizkuntza teknologiak erabilgarriagoak dira, eta teknologia hori erabili ahal izateko egin behar den egokitzapen lana errazten ari da. Adimen artifizial sortzaileak erabilera kasu gehiago ireki ditu, eta horregatik egin da famatuagoa edo gizarteratu da gehiago. Aurrerakuntzen gainean egotea da gure lana. Egunean publikazio berri pila bat ateratzen dira, esparru hori eraldatu, askotariko aplikazioak garatu eta hobetzen jarraitzen dituztenak. Gaur erabiltzen ditugun hizkuntza eredu sortzaileak eta sei hilabete barrukoak ezberdinak izango dira segur aski.
Teknologia horiek zer sektoretan aplikatu daitezke?
Hizkuntza teknologiaren sektore tradizionala hizkuntzen industria da, eta bertan itzulpen, azpititulu edo bikoizketa zerbitzuak ematen dituzten enpresak dauzkagu. Lehen eskuz egiten zutena orain, teknologia hori baliatuz, azkarrago egin dezakete. Adibidez, audioen transkribapenaren lehen bertsio automatiko bat lortu eta gero hori errepasatuz. Edukien eta komunikabideen sektorean ere aplikazio asko dauzka, batez ere, horien irisgarritasuna bermatzeko. Bilaketak hobetzeko, adibidez. Komunikabideetan edukiak gordetzen dituzten sistemak dauzkazue, eskuz sortutako metadatuak erabiltzen dituztenak. Metadatu horiek ahots eta hizkuntza teknologiak erabiliz automatikoki sor daitezke. Bestetik, adimen artifizial sortzailea ere testuak idazteko lagungarria izan daiteke. Teknologiak akatsak ere egiten ditu, baina oinarri bat da pertsonek gero hori editatzeko.
Hirugarren aplikazio sektore bat arreta zerbitzuena da. Gaur egun dei zentro asko daude. Batzuetan sistema automatikoak erabiltzen dituzte eta horiek deiak automatikoki bideratzen saiatzen dira, baina oraindik sistema nahiko tuntunak dira. Gaur egungo teknologia hor txertatzen denean, sistema automatiko horiekin elkarrekintza askoz ere naturalagoa izango da erabiltzaileak hobeto ulertzeko gaitasuna izango duelako. Bestalde, grabatzen diren deiak ere askotan aztertu egiten dira, eta estatistikak biltzeko ahots eta hizkuntza teknologiak asko erabiltzen dira. Azkenik, administrazio publikoan adibidez tramiteekin lotutako dokumentuak automatikoki aztertzeko ere balio dezake hizkuntza teknologiak.
Eta industrian zer erabilera izan dezake?
Egia da orain arte teknologia hori erabili ez duten sektore batzuk ari direla erabilera kasuak planteatzen. Industrian geroz eta enpresa gehiago dauzkagu, fabrikazio edo energia alorrekoak besteak beste, ahots eta hizkuntza teknologiak aplikatu nahian. Zertarako? Beraien kudeaketa sistemekin hitz egiteko. Ahots bidezko elkarrekintza oso baliagarria da industrian operadoreek eskuak maiz tresnekin okupatuta dituztelako. Kudeaketa sistemekin hitz egin eta informazio erabili ahal izatea eskatzen ari dira enpresa dezente. Inguruan dauzkaten makina eta robotekin ere bai, elkarrekintza egiteko ahots bidez egiteko interesa dute. Baita laguntzaileak garatzeko ere. Adimen sortzailearekin ChatGPT moduko laguntzaileak garatu nahi dituzte, baina beraien negozioari eta makinei buruz dakitenak.
Osasungintzan ere eskaria handitzen ari da. Historial klinikoetan medikuek testu moduan sartzen duten informazio asko dago, baina informazio hori ez da oraindik guztiz ustiatzen, ikerketa klinikoak egiteko edo estatistikak ateratzeko, adibidez. Testu horietatik informazioa atera eta ustiatzeko aplikazioak garatzen ari dira. Bestalde, irudi klinikoei lotutako txostenak horretan adituak diren pertsonek betetzen dituzte. Teknologia ari da garatzen irudietatik automatikoki txostenak sortzeko. Gero mediku batek berrikusi beharko ditu, baina teknologiak hori jada ahalbidetzen du.
Azken sektore aipagarri bat da segurtasun digitala. Internet bideoz, audioz eta testuz josita dago, eta horien artean maltzurkeria asko. Hor dagoen informazio guztia aztertzeko teknologia hauek erabili daitezke edo adimen sortzailearekin sortzen diren audio eta testu faltsuak antzeman.
"Ahots bidezko elkarrekintza oso baliagarria da industrian operadoreek eskuak maiz tresnekin okupatuta dituztelako eta kudeaketa sistemekin hitz egin ahal izatea eskatzen ari dira enpresa dezente"
Hortaz, teknologia hedatzen ari den heinean, erabilpen berriak sortu eta geroz eta sektore gehiagotara heltzen ari da.
Adimen artifizial sortzaileak eta ChatGPT moduko laguntzaileen gizarteratzeak eragin duena zera da: orain arte teknologia horren beharra ez zeukaten enpresa eta sektoreak orain bere erabilera planteatzen hasi direla. Adibidez, enpresa askotako komertzialek lizitazioen pleguak eskuz aztertzen dituzte, baina denbora asko ematen die. Eta ChatGPT moduko sistema bat garatu ahal balitz, baina enpresa bakoitzaren pleguak komertzialen antzera aztertzeko gai dena? Araudi edo manual teknikoekin ere antzeko zerbait gertatzen da. Informazio oso zehatza daukate, eta enpresa bakoitzeko adituek eskuz aztertu behar dituzte. Adimen artifizial sortzaileko ereduak orokorrak dira eta ez daukate enpresek behar duten ezagutza zehatza, baina eredu horiek enpresen informazioarekin elikatzen badira, egin daiteke zerbait. Egunero agertzen dira erabilgarritasun berriak sektore ez hain ohikoetan.
Zuek industria sektoreko enpresetatik jasotzen dituzue kontsultak ezta?
Guk azkenean ikerketa aplikatua egiten dugun zentro bat gara eta gure eguneroko lana ikerketa aplikatuko proiektuak garatzea da. Proiektu horietan teknologia aurreratzen dugu, enpresek dauzkaten beharretara egokituz. Enpresak etortzen zaizkigu eta merkatuan oraindik ez dauden teknologiekin zer egin daiteken galdetzen digute. Hau posible ikusten duzue? Bideragarritasunaren arabera lankidetza moduak planteatzen ditugu.
Gurean zer puntutan aurkitzen da ahots eta lengoaiaren teknologia beste herrialde edo merkatuen aldean? Eta gure hizkuntza?
Mundu mailan merkatua erraldoi teknologikoek menperatzen dute. OpenAI, Microsoft, Google eta Amazonek merkatuaren gehiengoa daukate. Beraien garapen teknologikoa negoziora bideratuta dago. Euskarak hiztun gutxi dauzka, beraz, euskararen negozioa ez da oso handia. Erraldoi teknologikoen garapen plagintzan euskarak ez du ingelesak, gaztelaniak edo txinatarrak duten lekua. Hala ere, egia da Euskal Herrian badaudela kalitate ona dauzkaten ahots eta hizkuntza teknologietako produktu batzuk. Badauzkagu kalitatezko itzulpen automatikoko sistemak. Vicomtechen Batua izeneko itzultzaile automatiko bat dugu. Plataforma erabiltzen dutenei eskatzen diegu sistemak sortzen dituen akatsak konpontzeko eta gero horiek teknologia nola hobetu ikertzen jarraitzeko erabiltzen ditugu. Orain euskalkien itzulpen automatikoekin hasi gara lanean: bizkaierarekin egin ditugu proba batzuk, batuatik eta gazteleratik bizkaierara eta alderantziz itzuliz.
Itzuli ere badugu, Jaurlaritzaren itzultzaile neuronala, eta itzulpen automatikoko zerbitzuak euskaraz ematen dituzten enpresak ere badaude. Trebe Languages Technologies, adibidez, Vicomtechen spin off bat da, ahots eta hizkuntzaren teknologia merkaturatzeko sortu duguna. Beste zenbait itzulpen automatikoko plataforma eta zerbitzuak ere badaude. Euskarazko itzulpen automatiko neuronalak oso emaitza onak ematen ditu eta oso erabilgarriak dira. Orain komunitate zientifikoa ari da adimen artifizial sortzaileak itzulpen automatikoan izan dezakeen eragina aztertzen.
Euskaraz audioak transkribatzeko teknologia ere badago. Vicomtechen Idazle izeneko plataforma bat dugu, EITBk erabiltzen duena beraien ikus-entzunezko edukiak azpititulatzeko. Trebek ere badu euskarazko audioak transkribatzeko teknologia.
"Egunero agertzen dira ahots eta lengoaiaren prozesamendurako teknologiaren erabilgarritasun kasu berriak sektore ez hain ohikoetan"
Esandakoagatik, ez dirudi gaizki gaudenik.
Itzulpen automatikoak sortzeko eta audioak transkribatzeko teknologia badago euskaraz eta nahiko ondo doa. Baina adimen artifizial sortzailean oinarritutako teknologia berri hori... Hizkuntza eredu handi guztiek euskaraz ez dute gazteleraz eta ingelesez bezain ondo egiten. Aurrerapausoak ematen ari dira, eta nik uste dut hurrengo urteetan segur aski euskaraz ere emaitza onak izango ditugula. Egia da Euskal Herrian ahots eta hizkuntza teknologien ikerketa eta garapena egiten duten jende dezente dugula balio kate guztian. Unibertsitatean oinarrizko ikerketa egiten da, ikerketa aplikatua egiten dugun zentro teknologikoen katea dugu eta teknologia merkaturatzen duten enpresak badaude. Balio kate guzti horrek bermatu nahi du euskara mundu digitalean ere badagoela. Finantzazioa lortzea falta da hori aurrera eraman ahal izateko.
Ez gaude gaizki, baina euskararen merkatua txikia da eta ezin dugu euskararen hizkuntza teknologien garapena erraldoi teknologikoen esku utzi bakarrik. Euskararen ahots eta hizkuntza teknologien garapenean inbertitzen jarraitu behar da.
Vicomtechen abian duzuen zein proiektu nabarmenduko zenukete oraintxe bertan?
Gure eguneroko lanean bi proiektu mota ditugu. Alde batetik, unibertsitate eta beste ikerketa zentroekin teknologia aurreratuak ikertzen ditugu, euren aplikagarritasuna aztertuz. Bestalde, enpresek azpikontratatzen gaituzte, teknologia beraien beharretara egokitzeko. Lehenengo motako proiektu batzuk aipatzearren, Adapt-IA izenekoa dago. Teknologia horiek erabilera kasuetara ekartzeko, egokitzapen lanak egin behar dira. Proiektu horretan ikertzen ari gara egokitzapen hori egiteko zer metodologia eta teknika diren onenak. Teknika horiek hainbat sektoretan ari gara probatzen, eta horretarako Euskal Herriko hainbat klusterrek ere parte hartzen dute proiektuan. Mafex AFM, Energia Klusterrak edota AICk garatzen ari garen teknologiarako erabilera kasu batzuk zehaztu dituzte.
Ikun proiektuan adimen artifizial sortzaileko ereduen aplikagarritasuna aztertuko dugu fabrikazio munduan, batez ere, kalitatearen inguruan aplikazioak garatzeko, eta eredu sortzaile multimodalak ikertuko ditugu. Hasierako eredu sortzaileek soilik testua prozesatu ahal zuten. Jarraibideak testuz jaso eta testua sortzen zuten, baina gaur egun jada hizkuntza eredu sortzaile asko multimodalak dira: irudiak txertatzea posible da eta irudiei buruz ere galderak onartzen dituzte. Eredu multimodal horiek esploratuko ditugu eta ikusiko dugu zer erabilera izan dezaketen industria munduan, piezen ekoizpenaren kalitatean eta langile eta makinen arteko elkarrekintzetan.
Azkenik, Europa mailan Luminous izeneko proiektuan parte hartzen ari gara. Proiektu horrek mundu birtual eta errealitate areagotuan hizkuntza eredu sortzaileak nola txertatu ditzakegun aztertzen du, mundu horretan ere elkarrekintza naturalagoa izateko. Mundu birtualetan, normalean, bideojokoetan adibidez, elkarrekintzak pantailan agertzen diren testuzko mezu eta joystick moduko mandoen bidez burutzen dira. Ingurune horietan ere adimen artifizial sortzaileko ereduak nola erabili daitezkeen ari gara aztertzen, erabiltzailearen eta sistemaren arteko interakzioa naturalagoa egiteko.
Zer hizkuntzatan garatu dira proiektu hauek?
Adapt-IAn gaztelania eta euskara lantzen ari gara. Ikun gehienbat gaztelaniaz garatuko dugu eta kasu batzuetan ingelesa ere erabiliko dugu. Helburua ez da hainbeste hizkuntza lantzea, baizik eta eredu sortzaile multimodalen baliagarritasuna aztertzea, mundu industrialean, batez ere, produkzioaren kalitatea bermatzeko eta makinekin elkarrizketak ahalbidetzeko. Luminousen erabilera kasuak ingelesa, frantsesa, gaztelera eta grezierarekin aurreikusten dira.
"Eredu sortzaile hauek nahiko generalistak dira, gehienbat Interneten dagoen edukiarekin elikatu dira, eta Interneten dagoen edukia domeinu espezifikoen erabilera kasu batzuetan ez da erabilgarria"
Etorkizunera begira nola ikusten duzu ahotsa eta lengoaia naturalaren prozesamendurako teknologia?
Etorkizun handia du. Geroz eta enpresa eta sektore gehiagok txertatu nahi izango dute. Teknologia honek duen erronka da eredu sortzaileak nahiko gerenalistak direla. Interneten dagoen edukiarekin elikatu dira gehienbat, eta eduki hori domeinu espezifiko batzuetan ez da erabilgarria. Aireko kontroladore eta pilotuen arteko ahots bidezko elkarrizketak, esaterako, oso kalitate baxukoak izaten dira. Normalean ingelesez hitz egiten dute beraien artean, baina beste herrialdeetako azentuekin. Eta elkar hobeto ulertzeko hiztegi berezi bat erabiltzen dute letreiatzeko. Audio horiek transkribatzeko erronka handia dago, eta oraindik ere teknologian aurrera egin beharko da zeregin horri behar bezala ekiteko.
Osasungintzan erabiltzen diren testuak ere oso bereziak dira, ez dira Interneten erabiltzen direnak bezalakoak eta garapen espezifikoak behar dituzte. Industrian gehiago sakontzen dugun heinean, segur aski aurkituko ditugu erabilera kasuak, non eredu generalista horiek ez duten kalitate nahikoa ematen. Kasu horietan, garapen bereziak egin beharko dira teknologia eraman ahal izateko. Sektore guztiek ikusten dute ahots eta hizkuntzen teknologia badela informazioa kudeatzeko eta sistemekin elkarrekintzak egiteko teknologia baliagarriena, eta gero eta erabilera kasu gehiagotara eramango dela pentsatzen dut.
Hein horretan, zeintzuk uste duzu direla erronka edo zailtasun handienak?
Ereduok garatzeko datu kopuru eta azpiegitura konputazional handiak behar dira. Euskararako, esaterako, datu kopuru horiek lortzea zaila izaten ari da, eta ildo horretan lan gehiago egin beharko litzateke. Teknologia horietan euskara garatzen jarraitu ahal izateko datuak klabeak dira. Azpiegitura potenteak ere garestiak dira, eta energia asko kontsumitzen dute. Datu kopuru handiak biltzea, beharrezkoak diren baliabide konputazional handiak gutxitzea eta teknologiaren fidagarritasuna hobeto kudeatzea dira erronka nagusiak. Europak arreta jarri du eredu horiek fidagarriak izan daitezen, eta ildo horretan ikerketa ugari finantzatzen ari da.
Bestalde, ahots eta hizkuntza teknologia sortzaileak behar ez bezala erabiltzearekin lotutako erronka etikoak daude. Eredu sortzaileen emaitzak gainbegiratu behar dira, akatsak izan ditzaketelako. Eta albiste eta audio faltsuak sortzeko erabili daitezke. Guk garatzen ditugun erabilera kasuak enpresen prozesu eta produktibitatearekin lotuta egoten dira normalean eta pertsonentzat lagungarri egiten saiatzen gara, baina egia da teknologia asmo kaltegarriekin erabiltzeko ere eskuragarri dagoela. Ikusiko dugu. Agian etorkizunean teknologiaren erabilera arautu egingo da.