Gaitu.eus: Euskararen aniztasuna zaintzeko ekimena
Hizkuntza-aniztasuna galtzearen inguruko kezka gero eta handiagoaren testuinguruan, gaitu.eus ekimena sortu da. Plataforma digital honen bidez, euskarazko milaka ahots-grabazio bildu eta gorde nahi dira.
Bere helburu nagusia erreferentziazko soinu-artxibo bat sortzea da, ikertzaileek, irakasleek eta euskararen bilakaera eta aniztasuna ezagutu nahi duen edonork erabili ahal izateko.
Ekimenean parte hartzeko, edonork graba dezake bere ahotsa euskaraz, testu bat irakurriz. Grabazioak plataforman gaitu.eus gordeko dira beste batzuek egiaztatzeko gero. Kontrakoa ere egin daiteke noski, besteek grabatutakoa ondo edo gaizki dagoen esanez.
Soinu-artxibo irisgarri eta aberatsa sortzean, espero da ekimen honek hizkuntza-aniztasunari buruzko kontzientziazioa sustatzea eta euskararen erabilera eta ikaskuntza bultzatzea, baina bereziki hizkuntza teknologiak eta adimen artifizialeko modeloak garatzeko baliatuko da.
Hau dena posible izan da baina, Common Voice proiektuari esker. Benetan gaitu.eus denoi parte hartzeok deia egiten digun kanpaina bat da soilik. Atzean dauden logika eta tresnak Mozilla Fundazioaren ekimen honek jarri ditu. Euskararekin batera beste hizkuntza asko ere ari dira ahots corpus hauek osatzen.
Zer da Common Voice?
Common Voice Mozillaren proiektua da, eta hizkuntza askotarako (euskara barne) ahots datuen multzo bat sortzea du helburu. Kalitate handiko ahots-datuen multzo bat sortzea du helburua, software-garatzaileek, ikertzaileek eta beren proiektuetarako ahots-datuak behar dituzten pertsonek erabil dezaten.
Common Voicek, Amazon-en Echo, Siri eta Google Assistant bezalako enpresa handien ahots-asistenteei alternatiba librea eskaintzeko sortu zen. Hala ere, bertan jasotzen diren datuek beste aplikazio asko ere izan ditzakete libreak direlako.
Common Voice kode irekiko proiektua da, eta horrek esan nahi du edonork lagundu dezakeela horretan. Zure ahotsak Common Voicen graba ditzakezu mikrofonoa eta proiektuak emandako softwarea erabiliz. Ahots-datuak ere deskargatu eta zure proiektuetarako erabil ditzakezu.
Ezaugarri nagusiak
Hizkuntza aniztasuna: Common Voicek hizkuntza mota askotarako ahots datuak biltzen ditu, euskara barne.
Kalitate handia: Common Voicek kalitate handiko datuak biltzeko prozesua erabiltzen du, ahots-datuak zehatzak eta argiak izan daitezen.
Kode irekia: Common Voice kode irekiko proiektua da, eta horrek esan nahi du edonork lagun dezakeela, proiektua gardena dela eta ahots-datuak nolako kalitatea duten ikuska daitekeela.
Erabilgarritasuna: Common Voice software garatzaile, ikertzaile eta bere proiektuetarako ahots datuak behar dituen edonork erabil dezake.
Datuak
Abenduaren 14ean hauek ziren grabazio ordu eta hizlari kopuru ezberdinen datuak hizkuntza hauetan:
Euskara: 580 / 9374
Katalana: 3687 / 35654
Galegoa: 65 / 1041
Ingelesa: 3422 / 91317
Frantsesa: 1118 / 18799
Espainiera: 2309 / 25858
Bide asko falta zaigu oraindik beste hizkuntza batzuen maila lortu ahal izateko, horregatik denon esfortzua ezinbestekoa izango da helburua lortzeko. Common Voiceri buruzko informazio gehiago lortzeko, bisitatu proiektuaren web gunea: https://commonvoice.mozilla.org/eu/