Vídeo promocional del projecte AINA a Times Square a Nova York [Foto: Nia Escolà/ACN]

El projecte AINA, engegat pel Govern i pel qual es treballa per tal que les màquines parlin i entenguin el català, ha tancat el 2022 amb dades molt optimistes. D’entrada, ha doblat les hores enregistrades i s’apropa a les 31.000 veus diferents enregistrades.

Des de la seva posada en marxa el mes de febrer, s’han aconseguit validar 1.866 hores de les més de 2.500 que s’han gravat en català. Amb la col·laboració del departament TIC del govern i del Barcelona Supercomputing Center (BSC-CNS) la iniciativa ha crescut tant que ha assolit les 30.888 veus diferents enregistrades.

Aquesta dada suposa multiplicar per, pràcticament, cinc cops els números amb què comptava a l’inici de la seva posada en marxa. Dins del corpus de veus del Common Voice, el català és al segon lloc pel que fa a hores enregistrades i al tercer pel que fa a hores validades, només superat per l’anglès i el rus.

Entrant en detall de les característiques de les veus que s’hi han enregistrat, les diferències entre veus femenines i veus masculines s’han reduït, un comportament que ha ajudat a fer decréixer el baixi de gènere. Per edats, les franges en què menys representació s’ha aconseguit és la que abasta dels 10 als 19 anys i dels 20 fins als 29.

WhatsAppEmailTwitterFacebookTelegram