El vicepresident Jordi Puigneró en la presentació del projecte AINA [Foto: Govern]

El projecte AINA ha assolit el més d’un milió de talls de veu registrats (1.006.000) i 2.400 hores gravades des de la seva posada en marxa el mes de febrer. Amb l’objectiu d’ensenyar el català a les màquines i que l’entenguin i l’utilitzin, l’AINA ha situat el català com la segona llengua més emprada a la base de dades Common Voice, només superada per l’anglès.

L’AINA requereix la participació de les veus dels ciutadans catalans per construir el corpus de veu que posteriorment necessita una màquina. D’aquesta manera, la Generalitat de Catalunya ha fet una crida per tal que els ciutadans llegeixin, enregistrin i validin unes frases que s’agrupen en grups de cinc a Common Voice. Fet aquest procés, ja s’han superat les 2.000 en menys de mig any.

Segons els talls de veu enregistrats, el perfil que es repeteix més és el d’homes d’entre 40 i 59 anys que parlen el català central. La recomanació que fan els impulsors de la iniciativa és que els usuaris es registrin per a poder aconseguir una millor classificació de les dades, i és que el 38% dels participants no s’ha pogut identificar el gènere, l’edat i la variant dialectal.

WhatsAppEmailTwitterFacebookTelegram