Mitjans de l’AMIC visiten el BSC-CNS [Foto: BSC-CNS]

El Barcelona Supercomputing Center (BSC-CNS) i l’Associació de Mitjans d’Informació i Comunicació (AMIC) han signat un acord perquè els mitjans de comunicació associats cedeixin dades al BSC per a entrenar els seus models de llenguatge. Així, les tretze capçaleres signants permetran l’accés a la seva web i els seus continguts, ajudant a desenvolupar una IA eficaç i òptima en català.

El BSC disposa d’una unitat especialitzada en tecnologies del llenguatge amb projectes com Aina i ALIA i treballa amb bases de dades de diferents entitats i organismes, sobretot de mitjans de comunicació, amb què entrena models de llenguatge amb un percentatge alt de català. Amb el nou acord, l’objectiu és fomentar la pervivència de la llengua catalana en l’àmbit digital.

L’equip de dades del Laboratori de Tecnologies del Llenguatge del BSC vol reunir el màxim volum de textos en català per entrenar grans models de llenguatge amb dades que es consideren no personals. En el cas del català, cada cop es compta amb més dades sintètiques generades per models, però calen dades generades per humans, claus a l’hora d’alleugerir els problemes que causen les primeres.

El projecte Aina viatjarà a la trobada internacional més important de tecnologies de veu en intel·ligència artificial
WhatsAppEmailTwitterFacebookTelegram