L'associació Softcatalà ha informat aquest divendres que gràcies a la «contribució desinteressada» de la comunitat catalanoparlant, el català ha superat les 1.000 hores enregistrades i les 900 hores validades al projecte Common Voice. A més, hi han participat el Barcelona Supercomputing Center i Política Lingüística de la Generalitat de Catalunya en l’elaboració i recopilació de textos per a enregistrar. El Common Voice és un «projecte clau per a garantir la presència del català en les noves tecnologies relacionades amb la veu, el reconeixement de la parla, la síntesi de veu, etc».

El projecte Common Voice és una iniciativa promoguda per la Fundació Mozilla, amb l’objectiu final d’aconseguir, entre altres coses, que la tecnologia i els aparells que funcionen amb ordres de veu reconeguin totes les llengües del món. D’aquesta manera, els assistents virtuals, els navegadors GPS i totes les tecnologies que utilitzen reconeixement o síntesi de veu podran entendre i parlar, entre d’altres, el català.

En què es basa el Common Voice?

Crea una base de dades composta per parells d’elements relacionats: texts curts i talls de veu amb la lectura d’aquests texts. D’aquesta manera, si la base de dades de parells text-veu és prou gran, es pot utilitzar per a entrenar intel·ligències artificials relacionades amb el reconeixement de la parla, la síntesi de veu, etc. I com que és una base de dades oberta a tothom, qualsevol particular o empresa pot aprofitar-la per a incloure-la en els seus productes.

Podeu contribuir a fer créixer aquesta base de dades participant en el portal web gamificat del Common Voice en català.

La presència del català al Common Voice

La gran presència del català al Common Voice (posicionat entre les primeres quatre llengües durant molt de temps) ha portat a molts investigadors de fora a considerar el català en la seva recerca. El conjunt de dades de veu en català es pot fer servir per a moltes altres coses, a banda dels models de reconeixement de la parla

Softcatalà, una associació que fa feina per la normalització del català

Softcatalà és una associació sense afany de lucre que treballa per la normalització de la llengua catalana. Promouen el català en el sector informàtic, Internet i les noves tecnologies, a partir de la traducció de programari lliure i de distribució gratuïta.