muy nuboso
  • Màx: 25°
  • Mín: 19°
21°

Amb més de 3.000 hores enregistrades, el català és la segona llengua amb més presència al Common Voice

212179

El català ha superat aquest dimarts les 3.000 hores de talls de veu enregistrades al repositori digital de Common Voice, i ja es troba a només 200 hores de substituir l'anglès com la llengua amb més hores gravades en aquest projecte impulsat per Mozilla Foundation.

El català ja era la segona llengua amb més hores enregistrades des de fa uns mesos i aquest mes també ha superat el ruandès com a segona llengua amb més hores validades.

La Plataforma per la Llengua ha celebrat l'efemèride i ha assenyalat s'implicarà a partir d'ara en la recollida de veus per tal de facilitar que les empreses puguin incorporar el català com a llengua de reconeixement i reproducció de veus en els electrodomèstics i en altres objectes d'ús quotidià amb intel·ligència artificial.

Common Voice és un projecte digital que vol forjar un repositori de talls de veu de totes les llengües del món a partir de la col·laboració voluntària de persones que facin la seva aportació de veu o validin l'enregistrament d'altres persones. Aquesta base de dades lliure està segmentada per gènere, edat i variant dialectal, i permet descarregar les veus a qui vulgui desenvolupar i millorar programaris de reconeixement de parla, com ara robots domèstics o assistents de veu. La descàrrega d'aquestes veus es pot fer de manera gratuïta i en llicència CC0, l'oferiment al domini públic sense drets d'explotació. Common Voice, que ja compta amb 136 llengües, va ser creat l'any 2017 per Mozilla Foundation i ha estat impulsat als territoris de parla catalana per Softcatalà. Posteriorment, el 2020, es va integrar com a eix de treball del projecte Aina, una iniciativa de la Generalitat de Catalunya i el Barcelona Supercomputing Center, amb la col·laboració del Govern de les Illes Balears, que el va fer créixer de manera significativa.

Amb l'objectiu de fer créixer encara més el català a Common Voice, la Plataforma per la Llengua impulsarà una campanya per a aconseguir moltes més donacions de veu i fer que, a curt termini, el català assoleixi la primera posició en la classificació de llengües amb més hores enregistrades. Per tal d'aconseguir prou representació d'aquells dialectes, gèneres i grups d'edat infrarepresentats fins ara a la base de dades, la campanya combinarà una forta activitat digital amb actes presencials de recollida de veu que facilitaran que aquelles persones més allunyades del món digital també puguin participar-hi. Això permetrà, per exemple, augmentar el percentatge de veus de gent gran a la base de dades.

Els detalls de la campanya es faran públics aviat, però ja han anunciat que arrencarà el divendres 14 d'abril al Palau Blaugrana, en el marc del partit de l'Eurolliga de bàsquet Barça-València, i que continuarà amb un segon gran acte durant el partit de lliga entre el Barça i el Reial Madrid.

Comenta

* Camps obligatoris

Comentaris

De moment no hi ha comentaris.