cielo claro
  • Màx: 29°
  • Mín: 29°
29°

Paraules embullades

Afortunadament encara hi ha moltes coses que els ordinadors no poden fer i que els humans sí podem. Entre aquestes destaca la capacitat que tenim per a interpretar escrits que estiguin embullats, sigui perquè es tracti d'una cal·ligrafia difícil, o bé perquè el text estigui "brut" per mor d'una impressió defectuosa. Aquest fet és emprat -diuen que més de dos-cents milions de vegades cada dia- per a evitar que els (ro)bots -és a dir, programes informàtics que imiten comportament humans- facin segons quines feines, i és per això que molts llocs web demanen que interpretem un d'aquests texts embullats. Aquesta ha estat una forma efectiva per lluitar contra pràctiques com la del correu brossa. CAPTCHA en diuen d'aquesta prova, un nom que ve de les sigles angleses de test de Turing completament automatitzat per a distingir humans i ordinadors.

Els autors del CAPTCHA varen descobrir que, encara que la seva execució només suposa uns deu segons, la gran quantitat d'usuaris que el fan servir, significa una animalada de temps tudat i, per això mateix, varen començar a donar voltes a la idea de com aprofitar aquest temps i així van descobrir que hi havia un sector important que tenia un problema similar. Es tractava dels projectes de digitalització de llibres i documents, els quals primer escanegen les planes de text i, després, un programa de reconeixement de caràcters converteix les imatges en text. En aquest procés apareixen molts fragments embullats, que els programes no poden interpretar. És així que varen idear una modificació de la prova, reCAPTCHA, que per comptes de presentar un text embullat, en presenta dos: un que serveix per a comprovar que es tracta d'un humà i l'altre que prové d'un d'aquests projectes de digitalització que no ha pogut ser interpretat automàticament i que, d'aquesta manera, és interpretat per un humà.
És així, que sense que en siguem conscients, cada vegada que omplim un reCAPTCHA estem col·laborant de manera desinteressada en un d'aquests projectes de conservació del patrimoni cultural mitjançant la digitalització de texts. Una col·laboració de milions de persones que només és possible gràcies a Internet i que, de passada, ens dóna una idea que, com va dir Vannevar Bush cap allà els anys 40, l'únic límit és el de la nostra imaginació. I això que Internet encara no existia.
Vicerector de la UOC

COMENTARIS

De moment no hi ha comentaris.

Comenta

* Camps obligatoris