viernes, 11 de noviembre de 2011

Escriba los caracteres de la imagen


No debe ser nada fácil soportar que miles de presonas odien algo que uno ha hecho. Todos hemos rellenado algun formulario en internet e introducir unas letras distorsionadas. Todos odiamos eso.

Luis von Ahn lo tiene asumido: su invento es sumamente antipático. Luis von Ahn es el creador de la prueba desafío-respuesta captcha, esa misma que nos hace perder 10 segundos de nuestras vidas en cada oportunidad que la enfrentamos.
image
Imagen en desenredandolared
Pues la historia real es más bella, incluso romantica.
El momento de interpretar la imagen distorsionada de un conjunto de caracteres (letras y números) para enviarlos y demostrar que somos humanos es uno de los más antipáticos de los protocolos de uso de Internet. El sistema es es definitivamente una pérdida de tiempo que resulta inevitable para el buen funcionamiento de tantas webs (protege a unas 100.000 páginas web del fraude y el spam). Lo que no sabemos es que hay algo productivo cuando interpretamos y tecleamos los extraños caracteres: estamos colaborando para digitalizar libros.
Von Ahn creó el sistema captcha, y se lo vendió a Google en su evolución reCaptcha. Y Google, hoy utiliza el sistema para completar su proyecto de digitalización de libros, un proyecto en el que sin saberlo, participamos millones de personas a diario. Se estima que 200 millones de odiosos captcha son completados en un día, lo que suma (a un promedio de 10 segundos por captcha) unas 500 mil horas diarias.
Resulta que los sistemas que escanean libros antiguos de forma automática para digitalizarlo, no son perfectos: en el reconocimiento óptico de caracteres (OCR) pueden tener dificultades para “interpretar” ciertas palabras impresas con tinta borrosa, o gastadas, una dificultad que suele alcanzar el 30% de lo escrito.
La idea genial es mostrar esas palabras distorsionadas que las computadoras no saben interpretar a través de las pruebas captcha. Una palabra no reconocida en la parte automática de la digitalización, pasa a la base de datos de Recaptcha, que se las muestra a algún usuario que “inocentemente” la interpreta, la teclea, y la envía. Cuando varios usuarios coinciden al interpretar el mismo captcha, la palabra queda confirmada y digitalizada completando algún fragmento de un libro.

Ésto también explica la razón por la que el sistema recaptcha nos muestra dos palabras a la hora de determinar si no somos un robot: una es para hacer el control “antirobots” tradicional, y la otra una palabra para digitalizar en algún libro. El problema es que no sabremos cual es cual.

Von Ahn explica que con éste mecanismo se están digitalizando alrededor de 100 millones de palabras diarias, o lo que se traduce, suma dos millones de libros al año. Para más cifras, 900 millones de personas estamos a diario ayudando a digitalizar libros mientras respondemos a un reCaptcha.
Queda por explicar cuanto dinero le hubiese salido a Google completar la digitalización de libros a través de trabajadores a sueldo, pero hay que reconocerlo, al menos, al pasar por una prueba captcha, nos sentiremos más útiles.

 Fuente: matiascallone.blogspot.com

1 comentario:

  1. Ya lo dice bien claro el CAPTCHA: "stop spam, read books" :)

    ResponderEliminar

Related Posts Plugin for WordPress, Blogger...

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | JCPenney Coupons