Google desarrolla un algoritmo capaz de resolver el 99,8% de sus propios reCAPTCHAs

Google ha revelado el desarrollo de un algoritmo capaz de leer con excepcional exactitud los números de las calles capturadas en Street View. El problema es que al mismo tiempo logra resolver con un 99,8% de precisión los CAPTCHAs usados en la Red para evitar bots y spam. Esto pone en riesgo a una medida de seguridad que la propia Google utiliza con reCAPTCHA.

El algoritmo (pdf) desarrollado conjuntamente por los equipos de Street View y reCAPTCHA lee correctamente los números completos de las calles en un 90% de los casos, llegando a un 97,84% de aciertos con dígitos aislados en condiciones ideales. Según los encargados del proyecto, este tipo de reconocimiento en fotografías suele ser un problema difícil de resolver debido a las variaciones de luz y enfoque.

Para probar el algoritmo, los chicos de Mountain View lo utilizaron sobre los textos distorsionados digitalmente que utiliza su servicio reCAPTCHA, obteniendo una sorprendente tasa de aciertos que supera a la de los usuarios humanos. Dado que el funcionamiento de los CAPTCHAs se basa en la idea de que un ordenador no es capaz de resolver el puzle, el hito del algoritmo compromete en cierta medida la barrera de seguridad para evitar automatizaciones indeseadas en Internet.

Vinay Shet, jefe del proyecto y del equipo de reCAPTCHA, escribe en el blog de Google: "Gracias a esta investigación, sabemos que basarnos exclusivamente en texto distorsionado no es suficiente. Sin embargo, es importante aclarar que identificar de forma correcta el texto en los puzles CAPTCHA no significa que reCAPTCHA en sí mismo esté roto o sea inefectivo. Al contrario, este descubrimiento nos ha ayudado a construir medidas de seguridad adicionales contra impostores en reCAPTCHA".

Shet explica que reCAPTCHA se basa cada vez menos en los textos distorsionados para diferenciar entre humanos y máquinas. En vez de eso se utiliza un "análisis de riesgo avanzado" que tiene en cuenta la interacción completa del usuario con el puzle a descifrar.
A ver si por lo menos esto significa el fin de los captchas y la implementación de un sistema menos coñazo...
A mí los reCaptcha me han hecho descubrir que soy más máquina que humano, soy un androide al que le han ocultado su naturaleza porque fallo como un cochino un montón de veces al poner los recaptchas estos.
Espero que alguien les robe el algoritmo ese y lo publique. Odio los captchas [+furioso]
Deberian encontrar una manera menos mierdosa de distinguir entre humano y no humano...
O sea, que aparte de molestar al usuario, los capchas estos no sirven para nada...
Yo a veces pienso que soy una máquina (o gilipollas XD) pq hay algun captcha que ni yo soy capaz de ver XDDD
hombre ya solo faltaba que ni resolviesen los suyos propios
A ver si se filtra el algoritmo y hacen algún programa para solucionarlos, algunos no hay manera de verlos.
Yo no llego a ese porcentaje de resolución ni de coña [qmparto]
A ver si hay suerte y se lo roban (crucemos los dedos...)
Los que estais diciendo que sois "mas maquinas" por fallar los captchas lo estas diciendo al reves. En todo caso sois mas humanos por fallarlos.
De hecho la noticia textualmente dice:
obteniendo una sorprendente tasa de aciertos que supera a la de los usuarios humanos.



El maquina seria el que no haya fallado nunca un captcha xD
Yo tengo entendido que el recaptcha de Google se basa en dos imágenes: un texto distorsionado intencionadamente y luego una imagen sacada de Google Street o un libro. El segundo siempre es más fácil de resolver, de hecho creo que es a lo que se refieren que resuelven. Pero el primero también lo resuelven?
Menuda basura esto de los capchat de lo coj..... ojala los quitaran para siempre [+furioso] [+furioso]
Haber si lo publican q es un rollo de mucho cuidado.
Haces uno que diga .... de que color es el caballo blanco de santiago .... y un cuadro de respuesta ... y no acierta ni de coña.

Si haces uno en el que tengas que hacer un calculo matematico, no lo acierta ni de coña (pero no un 2+2, un "uno mas tres restando uno)

En fin ... es como los captcha de voz ... yo los activo porque los de escritura son un coñazo
Pues yo nunca me equivoco al ponerlos y me encantan ZzzZZ
Como siempre, este tipo de cosas hay que cogerlas con pinzas..

Primero necesitan tirar de millones de imagenes similares para entrenar la red. En un entorno mas "real" habria que ver si es tan sencillo conseguir eso a la hora de intentar romper un "reCAPTCHA" concreto.

Luego habria que ver que es lo que se entiende por "the hardest CAPTCHA", y hasta que punto el hecho de que los hayan creado para el experimento influye. Y no estaria mal ver algo mas "de chicha" explicando como han hecho el experimento (que aparte del numerito 99.8%, dicen bien poco...) y ver como funcionan otros tipos de redes en el mismo problema.... siendo justos, el resto de experimentos/resultados que muestran en el trabajo son mucho mas interesantes ;)
Ojalá reventasen en serio los dichosos captcha, son lo más asqueroso que hay en internet.
dextertru escribió:Haber si lo publican q es un rollo de mucho cuidado.


No soy de los que suelen ecribir, pero con los anos(perdón, estoy en el trabajo y estos teclados alemanes no tienen ene de espana) que llevo leyendo este tipo de errores... ya cansa.

Respecto a la noticia, me parece que con esto lo unico que lograran es darnos mas por C** con los captchas.
Ahora entiendo porque en muchos recaptchas en vez de números por ordenador me salían fotos de números de portales, nosotros hemos ayudado también a google en el proyecto sin darnos cuenta.

Por cierto: ALT + 164 = ñ
exitido escribió:Por cierto: ALT + 164 = ñ

Gracias!! XD
Hombre, decir que los Captchas son inútiles, me parece de ignorantes.
Si no sabéis su utilidad vale, pero no habléis sin saber.
Ese algoritmo somos nosotros al resolver los captchas, fijense que ultimamente son todos numeros de casas. El sistema genera un numero y pone foto de un numero que no reconoce, nosotros al cargar el capcha del primero el sistema sabe que somos humanos y toma lo que ponemos del segundo para su negocio que es lo que les importa.
KenPo escribió:A ver si por lo menos esto significa el fin de los captchas y la implementación de un sistema menos coñazo...


Marcar dibujos puede ser una opción (sencillez) pero piensa que también mucho más fácil de reventar.

Está claro que llegó su hora... pero miedo me da el próximo sistema
Edy escribió:Haces uno que diga .... de que color es el caballo blanco de santiago .... y un cuadro de respuesta ... y no acierta ni de coña.

Si haces uno en el que tengas que hacer un calculo matematico, no lo acierta ni de coña (pero no un 2+2, un "uno mas tres restando uno)

En fin ... es como los captcha de voz ... yo los activo porque los de escritura son un coñazo



Hombre, si pones un calculo matemático que no sea un 2+2, igual un 40% de la población mundial tampoco podrá resolverlo xd
exitido escribió:Ahora entiendo porque en muchos recaptchas en vez de números por ordenador me salían fotos de números de portales, nosotros hemos ayudado también a google en el proyecto sin darnos cuenta.

Por cierto: ALT + 164 = ñ


Yo no. Siempre pongo nigger [hallow]
Pues no sé yo, pero el algoritmo no me suena tan novedoso. El tema de las redes neuronales entrenadas es algo viejuno ya.
albion_land escribió:Pues no sé yo, pero el algoritmo no me suena tan novedoso. El tema de las redes neuronales entrenadas es algo viejuno ya.


Supongo que la gracia estara en el "extractor de features" que mencionan al final (el deep convolutional feature extraction). El resto parece "machine learning" basico.
Como los odio siempre tengo que ponerlos mil veces xD
En el jdownloader no sacaron un plugin que descifraba los recaptcha?
DemonR escribió:
albion_land escribió:Pues no sé yo, pero el algoritmo no me suena tan novedoso. El tema de las redes neuronales entrenadas es algo viejuno ya.


Supongo que la gracia estara en el "extractor de features" que mencionan al final (el deep convolutional feature extraction). El resto parece "machine learning" basico.


Puede ser, sí :)
Llevo rellenando mal intencionadamente los captchas de recaptcha desde que el mundo es mundo (me refiero a la parte colaborativa, no a la de control, que la hay que poner bien si o si). Hay veces que lo dejo en blanco, hay veces que pongo palabras que difieren ligeramente de la que és (lo mismo con números de portal), hay veces que pongo chorradas sin sentido y hay veces que pongo el clásico "nigga" popularizado por 4chan.
Los ordenadores se diseñaron para hacer rapidamente las tareas que resultan tediosas y complicadas para las personas ¿En que momento los de google decidieron cambiar las tornas y hacer que las personas hiciesen las tareas que resultaban tediosas y complicadas para los ordenadores?
Markuf escribió:Deberian encontrar una manera menos mierdosa de distinguir entre humano y no humano...


Estoy de acuerdo contigo. Debe haber otro método menos coñazo.

Un saludo.
Ya era muy fácil trollear el 90% de los sistemas captcha. LA mayoría sólo validan con una palabra, en la otra puedes inventarte lo que quieras XD
jcesar escribió:En el jdownloader no sacaron un plugin que descifraba los recaptcha?

Yo lo use.
Si es lo que yo usaba los descifraban humanos.
Cuando te salia un captcha esa foto era enviada a un usuario y ese usuario lo descifraba por ti ganando puntos. Digamos que ese usuario descifraba caotchas durante media hora mientras hace otras cosas en su pc y ha ganado 1000 puntos.
Esos 1000 puntos le sirven para que cuando le salgan a el 500 captchas en el jdownloader, enviarlos a otros usuarios para que londescifren por el.
exitido escribió:
jcesar escribió:En el jdownloader no sacaron un plugin que descifraba los recaptcha?

Yo lo use.
Si es lo que yo usaba los descifraban humanos.
Cuando te salia un captcha esa foto era enviada a un usuario y ese usuario lo descifraba por ti ganando puntos. Digamos que ese usuario descifraba caotchas durante media hora mientras hace otras cosas en su pc y ha ganado 1000 puntos.
Esos 1000 puntos le sirven para que cuando le salgan a el 500 captchas en el jdownloader, enviarlos a otros usuarios para que londescifren por el.

Pero al final tienes que resolver el doble de captchas que tendrias que resolver haciendolo a mano
Ah, vale, que no lo llegue a usar, pensaba que era automático
creo que la mayoria que ha posteado no entiende la seriedad de esta noticia...
campa1980 escribió:creo que la mayoria que ha posteado no entiende la seriedad de esta noticia...

O la entiende y no le da importancia.
exitido escribió:Ahora entiendo porque en muchos recaptchas en vez de números por ordenador me salían fotos de números de portales, nosotros hemos ayudado también a google en el proyecto sin darnos cuenta.

Por cierto: ALT + 164 = ñ

Ya me parecía raro esos numeros con foto real...
DRaGMaRe escribió:Hombre, decir que los Captchas son inútiles, me parece de ignorantes.
Si no sabéis su utilidad vale, pero no habléis sin saber.

Si no recuerdo mal, una de sus utilidades era que las palabras que nos salen en los captchas son sacadas de libros antiguos que se están digitalizando pero que un ordenador por x motivos (tinta medio borrada, caligrafía... a saber) no reconoce. Nos la ponen a nosotros que sí lo hacemos (aunque a veces cuesta :P), para ir digitalizando esos libros.

Supongo que habrá más, aunque esta fue la primera creo...así que un +1 enorme para ti.
campa1980 escribió:creo que la mayoria que ha posteado no entiende la seriedad de esta noticia...


Yo lo que entiendo es que Google it's ha conseguido lo que pretendida con los captchas, nosotros solo los estábamos entrenando y ahora ya no nos necesitan
Para evitar robots pues tendrán que inventar otro sistema
Si es capaz de diferenciar una I de una l, Skynet está cerca.
nekuro escribió:
exitido escribió:
jcesar escribió:En el jdownloader no sacaron un plugin que descifraba los recaptcha?

Yo lo use.
Si es lo que yo usaba los descifraban humanos.
Cuando te salia un captcha esa foto era enviada a un usuario y ese usuario lo descifraba por ti ganando puntos. Digamos que ese usuario descifraba caotchas durante media hora mientras hace otras cosas en su pc y ha ganado 1000 puntos.
Esos 1000 puntos le sirven para que cuando le salgan a el 500 captchas en el jdownloader, enviarlos a otros usuarios para que londescifren por el.

Pero al final tienes que resolver el doble de captchas que tendrias que resolver haciendolo a mano

Cierto es, pero puedes dejar el ordenador descargando y pirarte o echarte a dormir luego.
campa1980 escribió:creo que la mayoria que ha posteado no entiende la seriedad de esta noticia...


A que te refieres con "seriedad de esta noticia" ? :-?

Yo solo veo que han inventado un sistema OCR "next-gen" pues bien por ellos. Pero de aqui a que Skynet gobierne el mundo y envíe Terminators para matarnos a todos aún falta XD
Las Captchas son un coñazo, ojala desaparezcan.
anael escribió:Las Captchas son un coñazo, ojala desaparezcan.

Los captchas son necesarios, para evitar cyberataques, ocupacion masiva de nombres y demás prácticas poco éticas que llevan a cabo algunos hackers. Aunque a dia de hoy sew utilizan en su mayoría para que los usuarios normales se ciñan a lo que el diseñador del sistema ha establecido.
Pues a mí me parece fascinante el ingenio de esta gente para diseñar algo así... Las Captchas me traen sin cuidado. Siempre las fallo.
Los CAPTCHAs son un coñazo algunas veces no se ven bien y vuelta meterlos, otras veces son alfanuméricos kilométricos, serán una seguridad pero joden un montón. XD
53 respuestas
1, 2