Investigadores de Yahoo desarrollan el detector de trolls online más potente hasta la fecha

Miguel Jorge
Posiblemente, una de las cosas más difíciles para cualquier web abierta al feedback de los usuarios es la detección de eso que llamamos comúnmente trolls, y con ello nos referimos a su vertiente más ofensiva, a aquellos que no entran a un debate, sino a crear un conflicto o a insultar y generar odio. Ahora esos comentarios ofensivos pueden tener su respuesta con el algoritmo creado por investigadores de Yahoo.

Un equipo de la compañía que ha construido una nueva herramienta de detección online. Para ello y como explican, han estado sondeando las profundidades de las secciones y foros de comentarios de la propia Yahoo. El fin: construir un algoritmo capaz de detectar y detener el abuso online que reina en muchas páginas.

En esencia se trata de un programa construido a partir de los comentarios ofensivos marcados por los propios editores de Yahoo. El equipo de investigación fue capaz de desarrollar un algoritmo que, según Technology Review, actúa como el filtro automático ante el abuso mejor construido hasta la fecha.

Desde Yahoo explican que la mayoría de filtros de abuso actuales se basan en una combinación de términos de una lista negra, expresiones comunes y pistas basadas en la sintaxis, todo ello con el fin de capturar las expresiones de odio en la red. Pero el equipo de Yahoo ha ido un paso más allá y ha desarrollado una especie de máquina de aprendizaje mediante su repositorio masivo de comentarios marcados como abusivos.

Usando una técnica que han denominado “word embedding”, el sistema es capaz de procesar palabras, es decir, que puede reconocer una cadena ofensiva de palabras en vez de un sola como la mayoría de filtros actuales, incluso si las palabras son inofensivas individualmente por su cuenta. De acuerdo al desarrollo, el sistema es capaz de identificar correctamente el lenguaje abusivo de un mismo conjunto (un chat por ejemplo) con un 90% de fiabilidad.

Una cifra impresionante, aunque como apuntan en Engadget, lo cierto es que la propia naturaleza cambiante de los lenguajes, igualmente de aquellos de carácter abusivo o de odio, hace muy difícil que esa cifra pueda llegar a una efectividad cercana al 100%.
Fuente: Engadget