Skip to main content
VIII Congreso Internacional de la AE-IC, Barcelona 2022

Programa completo »

Diferido - Desarrollo y evaluación de detectores de discurso de odio por razones racistas/xenófobas, ideológicas y de género y orientación sexual, usando clasificación supervisada de textos

La propagación del discurso de odio en línea es un tema de creciente preocupación, ya que en la actualidad los entornos digitales y, en especial, redes sociales como Twitter, proporcionan el canal más adecuado para su difusión rápida, descontrolada y masiva. Además, en la actualidad se sabe que el aumento de este ciber-odio puede relacionarse con el incremento de los crímenes de odio cometidos en el entorno físico, entendiéndose como un paso previo o detonante en esa escalada de violencia. Por esta razón, son varios los autores que ya están trabajando en el desarrollo de prototipos que permitan la detección de este tipo de odio de forma automática y a gran escala. Sin embargo, casi todos ellos trabajan en inglés, y muy pocos se centran en categorías específicas de discriminación y de forma aislada, como el racismo y la xenofobia, la ideología política, o orientación sexual y la identidad de género, las 3 principales categorías de discriminación en las que se registran más delitos de odio al año en España y en la mayoría de los países occidentales. Casi todos los autores que han desarrollado detectores automáticos de ciber-odio hasta el momento han intentado hacerlo de manera general, entrenando sus modelos para detectar todos los niveles y tipos de odio, por todo tipo de motivaciones, y contra todo tipo de públicos. Este es un enfoque demasiado ambicioso y que puede generar problemas de validez internos que resulten en clasificadores poco precisos y fiables. Además, en el desarrollo y entrenamiento de esos prototipos, en pocas ocasiones se han usado corpus desarrollados ad-hoc y generados manualmente por varios codificadores entrenados, sino que, en la mayoría de los casos, se han usado diccionarios lexicón o bases de datos previamente disponibles. Este trabajo tiene como objetivo superar las limitaciones de todos esos trabajos anteriores, desarrollando y evaluando diferentes prototipos de detección de discurso de odio motivado por razones racistas y/o xenófobas, por ideología política, y por razones de género y orientación sexual, propagado a través de Twitter en español. Para ello se han generado ad-hoc 3 corpus de entrenamiento específicos y diferenciados, uno por cada una de las 3 categorías de odio, haciendo uso de técnicas de clasificación manual por pares entrenados. Para la generación de los modelos predictivos finales se ha desarrollado una estrategia computacional basada en técnicas de aprendizaje automático supervisado, y utilizando modelado superficial, pero también aprendizaje profundo, lo que ha permitido mejorar el rendimiento de los algoritmos tradicionales en tareas de clasificación de textos. Los modelos desarrollados presentan unas métricas de evaluación óptimas al ser testeados con el propio corpus, y actualmente están siendo validados con muestras externas para comprobar que el rendimiento con nuevos casos reales también es aceptable.

Javier J. Amores
Universidad de Salamanca
España

Maximiliano Frías Vázquez
Universidad de Salamanca
España

 


Patrocinado por OpenConf®
Derechos de autor ©2002-2020 Zakon Group LLC