1ra Edición

23 y 24 de Marzo 2020

Proyecto: Battling Fake News

Miembros: Andre, Fefe, Matt, Nacho

Presentación:

Presentación:

Descripción:

Este proyecto nace varios extraños unidos por #LHET con el interés común de aportar algo de soporte en tiempos de incerteza. En nuestro caso, el soporte tiene la forma de herramienta automática de valoración de confiabilidad sobre la información disponible. 

Si bien puede aplicarse a cualquier enlace de la red, la motivación surge del volumen y la velocidad de información que se transmite a raíz del brote COVID-19. Como la pandemia se combate con información, queremos que ésta sea de la mejor calidad posible.

Desafío/s:

El desafío es lograr construir herramientas automáticas de soporte para identificación de noticias falsas (fake news) para prevenir la des-información de la población y fomentar el acceso a fuentes de información responsables.

Problemática/s a resolver:

  • Queremos combatir la desinformación, la manipulación y las fake news, desenmascarándolas.
  • Queremos hacer que el público en general tenga herramientas de soporte para discernir mejor, identificando la información falsa, y evitar la continua divulgación irresponsable.

Descripción del proyecto (solución):

Trabajando inicialmente en una plataforma web de interfase al usuario:

  • Se invita a introducir un link de una noticia a evaluar. 
  • Se publican buenas prácticas y una guía para la utilización de la herramienta y generar un criterio propio de observación. 

Al ingresar el link en el campo de búsqueda, mediante un proceso interno, se generará como devolución un score (valor) de la noticia hasta el momento de la evaluación. Esta valoración sería indicativa de la confiabilidad del link.

El proceso interno consta de varios módulos de scoring en paralelo, siendo dos en una etapa inicial:

  • Módulo#1: Un bot es encargado de analizar todo tipo de conexiones hacia redes sociales que tenga la fuente y las personas involucradas (autor). En base a si las cuentas son verificadas (como ofrecen los servicios de IG, TW y FB) se le asigna un valor (SCORE por verificación) a esa URL.
  • Módulo#2: Se aplican algoritmos de ML sobre el cuerpo de la nota para identificar sentimientos (“sentiment analysis”). Si se detectan sentimientos en la redacción del mismo (por cuestiones de heurística, se excluyen los textuales de los entrevistados) se asignará un valor determinado (SCORE por sentimiento). Este análisis se realiza sobre un modelo entrenado de aprendizaje automático que es capaz de asignar valoraciones.

El valor final, o SCORE del URL, surge de combinar los valores individuales de cada proceso interno. Este valor se indicará gráficamente al usuario en la web.

Prototipo: check-fakes.herokuapp.com

GitHub: https://github.com/lohackeamosentretodos/LHET-Fake-News/

Future work:

  • Ampliar la base de datos de sitios verificados/no-verificados para mejorar la detección del modelo automático.
  • Contactarnos con chequeado.com (o sitios similares) y evaluar problemáticas y sinergias en conjunto.
  • Proveer una API para brindarla como servicio automatizado adicional a otros sitios que tienen procesamiento manual.
  • Agregar distintos módulos de scoring (incluyendo, por ejemplo, validación por expertos certificados).
  • Incorporar el congelamiento de noticias / sitios con archive.org (evitar mutación en cuerpos).
  • Ampliar el alcance a diversas plataformas, manteniendo el canal de contacto (por ej un bot de Whatsapp).