Exploiting discourse structure of traditional digital media to enhance automatic fake news detection

Publicaciones

Este artículo presenta una arquitectura novedosa para hacer frente a la detección automática de noticias falsas. La arquitectura incide en la estructura del discurso de las noticias en los medios digitales tradicionales y se basa en dos premisas. Primero, las noticias falsas tienden a mezclar información verdadera y falsa con el propósito de confundir a los lectores. En segundo lugar, esta investigación se centra en las noticias falsas entregadas en los medios digitales tradicionales, por lo que nuestro enfoque considera la influencia de la estructura periodística de las noticias y la forma en que los periodistas tienden a introducir el contenido esencial en una noticia –utilizando respuestas 5W1H–. Considerando ambas premisas, esta propuesta trata los componentes de la noticia por separado porque algunos pueden ser verdaderos o falsos, en lugar de considerar el valor de veracidad del artículo como una unidad. Se propone una arquitectura de dos capas, capas Estructura y Veracidad. Para demostrar la validez de la propuesta, se creó un nuevo conjunto de datos y se anotó con un nuevo esquema de anotación de grano fino (FNDeepML) que considera los diferentes elementos del documento de noticias y su veracidad. Debido a la gravedad de la crisis pandémica COVID-19, la salud es el dominio elegido y el español es el idioma utilizado para validar la arquitectura, dada la falta de investigación en este idioma. Sin embargo, la propuesta se puede aplicar a cualquier otro idioma o dominio. El rendimiento de la capa de veracidad de nuestra propuesta, que tiene en cuenta la estructura tradicional del artículo de noticias y la anotación 5W1H, es capaz de ofrecer un resultado de F= 0,807. Esto representa una fuerte mejora en comparación con la línea de base, que utiliza todo el documento con un solo valor de veracidad, obteniendo F= 0,605. Estos hallazgos validan la idoneidad y eficacia de nuestro enfoque.

Cita Bibliográfica: https://doi.org/10.1016/j.eswa.2020.114340

Autores: Bonet-Jover Alba | Piad-Morffis, Alejandro | Saquete, Estela |  Martínez-Barco, Patricio | Carcía-Cumbreras, Miguel Ángel

URL: https://www.sciencedirect.com/science/article/pii/S0957417420310277