Modelo para identificar noticias falsas procesando datos textuales y visuales

Modelo para identificar noticias falsas procesando datos textuales y visuales

Comparta este Artículo en:

La llegada de Internet ha cambiado la forma en que las personas acceden y comparten información, lo que facilita que individuos malintencionados difundan noticias sesgadas, poco fiables o falsas.

Los recientes avances tecnológicos, incluidos los modelos de inteligencia artificial (IA) que pueden generar textos realistas, grabaciones de audio e imágenes, están contribuyendo aún más a esta ola de desinformación.

En los últimos años, distinguir las noticias reales de las falsas se ha vuelto cada vez más difícil, lo que crea el caldo de cultivo perfecto para la ignorancia, la confusión y la polarización.

Por lo tanto, es de crucial importancia desarrollar herramientas efectivas para identificar y eliminar rápidamente las noticias falsas en línea de los sitios web y motores de búsqueda populares.

Investigadores de la Universidad Nacional Yang Ming Chiao Tung, la Universidad Chung Hua y la Universidad Nacional Ilan desarrollaron recientemente un nuevo modelo multimodal que podría ayudar a detectar rápidamente las noticias falsas en línea.

“La literatura existente se centra principalmente en el análisis de las características individuales de las noticias falsas, pasando por alto el reconocimiento de la fusión de características multimodales“, escribieron Szu-Yin Lin, Yen-Chiu Chen y sus colegas en su artículo.

“En comparación con los enfoques monomodales, la fusión multimodal permite una captura más completa y enriquecida de información de diferentes modalidades de datos (como texto e imágenes), mejorando así el rendimiento y la eficacia del modelo.

Este estudio propone un modelo que utiliza la fusión multimodal para identificar noticias falsas, con el objetivo de frenar la desinformación”.

Para mejorar la detección de noticias falsas, Lin, Chen y sus colegas se propusieron desarrollar un modelo alternativo que analizara simultáneamente las características textuales y visuales de las noticias en línea.

El modelo que desarrollaron comienza limpiando los datos, para luego extraer estas características de los datos limpios.

El modelo de los investigadores integra información textual y visual utilizando varias estrategias de fusión, incluidas las técnicas de fusión temprana, fusión conjunta y fusión tardía.

En las pruebas iniciales, se descubrió que este enfoque multimodal funcionaba notablemente bien, detectando noticias falsas mejor que las técnicas monomodales bien establecidas, incluido BERT.

El modelo multimodal del equipo se probó en los conjuntos de datos Gossopcop y Fakeddit, que a menudo se utilizan para entrenar modelos para la detección de noticias falsas.

En estos mismos dos conjuntos de datos, se había descubierto anteriormente que los modelos monomodales detectaban noticias falsas con una precisión insatisfactoria del 72 % y el 65 %, respectivamente.

“El marco propuesto procesa la información textual y visual mediante la limpieza de datos y la extracción de características antes de la clasificación“, escribieron Lin, Chen y sus colegas.

“La clasificación de noticias falsas se logra mediante un modelo que alcanza una precisión del 85% y el 90% en los conjuntos de datos Gossipcop y Fakeddit, con puntuaciones F1 del 90% y el 88%, lo que demuestra su rendimiento.

“El estudio presenta resultados a lo largo de diferentes períodos de entrenamiento, lo que demuestra la eficacia de la fusión multimodal al combinar el reconocimiento de texto e imágenes para combatir las noticias falsas”.

Los prometedores hallazgos recopilados por Lin, Chen y sus colegas resaltan el potencial de los modelos de fusión multimodal para la detección de noticias falsas.

Por lo tanto, podrían alentar a otros equipos a desarrollar modelos similares que se basen en múltiples modalidades.

En el futuro, el nuevo modelo también podría probarse en más conjuntos de datos y datos del mundo real.

Con el tiempo, podría contribuir a los esfuerzos mundiales destinados a abordar y reducir la desinformación en línea.

Fuente: Sage Journals

 

Leave a Reply

Your email address will not be published. Required fields are marked *