La IA y las fuentes originales
Aunque los sistemas de inteligencia artificial suelen encontrar información precisa, todavía presentan dificultades para identificar y atribuir correctamente las fuentes primarias, un aspecto fundamental para el trabajo periodístico.
Un estudio reciente titulado “Journo Bench: Which AI Research Agents Can a Newsroom Trust to Source a Story?”, elaborado por Danny Bellion y Peter Stuart, de Velora, y publicado por la Fundación Luca de Tena de España, evaluó nueve herramientas de investigación asistida por IA utilizando treinta acontecimientos periodísticos recientes. El objetivo fue medir no solo la capacidad de encontrar información relevante, sino también de localizar la fuente original y atribuir correctamente los datos utilizados.
Uno de los hallazgos más relevantes fue la detección de un fenómeno que los autores denominan “blanqueo de hechos”. Esto ocurre cuando una herramienta accede a la fuente primaria de una información, extrae correctamente los datos, pero termina atribuyéndolos a una fuente secundaria, como una nota periodística, un blog o una publicación que reproduce el contenido original.
Para las redacciones, este problema es especialmente importante porque una noticia no requiere únicamente datos correctos, sino también una procedencia verificable.
Según los investigadores, una IA puede proporcionar cifras, fechas o declaraciones precisas y, al mismo tiempo, dificultar el proceso de verificación si esos datos no aparecen vinculados al documento original que los respalda.
A diferencia de otras evaluaciones centradas únicamente en la exactitud de las respuestas, Journo Bench analizó cuatro aspectos clave: la capacidad de alcanzar la fuente primaria, la recuperación de datos y citas esenciales, la correcta atribución de los hechos y la ausencia de errores factuales.
Para ello se utilizaron treinta casos reales basados en noticias recientes, cada uno respaldado por una fuente primaria claramente identificable, como comunicados oficiales, documentos regulatorios, publicaciones directas o informes corporativos. Cada herramienta fue sometida dos veces a los mismos casos para obtener resultados comparables.
Según los datos publicados, GPT-5.5 obtuvo la puntuación más alta, con un 81% del total posible. Velora quedó en segundo lugar con un 77%, seguida por GPT-5.4 (71%), Gemini 3.5 Flash (70%), Gemini 3.1 Pro (68%), Claude Sonnet 4.6 (62%) y Claude Opus 4.8 (60%). Más atrás se ubicaron Perplexity Sonar Pro (35%) y Linkup (29%).
Los investigadores señalan que las diferencias no se explican únicamente por la capacidad de encontrar información relevante. De hecho, todos los sistemas lograron recuperar los hechos principales con relativa frecuencia. Las mayores diferencias aparecieron en las tareas más sensibles para el periodismo: localizar el documento original y atribuir correctamente cada dato.
GPT-5.5, GPT-5.4 y Velora alcanzaron la fuente primaria en el 87% de los casos analizados. GPT-5.5 también lideró en atribución correcta, con un 83%, seguido por GPT-5.4 (77%) y Velora (73%). Además, GPT-5.5 y Velora registraron la menor cantidad de contradicciones factuales, presentes en apenas el 2% de los informes evaluados.
El informe incluye una declaración de conflicto de interés, ya que sus autores también son creadores de Velora, una de las plataformas evaluadas. No obstante, sostienen que la metodología es reproducible y que los casos analizados, las respuestas de referencia y los resultados individuales fueron publicados para permitir su revisión independiente.