Nature: los científicos humanos siguen superando a los agentes de IA en investigación compleja

Un estudio publicado en Nature demuestra que los investigadores humanos superan consistentemente a los mejores agentes de IA disponibles en tareas científicas de alta complejidad. Aunque modelos como Claude Opus 4.6 de Anthropic y Gemini 3.1 Pro de Google alcanzan más del 50% de precisión en Humanity’s Last Exam —el benchmark más exigente diseñado para medir capacidades científicas avanzadas—, los científicos humanos mantienen una ventaja decisiva en adaptabilidad, razonamiento causal ante datos novedosos y generación de hipótesis originales.

El estudio evaluó el desempeño comparado en tareas que van desde el diseño experimental hasta la interpretación de resultados anómalos y la formulación de conclusiones en dominios como biología molecular, física teórica y matemáticas avanzadas. En cada categoría, la brecha fue mayor cuando las tareas requerían integrar conocimiento de múltiples disciplinas o razonar sobre situaciones sin precedentes en los datos de entrenamiento.

El límite real de los agentes de IA hoy

Lo que el estudio identifica no es un fracaso de los modelos de IA, sino una caracterización más precisa de sus capacidades actuales. Los agentes de IA son extraordinariamente eficientes en recuperar, sintetizar y aplicar conocimiento existente. Donde muestran limitaciones consistentes es en lo que los científicos humanos llaman «salto abductivo»: la capacidad de proponer una explicación nueva que no estaba implícita en los datos disponibles. Esta distinción es crítica para evaluar dónde la IA complementa a los investigadores humanos y dónde todavía los requiere.

El benchmark Humanity’s Last Exam, diseñado específicamente para resistir la memorización, incluye problemas que requieren derivaciones originales, lo que lo convierte en un proxy más honesto de capacidad científica real que los benchmarks convencionales.

Perspectiva para la investigación en América Latina

Para las universidades e instituciones de investigación en República Dominicana y la región, este estudio reencuadra la conversación sobre IA en ciencia. La narrativa del «investigador reemplazado» cede espacio a un modelo más matizado: la IA como acelerador de revisión bibliográfica, análisis de datos y generación de variantes experimentales, con el investigador humano manteniendo el rol de formulación de preguntas y síntesis creativa. Instituciones como INTEC, UASD o el MESCYT pueden usar esta evidencia para diseñar programas de integración de IA en investigación con expectativas calibradas y sin sobredimensionar ni subestimar el alcance real de la tecnología.

SUSCRÍBETE AL BOLETÍN

Las informaciones que utilizamos para nuestro análisis semanal, las recibirás gratuitamente en tu inbox.

Fuente: Nature, abril de 2026.


  El contenido compartido en este blog está protegido por las leyes de derecho de autor. Si deseas reproducirlo en otros espacios, por favor atribuye la autoría al creador original del contenido. Si planeas utilizarlo con fines comerciales, te pedimos que nos contactes previamente para obtener la debida autorización.

Martes Tecnológico® potencia su contenido a través de inteligencia artificial.

Boletín especializado en ciencia, tecnología e innovación.

Suscríbete a nuestro boletín

Recibe las úlltimas tendencias en el mundo de la tecnología para negocios

Close the CTA
Scroll al inicio