La inteligencia artificial continúa avanzando en tareas que requieren capacidades cognitivas complejas y, según los expertos, podría estar cerca de superar el denominado 'Último Examen de la Humanidad' (HLE en inglés), una prueba diseñada para medir el límite del conocimiento experto.
El examen, que reúne 2.500 preguntas en más de 100 disciplinas, desde mitología hasta ingeniería aeroespacial, se concibió para que lo resolvieran únicamente especialistas con nivel equivalente a un doctorado. Fue desarrollado con la participación de más de 1.000 expertos de diversas áreas y tiene como objetivo evaluar cuán cerca se encuentra la IA de las fronteras del conocimiento humano.
"Los creadores de modelos han hecho un trabajo excelente mejorando estos modelos de razonamiento", afirmó a The Times Calvin Zhang, jefe de investigación de Scale, la empresa de IA responsable del HLE, quien explicó que el examen busca ser un referente académico que solo "un puñado de personas en la Tierra" podría resolver.
El rendimiento de los sistemas ha mejorado de forma significativa en poco tiempo. Mientras ChatGPT acertó menos del 3 % en 2024, modelos como Google Gemini alcanzaron cerca del 19 % en pocos meses y superaron el 45 % recientemente. "Si esto fuera realmente lo único que nos importara en la vida, creo que podríamos lograrlo bastante rápido", señaló Kate Olszewska, sugiriendo que una puntuación cercana al 100 % podría alcanzarse en el plazo de un año.
"Se están acercando a la comprensión humana"
Para garantizar la dificultad del examen, sus creadores filtraron decenas de miles de preguntas y mantuvieron las respuestas ocultas para evitar que los modelos las memorizaran. Entre los desafíos se incluyen tareas como traducir inscripciones antiguas o identificar estructuras microanatómicas, lo que exige comprensión profunda más allá del reconocimiento de patrones.
No obstante, algunos expertos advierten que la brecha entre la IA y la inteligencia humana persiste. "Cuando los sistemas de IA empiezan a obtener resultados excepcionales […] es tentador pensar que se están acercando a la comprensión humana", afirmó Tung Nguyen, quien subrayó que la inteligencia implica contexto y especialización. Según explicó, el objetivo del examen es evidenciar tanto las capacidades como las limitaciones de estas tecnologías.
Si te ha gustado, ¡compártelo con tus amigos!


