OpenAI anuncia modelos o3: Razonamiento en IA

OpenAI dio inicio a diciembre con un emocionante evento de 12 días, en el que diariamente revelaron avances clave en el campo de la inteligencia artificial. Sin embargo, dejaron su mayor revelación para el gran final: el anuncio de o3, su innovador modelo de razonamiento de próxima generación. Esto marca un hito en la evolución de la IA, acercándonos un paso más a la tan anticipada Inteligencia Artificial General (AGI). Pero, ¿qué hace que o3 sea tan revolucionario? Vamos a descubrirlo.

¿Qué es o3?

o3 es la siguiente iteración en la familia de modelos de razonamiento de OpenAI. Siguiendo los pasos de su predecesor, o1, este modelo representa una familia completa que incluye:

o3, el modelo principal.
o3-mini, una versión más pequeña y optimizada para tareas específicas.

Diseñado para razonar y verificar hechos, o3 se diferencia de los modelos convencionales gracias a su capacidad de “pensar” antes de responder. Esto se logra mediante una “cadena de pensamiento privada”, un proceso que desglosa problemas paso a paso para ofrecer soluciones precisas y confiables.

¿Por qué no se llama o2? 🤔

Curiosamente, el nombre o2 fue descartado debido a posibles conflictos de marcas con la empresa de telecomunicaciones británica O2. El CEO de OpenAI, Sam Altman, confirmó este detalle durante una transmisión en vivo, destacando lo peculiar que puede ser navegar en el mundo de la propiedad intelectual.

¿Qué es la AGI y qué tan cerca está o3?

La AGI (Inteligencia Artificial General) se refiere a una IA que puede realizar cualquier tarea que un humano sea capaz de hacer. Según evaluaciones internas, o3 alcanzó un puntaje del 87.5% en la prueba ARC-AGI al operar en su nivel de cómputo más alto, una mejora significativa respecto a o1. Sin embargo, este nivel de procesamiento tiene un costo elevado, llegando a miles de dólares por tarea.

Resultados destacados:

96.7% en el Examen de Matemáticas Invitacional de EE.UU. 2024, con solo una pregunta incorrecta.
87.7% en GPQA Diamond, evaluando conocimientos avanzados en biología, física y química.
Récord en el benchmark Frontier Math, resolviendo un 25.2% de los problemas, frente al 2% de otros modelos.

Dentro de esta prueba se concluyó el día de hoy que o3 sí representa un avance significativo. Su desempeño en ARC-AGI destaca un verdadero progreso en adaptabilidad y generalización, de una manera que ningún otro referente podría haber hecho tan explícito.

«o3 resuelve la limitación fundamental del paradigma de los modelos de lenguaje grande (LLM): la incapacidad de recombinar conocimiento en tiempo de prueba. Lo logra mediante una forma de búsqueda de programas en lenguaje natural guiada por un LLM. Esto no es solo un progreso incremental; es un territorio completamente nuevo que exige una seria atención científica» concluyó el ARC.

Acceso temprano para pruebas de seguridad

Como parte del anuncio, OpenAI también abrió el proceso de acceso temprano para investigadores de seguridad interesados en explorar y analizar los riesgos potenciales de los modelos de vanguardia como o3. Este programa busca:

Desarrollar evaluaciones robustas para identificar capacidades con implicaciones significativas de seguridad.
Crear demostraciones controladas de capacidades de alto riesgo, mostrando escenarios que podrían causar daños significativos si no se mitigan.

OpenAI ya colabora con instituciones como el Instituto de Seguridad de la IA en EE.UU. y Reino Unido, así como con redes de red-teaming, para garantizar la seguridad de estos modelos.

La convocatoria para aplicar al programa de acceso temprano está abierta desde hoy, 20 de diciembre de 2024, y cerrará el 10 de enero de 2025.

El futuro de o3 y la inteligencia artificial

Por ahora, ni o3 ni o3-mini están ampliamente disponibles. OpenAI planea lanzar una versión preliminar de o3-mini a finales de enero, seguida de o3 más adelante. Mientras tanto, los investigadores de seguridad pueden registrarse para una vista previa y explorar sus capacidades.

Con o3, OpenAI está redefiniendo los límites de lo que puede lograr la inteligencia artificial, abriendo nuevas oportunidades y enfrentando grandes retos. En Darwin, vivimos esa evolución día a día con nuestro asistente inteligente. Hemos enfrentado los retos del cambio, adaptándonos y aprovechando las oportunidades que esta tecnología nos brinda para mejorar constantemente nuestro producto. Seguiremos trabajando y evolucionando para expandir nuestra visión y llevar la inteligencia artificial a más personas, te invitamos a ser parte:

Probar mi asistente inteligente ✨

OpenAI Anuncia o3: El Futuro del Razonamiento en Inteligencia Artificial✨