NOTICIAS

OpenAI lanza Strawberry (o1): un modelo de IA que razona como un ser humano

Conocido internamente como Strawberry promete revolucionar la ciencia y las matemáticas

Publicado el 16 sept 2024

"Este modelo pasa más tiempo considerando los problemas antes de dar una respuesta, lo que ha dado como resultado en un notable descenso en las alucinaciones"

JERRY TOWREK, OPENAI

Índice de temas

OpenAI o1 Strawberry, inteligencia artificial para todos

OpenAI ha dado un paso de gigante en la evolución de la inteligencia artificial (IA) con el lanzamiento de o1, el primer modelo de una nueva serie diseñada para realizar tareas de razonamiento complejas. Conocido en los mentideros tecnológicos con el nombre en código «Strawberry«, este modelo promete revolucionar áreas clave como la ciencia, las matemáticas y la codificación, gracias a su capacidad de razonar de manera similar a un ser humano.

La compañía asegura que o1 es capaz de resolver problemas más difíciles que los modelos anteriores, lo que marca un avance significativo respecto a sus predecesores, como GPT-4. “Hemos desarrollado una nueva serie de modelos de IA diseñados para pasar más tiempo pensando antes de responder”, explica OpenAI en un comunicado, subrayando que este enfoque resulta fundamental para manejar tareas complejas en campos científicos y técnicos.

OpenAI o1: Un nuevo enfoque en el razonamiento paso a paso

A diferencia de los modelos de lenguaje tradicionales, que se basan en grandes volúmenes de datos de entrenamiento para generar respuestas, o1 utiliza una técnica innovadora que combina el aprendizaje por refuerzo con el razonamiento paso a paso. Esto le permite al modelo descomponer y analizar problemas complejos antes de ofrecer una solución, un enfoque que imita el proceso de pensamiento humano. El modelo es capaz de refinar sus estrategias a medida que evalúa los problemas, lo que le permite generar respuestas más precisas y meditadas.

«Este modelo pasa más tiempo considerando los problemas antes de dar una respuesta, lo que ha resultado en un notable descenso en las alucinaciones», dijo Jerry Tworek, líder de investigación de OpenAI, en una entrevista con The Verge. Las «alucinaciones» son un problema común en los modelos de IA, en las que los sistemas generan información incorrecta o inexacta. Si bien o1 ha mostrado mejoras en este aspecto, Tworek aclaró que aún no han logrado eliminar completamente este problema: «No podemos decir que resolvimos las alucinaciones», añadió.

Supera a expertos en ciencias y matemáticas

OpenAI ha sometido a o1 a pruebas rigurosas, demostrando sus habilidades excepcionales en disciplinas científicas y matemáticas. En estas evaluaciones, el modelo superó a estudiantes de doctorado en benchmarks desafiantes de física, química y biología. Además, o1 obtuvo una tasa de precisión del 83% en el American Invitational Mathematics Examination (AIME), superando al anterior modelo GPT-4o y a algunos de los mejores clasificados en la Olimpiada Internacional de Matemáticas (IMO).

En términos de aplicaciones, OpenAI destaca que las capacidades de razonamiento de o1 son prometedoras para una variedad de campos. Por ejemplo, los investigadores en salud podrían usarlo para analizar datos complejos de secuenciación celular, mientras que los físicos podrían generar fórmulas matemáticas avanzadas. Los desarrolladores, por su parte, podrían optimizar flujos de trabajo complejos con la ayuda de o1, lo que podría mejorar significativamente la productividad en áreas tecnológicas clave.

Limitaciones de OpenAI o1

A pesar de sus impresionantes capacidades, o1 aún enfrenta algunas limitaciones importantes. El modelo carece de la capacidad de navegar por Internet o procesar imágenes, dos funciones que se consideran críticas para una IA verdaderamente versátil. Además, aunque el modelo ha demostrado ser más preciso en comparación con versiones anteriores, sigue siendo propenso a generar información incorrecta o engañosa. OpenAI ha reconocido estos problemas y asegura que está trabajando activamente para mejorar estas áreas en futuras actualizaciones del modelo.

Otro aspecto que puede ser un obstáculo para su adopción masiva es el costo. Según información compartida por The Verge, o1 es considerablemente más caro que GPT-4o. El precio para los desarrolladores comienza en 15 dólares por cada millón de tokens de entrada y sube hasta 60 dólares por millón de tokens de salida, mientras que GPT-4o cuesta 5 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida.

Seguridad y asociaciones para el desarrollo responsable de la IA

OpenAI ha priorizado la seguridad en el desarrollo de o1, realizando pruebas exhaustivas para asegurarse de que el modelo sea resistente a intentos de manipulación por parte de actores malintencionados. La compañía ha enfatizado que uno de los principales objetivos durante el desarrollo de este nuevo modelo ha sido garantizar que sea más difícil explotarlo para obtener respuestas o comportamientos no deseados.

En este sentido, OpenAI ha establecido asociaciones con los Institutos de Seguridad de la IA en Estados Unidos y el Reino Unido. Estas colaboraciones permitirán investigaciones y evaluaciones independientes de o1 y futuros modelos, asegurando que su despliegue sea seguro y ético. Este enfoque es parte de un esfuerzo más amplio para abordar los crecientes problemas relacionados con la IA avanzada, como las alucinaciones, el uso indebido y los sesgos.

Próximos pasos: GPT-5 y la competencia en IA

Además de o1, OpenAI ya está trabajando en GPT-5, una nueva generación de modelos de inteligencia artificial que, según la compañía, incorporará técnicas de escalado y razonamiento avanzadas. GPT-5 promete ampliar aún más las capacidades de razonamiento complejas introducidas por o1 y abordar algunas de sus limitaciones actuales, como la falta de navegación web y procesamiento de imágenes.

Por otro lado, OpenAI no es la única empresa innovando en este campo. En julio, Google anunció el desarrollo de AlphaProof, un proyecto que también busca integrar modelos de lenguaje con técnicas de aprendizaje por refuerzo para resolver problemas matemáticos complejos. Según Google, AlphaProof ha comenzado a demostrar habilidades avanzadas de razonamiento matemático, lo que podría convertirse en una competencia directa para los modelos de OpenAI.

Con el lanzamiento de o1, OpenAI refuerza su liderazgo en el campo de la inteligencia artificial avanzada, aunque enfrenta el desafío de resolver sus limitaciones y gestionar la competencia emergente. A medida que las tecnologías de IA continúan evolucionando, los avances en modelos de razonamiento como o1 tienen el potencial de transformar significativamente sectores como la ciencia, la salud y la tecnología.

@REPRODUCCIÓN CONFIDENCIAL