🚀 OpenAI lanza o3 y o4-mini

Ahora ChatGPT es capaz de integrar imágenes en su cadena de pensamiento.

abr 17, 2025

OpenAI ha lanzado sus nuevos modelos de razonamiento o3 y o4‑mini, los más inteligentes que ha lanzado hasta la fecha y los primeros de la app capaces de incorporar imágenes en su cadena de pensamiento. Según la compañía, esto les permite, por ejemplo, interpretar una foto de una pizarra, rotarla y ampliarla mientras resuelven un problema matemático o generan código, todo dentro de la misma respuesta. Esto es un salto cualitativo y también permitirá simplificar la elección de modelo: hasta ahora era necesario pensar qué modelo era mejor en cada una de las funciones (programar, generar o interpretar imágenes…).

Qué aportan de nuevo

Razonamiento de múltiples pasos con herramientas: o3 puede elegir y encadenar de forma autónoma búsquedas web, ejecución de código Python, análisis de archivos y generación de imágenes para responder a cuestiones complejas en menos de un minuto. o4‑mini hace lo mismo, pero con menor coste y más rapidez.

Salto en potencia: en los benchmarks académicos, o3 mejora un 20 % la tasa de aciertos de o1; o4‑mini supera a o3‑mini en matemáticas, programación y preguntas científicas, y domina la AIME 2024‑25 y los retos GPQA.

Visión integrada: ambos modelos “piensan con imágenes”, algo inédito en la serie o; sus razonamientos pueden mezclar texto, gráficos, bocetos o capturas de pantalla.

🚀 OpenAI ante el reto de mantener el 'hype': analizamos su frenético calendario de lanzamientos

*Este artículo se ha quedado obsoleto en menos de 8 horas con el lanzamiento de los nuevos modelos o3 y o4-mini. La reflexión, en cambio, sigue vigente.

Texto: Adrián Soler

¿Cuándo dejará de ser sostenible este ritmo de actualizaciones? El equipo de Sam Altman trabaja sin descanso. Quieren mantener a toda costa la ventaja que les dio ser los primeros: tanto en impacto público como en competitividad estratégica. Desde el nombre de sus modelos hasta la estética de los vídeos de sus anuncios (más bien similar a una startup de provincias que a una de las empresas más importantes del mundo). Todo es una coreografía que busca, en última instancia, mantener el hype. Y lo están logrando con creces.

En poco más de dos años y medio, OpenAI mantiene un ritmo de lanzamientos frenético para mantenerse en el candelero. Desde noviembre de 2022, han salido decenas de empresas en China que desafían su liderazgo. Pero más allá de alguna excepción (como DeepSeek y su 'mezcla de expertos' o Claude con sus 'Artifacts'), los de Sam Altman llevan la delantera. Ser los primeros les permite mantener cierta distancia con la competencia que han sabido aprovechar al máximo. Cuando los analistas lanzan la advertencia de que "va a explotar" la burbuja de la IA, ellos reaparecen luciendo divertidos suéteres navideños. Parece que nada les puede parar. ¿Hasta cuándo?

Su último 'golpe' de efecto con el modelo GPT-4o de generación de imágenes o su asistente de voz en tiempo real son solo pequeñas muestras de su capacidad para asombrar a millones de personas en todo el mundo, desencadenando 'trends' virales que contribuyen a mantener el hype.

Este calendario sintetiza, a grandes rasgos, los anuncios más importantes de la compañía desde ChatGPT.

Haz clic para acceder a la infografía interactiva.

Una estética propia de una startup

OpenAI también cuida muy bien todos sus anuncios. Especialmente singular fue el lanzamiento de GPT-4o (mayo 2024), su versión multimodal (capaz de mantener conversaciones con baja latencia y de 'ver' a través de la cámara del dispositivo). Parece que ha pasado una eternidad: todavía formaba parte de la empresa Mira Murati). El set parecía el salón de casa, con un ambiente de luces cálidas y huyendo de lo artificial y de los grandes auditorios (reservados para las grandes empresas tecnológicas tradicionales). Todo ello para transmitir también que la IA es una tecnología democratizadora: creada para todo el mundo y que va a entrar hasta en los rincones más íntimos de los hogares.

Cuando parecía que el 'hype' se desinflaba, los de Sam Altman decidieron 'apropiarse' del calendario de Adviento con los 12 días de OpenAI. Presentaciones en un set que parecía salido de una videollamada, con una estantería detrás y los ingenieros vestidos con suéteres navideños.

Los nombres de los modelos

Si la estética de los vídeos es particular, lo de los nombres de los modelos merece otro análisis detallado. Cuando todo el mundo espera el ansiado GPT-5, en OpenAI se han propuesto sacar una ristra de nombres originales con una 'o' delante o detrás (para diferenciar entre razonamiento o multimodalidad), saltándose el orden: primero fue GPT-4.5 y ahora 4.1. Incluso Sam Altman ha admitido (tácitamente) que todo es una estrategia de márketing: "¿Qué tal si arreglamos el nombre de nuestros modelos este verano y ganamos unos meses más para burlarnos de nosotros mismos (cosa que merecemos) hasta entonces?", escribió en tono burlón por X.

Juegan a la imprevisibilidad y a la sorpresa, pero también al despiste. Todas estas piezas, aunque parezcan irregulares y caóticas, encajan en el mosaico. Un gran mural comunicativo que se aprovecha de los nuevos canales de comunicación para mantener viva la expectación que genera una de las tecnologías más potentes de la humanidad.

(lo último)

📁 ByteDance presenta Seaweed: una IA de video con una eficiencia sin precedentes

📁 Sam Altman estaría dispuesto a convertir ChatGPT en una red social

✍🏻 Miguel Angel Martín-Pascual: Y aún estamos solos

(opinión)

De la urgencia a la reforma: repensar la formación en la era de la IA

Texto: Antoni Garrell Guiu

Vivimos inmersos en una transformación acelerada que afecta profundamente al mundo del trabajo, la comunicación y la generación de conocimiento. En este nuevo contexto, adecuar la formación a las exigencias de la sociedad digital, con la Inteligencia Artificial omnipresente, no es ya una opción estratégica, es una necesidad urgente, estructural y de país. La educación debe ser capaz de anticipar los cambios y preparar a la ciudadanía -no sólo a la más joven- para vivir y desarrollarse en un mundo altamente tecnológico, interconectado y en constante evolución.

Cómo debe ser la la formación y cómo debe afrontarse, fue el debate de hace unos días en el que participé junto a profesores, antropólogos e ingenieros desarrolladoras de Inteligencia Artificial. El debate, en el que nos obligamos a llegar a conclusiones y propuestas, no estuvo exento de discrepancias y visiones complementarias lo que nos permitió concluir que el proceso de transformación no puede realizarse de manera improvisada, sino que exige ser afrontado con una planificación de tres fases a corto, medio y largo plazo. Cada una responde a necesidades diferentes pero interconectadas, y todas son indispensables para un cambio real y sostenible.

Leer el artículo

(semana)

Lunes 🛠 Qué es Google Firebase Studio y cómo funciona esta herramienta para crear aplicaciones con inteligencia artificial.

Martes 🚀 OpenAI presenta GPT-4.1, su modelo estrella con mejoras en programación, instrucciones y contexto largo.

Miércoles ✍ Pere Vila: Inteligencia artificial al servicio de una revolución gastronómica