La inteligencia artificial sigue avanzando a un ritmo impresionante, y cada semana trae novedades que transforman el panorama tecnológico. En este episodio del podcast Inteligencia Artificial repasamos las actualizaciones más importantes que están definiendo el inicio de 2026: desde nuevos modelos de generación de video hasta la intensa competencia entre los gigantes de la IA.
¿Por qué es importante estar al día con estas novedades? Porque cada uno de estos avances tiene un impacto directo en cómo trabajamos, en las herramientas que usamos y en las oportunidades que se abren para empresas y profesionales. Vamos a ver qué está pasando en el mundo de la inteligencia artificial y cómo estos cambios afectan al mercado laboral y empresarial.
Runway Gen 4.5: El Nuevo Estado del Arte en Generación de Video
La empresa Runway sacudió el mercado con el lanzamiento de su modelo Gen 4.5, estableciendo un nuevo estado del arte en generación de video. Este modelo representa un salto cualitativo importante en lo que podemos hacer con IA generativa aplicada al video.
Lo más destacado de Gen 4.5 es el nivel de control que ofrece. Ahora los creadores pueden manejar con mucha más precisión aspectos como las transiciones entre escenas, los planos de cámara y la coherencia visual a lo largo de toda la secuencia. Ya no estamos hablando solo de clips cortos aleatorios, sino de herramientas que permiten crear contenido con intención narrativa real.
¿Por Qué Video es uno de los Campos que Más Avanza?
La respuesta es sencilla: los videos son datos puros. Al igual que la programación, el video es contenido completamente digitalizado que puede usarse para entrenar modelos de forma muy efectiva. No hay ambigüedades, no hay interpretaciones subjetivas, solo píxeles y secuencias temporales.
Esta característica hace que junto con la programación, la generación de video sea uno de los dos campos donde estamos viendo los mejores resultados en IA en este momento. Y esto apenas comienza: pronto veremos esta tecnología no solo en redes sociales, sino posiblemente en televisión y cine.
DeepSeek R3.2: La Competencia de Modelos Abiertos se Intensifica
DeepSeek, una empresa que viene haciendo ruido en el espacio de modelos abiertos, lanzó su R3.2. Lo interesante no es solo que sea un modelo de código abierto (o más precisamente, de «pesos abiertos»), sino su rendimiento y precio.
El R3.2 se pone prácticamente al nivel de GPT-5 y Gemini Pro en áreas críticas como matemáticas, código y tareas de agentes. Pero aquí está lo revolucionario: cuesta muchísimo menos. Esta ecuación de rendimiento similar a precio mucho más bajo es una bomba en el mercado.
La Presión sobre los Gigantes
Para empresas como OpenAI, Google y Anthropic, esto representa un problema serio de sostenibilidad. Si modelos abiertos pueden ofrecer capacidades similares a una fracción del costo, ¿cómo justifican sus precios premium? Seguramente estas empresas están trabajando internamente para reducir sus costos operativos, porque si no lo hacen, la competencia se vuelve insostenible.
GPT-5.2: La Respuesta de OpenAI
Hablando de respuestas, OpenAI no se quedó de brazos cruzados ante el lanzamiento del Gemini 3 Pro de Google y el Claude Opus 4.5 de Anthropic. La empresa sacó GPT-5.2 en diciembre, justo el día que cumplía 10 años.
Según las evaluaciones de GPT-Eval, un benchmark que mide tareas del mundo real, GPT-5.2 tomó el liderazgo. Aunque el costo de ejecutar estas tareas con GPT-5.2 ($620) es ligeramente superior al de Claude Opus 4.5 ($608), lo realmente relevante aquí es otra cosa.
Modelos que Hacen Tareas del Mundo Real
Lo fascinante es que estos modelos cada vez pueden hacer más tareas con valor real. No estamos hablando de benchmarks académicos abstractos, sino de trabajos que tienen impacto directo en negocios y proyectos reales.
Esto me hace pensar constantemente en una pregunta fundamental: si estos modelos van a automatizar cada vez más tareas, ¿cómo nos reubicamos nosotros como profesionales? El mundo del trabajo se está reorganizando ante nuestros ojos.
Si quieres aprender a trabajar con estas nuevas herramientas y entender cómo aplicarlas en tu empresa, en Pioneros IA ofrecemos formación práctica y actualizada para que no te quedes atrás en esta transformación.
GPT-5.2 Pro High: Liderando en Razonamiento Abstracto
La versión Pro High de GPT-5.2 fue todavía más lejos, estableciendo un nuevo récord en el benchmark ARC-AGI con más del 54% de precisión. Este leaderboard mide capacidades de razonamiento abstracto, una de las habilidades más complejas para las máquinas.
Pero GPT-5.2 Pro High no solo brilla en razonamiento. También muestra resultados excepcionales en:
- Ingeniería de software
- Matemáticas avanzadas
- Ciencias
Este modelo representa la versión más avanzada que OpenAI ha sacado hasta el momento, combinando su tecnología de razonamiento interno («thinking») con capacidades de ejecución muy superiores.
Creatividad: Nuestra Ventaja Competitiva
Con todos estos avances, vuelvo a la pregunta que mencioné antes: ¿cómo nos diferenciamos? Como comenté en el episodio sobre tendencias para 2026, la respuesta está en dos frentes principales.
Primero, la creatividad. Los modelos de IA todavía no pueden igualar la creatividad humana genuina, y creo que esto va a seguir así por un buen tiempo. No me refiero a generar imágenes o textos variados, sino a esa capacidad de conectar ideas de formas completamente nuevas, de tener intuiciones que rompen con lo establecido.
Segundo, nuestra capacidad de gestionar y crear agentes de IA. Saber cómo orquestar estas herramientas, cómo diseñar workflows que aprovechen sus fortalezas y compensen sus debilidades, cómo entrenar y afinar modelos para casos específicos. Esta combinación de creatividad humana y dominio técnico de la IA es donde creo que está el mayor valor en 2026.
Google Disco: Innovación en Navegadores con IA
Google presentó Disco, un nuevo navegador con inteligencia artificial que, por ahora, solo está disponible para usuarios de macOS en Estados Unidos. Aunque hay otros navegadores con IA como Arc de OpenAI o Comed de Perplexity, Disco trae algo nuevo a la mesa.
GenTabs: Creando Aplicaciones al Vuelo
La característica destacada son los GenTabs, que permiten crear aplicaciones usando el modelo Gemini 3 basándose en las pestañas que tienes abiertas. Esto es bastante innovador porque no es algo que otros navegadores con IA tengan incorporado de esta forma.
Imagina estar investigando sobre un tema con varias pestañas abiertas y pedirle al navegador que te cree una aplicación para organizar esa información, comparar datos o visualizar tendencias. Eso es lo que promete GenTabs. Está en lista de espera para otras regiones, así que habrá que seguir de cerca cómo evoluciona.
OpenAI y Codex: 4 Ingenieros, 28 Días, una Aplicación Completa
Aquí hay un dato que me pareció fascinante y dice mucho sobre el estado actual de la programación asistida por IA. OpenAI usó un equipo de solo 4 ingenieros trabajando con Codex (su modelo de programación) para crear la aplicación Android de Sora en apenas 28 días.
Para contexto, Sora es la plataforma estilo red social de videos generados por IA de OpenAI. No es una aplicación trivial. Y que cuatro personas puedan desarrollarla desde cero hasta producción en menos de un mes es impresionante.
Normalmente, una empresa del tamaño de OpenAI tendría equipos mucho más grandes trabajando durante más tiempo en proyectos así. Este caso demuestra el potencial real de las herramientas de IA para programación cuando se usan bien.
Google Translate: Traducción de Audio a Audio en Tiempo Real
Google lanzó una actualización en fase de prueba para Google Translate que permite traducir audio directamente a audio en tiempo real usando Gemini. Sí, leíste bien: de audio a audio, sin pasar por texto.
Durante años trabajamos con traducciones que requerían convertir audio a texto, traducir el texto y luego sintetizar audio de nuevo. O simplemente trabajar con texto. Pero ahora estamos en el punto donde podemos saltar todo eso y hacer traducción directa de voz a voz en tiempo real.
Lo mejor es que Google Translate es gratuita, así que esta capacidad estará al alcance de cualquier persona con un smartphone. El impacto potencial en comunicación internacional, turismo, negocios y educación es enorme.
ChatGPT Image: OpenAI Reacciona en Generación de Imágenes
OpenAI presentó ChatGPT Image, su modelo de generación de imágenes más avanzado, ahora disponible para todos los usuarios de ChatGPT. Este lanzamiento fue claramente una reacción al Imagen 3 de Google, que con su salida había dejado al generador de imágenes de OpenAI bastante atrás.
Con este update, OpenAI logró alcanzar el puesto número 1 en Artificial Analysis, superando a Imagen 3 Pro tanto en la categoría de texto a imagen como en edición de imágenes. La competencia en este frente es feroz, y cada empresa está obligada a seguir innovando si no quiere quedarse atrás.
Agent S: Superando la Capacidad Humana en Computer Use
La empresa Simular AI presentó un agente llamado Agent S que logró un puntaje de 72.6% en el benchmark OS World. ¿Por qué es esto importante? Porque por primera vez supera la base humana de 72.36%.
Los agentes de Computer Use son sistemas de IA que pueden interactuar con computadoras de la misma forma que lo hacemos nosotros: moviendo el cursor, haciendo clic, escribiendo, navegando entre ventanas. Agent S demuestra que ya llegamos al punto donde la IA puede usar computadoras tan bien como nosotros.
Este es un hito significativo porque abre la puerta a que estos agentes puedan realizar tareas complejas en nuestro nombre de forma completamente autónoma, sin necesidad de APIs especiales o integraciones customizadas.
Gemini 3 Flash: Más Inteligencia, Menos Costo
Google lanzó Gemini 3 Flash Preview, un modelo que está solo dos puntos por debajo del Gemini 3 Pro en el índice de inteligencia de Artificial Analysis, pero que cuesta la mitad.
Esta tendencia de mantener o aumentar la inteligencia mientras se reducen los costos es consistente en toda la industria. Y probablemente vamos a seguir viéndola durante bastante tiempo más. Es una gran noticia para empresas que quieren adoptar IA pero tienen presupuestos limitados.
Qwen Image Layer: Descomponiendo Imágenes en Capas
Alibaba (su división de IA) lanzó un modelo llamado Qwen Image Layer que hace algo realmente útil para diseñadores. Toma una imagen y la descompone en capas separadas, igual que hacen los diseñadores en herramientas como Photoshop o Illustrator.
¿Por qué es esto útil? Porque cuando trabajas con imágenes en capas puedes editar elementos específicos sin afectar el resto. Puedes ocultar capas, reordenarlas, aplicar efectos a capas individuales. Es mucho más flexible que trabajar con una imagen plana.
Y lo mejor: el modelo es open source, así que cualquier persona o empresa puede descargarlo y usarlo libremente. Este tipo de herramientas van a acelerar muchísimo los workflows de diseño.
Personalización en ChatGPT: Más Control para los Usuarios
OpenAI añadió nuevas opciones de personalización en la configuración de ChatGPT. Ahora puedes ajustar:
- Uso de emojis: Más, menos o ninguno
- Nivel de entusiasmo: Desde muy formal hasta muy casual
- Nivel de detalle: Respuestas más concisas o más elaboradas
Puede parecer algo menor, pero estas opciones permiten que cada usuario adapte la herramienta a su estilo de trabajo y preferencias personales. Es un paso hacia hacer de ChatGPT una herramienta más flexible y personalizable.
Google vs OpenAI: El Cambio de Tráfico en 12 Meses
La plataforma SimilarWeb publicó un análisis que muestra cómo Google le fue comiendo terreno a OpenAI durante 2025. El tráfico web de OpenAI fue bajando mientras el de Gemini fue subiendo consistentemente.
Este cambio, sumado al lanzamiento del Gemini 3 Pro, fue suficiente para que Sam Altman decretara un «código rojo» interno en OpenAI. En un comunicado a los empleados, les pidió trabajar más fuerte en mejorar ChatGPT porque la amenaza de Google es cada vez mayor.
El Ecosistema de Google: Una Ventaja Difícil de Superar
Y tiene razón en preocuparse. Google tiene un ecosistema masivo:
- Gmail
- Google Search
- Google Docs
- Hojas de cálculo
- Presentaciones
- YouTube
- Android
Integrar IA en todas estas plataformas le da a Google una ventaja enorme. Es muy difícil competir contra eso cuando tienes miles de millones de usuarios que ya usan tus productos diariamente.
Recordemos que cuando salió ChatGPT en 2022, Google recibió críticas durísimas por estar muy atrás. Parecía que OpenAI los había dejado en el polvo. Pero vemos que fue solo cuestión de tiempo para que Google se pusiera al día y ahora prácticamente esté superando a OpenAI en varios frentes.
Meta Compra Manus: Buscando Repuntar en 2026
Meta hizo movimientos importantes con la compra de Manus el 29 de diciembre. Esta adquisición viene después de un 2025 donde, a pesar de inversiones millonarias y de contratar talento de otras empresas pagando sueldos astronómicos, Meta no logró resultados tangibles competitivos.
Todos sus productos de IA se quedaron atrás de los competidores. Manus era una aplicación de agentes de IA revolucionaria cuando salió, con capacidades realmente impresionantes. La pregunta ahora es: ¿qué va a pasar con Manus bajo Meta?
¿Logrará Meta aprovechar esta adquisición para repuntar en 2026? O, como ha pasado con otras compras, ¿terminará siendo absorbida sin aprovechar su potencial? El tiempo lo dirá, pero claramente Meta está desesperada por no quedarse más atrás en la carrera de la IA.
Tesla: De Costa a Costa de Forma Autónoma
Y cerramos con un hito impresionante: un auto de Tesla cruzó Estados Unidos de costa a costa de manera 100% autónoma. El vehículo recorrió 2,732 millas en solo dos días y 20 horas usando el sistema Full Self-Driving versión 14.2.
Este logro demuestra que los vehículos autónomos ya no son ciencia ficción, son una realidad tangible. Ver que una máquina puede hacer un viaje tan largo navegando carreteras, ciudades, condiciones climáticas variables y todo tipo de situaciones de tráfico sin intervención humana es realmente impresionante.
Conclusiones: El Mundo del Trabajo se Está Reorganizando
Todas estas novedades apuntan a una realidad innegable: el mundo del trabajo y de los negocios se está reorganizando en tiempo real. Los modelos de IA pueden hacer cada vez más tareas valiosas. Los costos están bajando. Las capacidades están aumentando. Y la adopción está acelerándose.
Ante este panorama, tenemos dos opciones. Podemos quedarnos quejándonos y pidiendo que detengan el progreso, o podemos adaptarnos y encontrar formas de crear valor en este nuevo contexto. Yo elijo la segunda opción.
La clave está en combinar nuestra creatividad humana con nuestro conocimiento de estas herramientas. Saber cuándo usar qué modelo, cómo diseñar workflows eficientes, cómo supervisar y mejorar los outputs de la IA. Ese es el skillset del futuro que ya es presente.
Si este episodio te resultó útil, podés dejar 5 estrellas en Spotify y compartirlo con alguien que creas que le puede interesar. Todo eso ayuda a que este podcast siga llegando a más personas. Nos escuchamos en el próximo episodio, donde seguiremos hablando del apasionante mundo de la inteligencia artificial.
