Una semana, toda la vanguardia. En modelos, los pesos abiertos van hoy desde un coloso de 1,6 billones de parámetros hasta un modelo de 230M que funciona en una Raspberry Pi. En modelos del mundo y robótica, una startup entrena agentes con videojuegos para controlar robots reales y el equipo de Yann LeCun hizo los modelos del mundo 48× más rápidos. En medicina, GPT-5 Pro resolvió un misterio inmunológico de tres años y un fundador usó Claude para interpretar sus propios escáneres de cáncer. Y los agentes que hacen todo esto llegaron a todos los teléfonos, y a una nueva superficie de ataque. Abajo: los avances estelares, las joyas menos conocidas y dónde ya está dando resultados.
Descubre todo AI Weekly
Más señal, menos ruido. Elige tus canales.
Estás leyendo el resumen semanal. Abajo tienes las demás formas de seguir la actualidad de la IA: todas gratis y fáciles de dejar.
-
→ Explora los 16 deep divesNewsletters semanales por tema: IA generativa, Machine Learning, IA en los negocios, Robótica, Investigación de vanguardia, Geopolítica, Salud y mucho más.Explora los 16 deep dives →
-
→ Alertas de IA de última horaCuando salta una noticia importante (una adquisición de 60 000 millones de dólares, la reunión de urgencia de un regulador, la filtración de un modelo de vanguardia), los suscriptores de alertas se enteran en cuestión de horas. En promedio 0 a 2 correos al día.Recibir alertas de última hora →
-
→ Actualidad IA (en vivo)Panel en vivo que se actualiza a medida que el escáner encuentra noticias: noticias puntuadas de las últimas 48 horas, entidades que más se mueven cada semana y líneas de tendencia trimestrales de 113 empresas, personas y temas de IA.Ver Actualidad IA →
Quick Hits
Modelos que puedes ejecutar
- DeepSeek lanzó un modelo abierto de 1,6 billones de parámetros que puedes descargar hoy — V4-Pro es un modelo de mezcla de expertos de 1,6 billones de parámetros (49B activos por token), con licencia MIT y una ventana de contexto de 1 millón de tokens. Su módulo de speculative decoding DSpark ejecuta esa inferencia de 1 millón de tokens con cerca de un cuarto del cómputo y una décima parte de la caché KV de la generación anterior. La variante Max logra puntuaciones de programación al nivel de la vanguardia: 93,5 % en LiveCodeBench y 80,6 % en SWE-Verified. Los modelos más capaces son cada vez más los que cualquiera puede descargar gratis de Hugging Face. [Hugging Face]
- El nuevo modelo de 230M de Liquid AI funciona en una Raspberry Pi y supera a modelos de más del doble de su tamaño — LFM2.5-230M (230M de parámetros, 19 billones de tokens de entrenamiento, 32K de contexto) decodifica a 42 tokens/seg en una Raspberry Pi 5 y a 213/seg en un Galaxy S25 Ultra, con soporte desde el primer día en llama.cpp, MLX, vLLM y ONNX. Supera al Granite 4.0-350M de IBM y al Gemma 3 1B en seguimiento de instrucciones y uso de herramientas, y Liquid lo hizo correr en un humanoide Unitree G1, por completo en el dispositivo, como la capa que convierte órdenes en lenguaje natural en llamadas a herramientas. La vanguardia no solo se hace más grande: se hace lo bastante pequeña como para funcionar en cualquier parte. [Liquid AI]
Modelos del mundo y robótica
- Una startup levantó 320 millones de dólares para entrenar agentes de IA con videojuegos, y el mismo modelo maneja un robot — General Intuition levantó 320 millones de dólares con una valoración de 2 300 millones (entre sus inversores están Jeff Bezos y Eric Schmidt) para entrenar agentes con millones de horas de juego, usando las etiquetas de acción botón por botón de lo que los jugadores pulsaron y cuándo. Lo llamativo: el mismo modelo que juega con un personaje de videojuego también guio a un robot cuadrúpedo por la oficina. Un cerebro, dos cuerpos. [TechCrunch]
- Los robots humanoides acaban de estrenar su primer sistema de seguridad integral — Halos for Robotics, de NVIDIA, reúne cómputo de seguridad de grado industrial (IGX Thor), un puente de sensores Holoscan, una capa de seguridad Halos OS y un laboratorio de certificación; su primer socio, Agility, lo está integrando en Digit, el humanoide que ya trabaja en los almacenes de Amazon. El cuello de botella de la IA encarnada está pasando de "¿puede moverse?" a "¿puede moverse con seguridad junto a las personas?". [NVIDIA]
IA en medicina y ciencia
- GPT-5 Pro resolvió un misterio inmunológico de tres años en The Jackson Laboratory — Desde 2022, el inmunólogo Derya Unutmaz tenía datos de citometría de flujo que no lograba explicar: bloquear el metabolismo de la glucosa en células T humanas y luego activarlas las empujaba hacia un estado inflamatorio. GPT-5 Pro propuso el mecanismo (una glicosilación ligada a N alterada) y predijo correctamente el resultado de un experimento con linfoma que él ya había realizado y había mantenido en reserva. Unutmaz lo calificó de "un hallazgo notable". No una puntuación de benchmark: una pregunta abierta de un laboratorio real, resuelta. [OpenAI]
- Un fundador usó Claude para interpretar sus propios escáneres de cáncer y evitó una radioterapia innecesaria — Diagnosticado con un linfoma poco común, Connor Christou, de Keragon, le pasó a Claude sus análisis de sangre, sus escáneres, los datos de su wearable y sus diarios. Cuando su PET de fin de tratamiento resultó ambiguo (para su tipo de cáncer, estas pruebas tienen cerca de un 60 % de falsos positivos), Claude señaló como causa probable un rebote benigno del timo, con cerca de un 90 % de probabilidad. Tres médicos lo confirmaron: sin enfermedad activa, sin radioterapia. Él aclara con cuidado que la herramienta lo ayudó a hacer las preguntas correctas; no reemplazó a los médicos. [TechCrunch]
Agentes en acción
- OpenAI Codex Remote ya está en todos los planes de ChatGPT y funciona desde tu teléfono — El agente autónomo de programación de Codex llegó a la disponibilidad general en todos los niveles de suscripción, con apps para iOS y Android que se emparejan con un equipo Mac o Windows mediante un código QR y un plugin de DigitalOcean que aprovisiona de forma automática un espacio de trabajo en la nube. El agente de programación salió del IDE: ahora puedes lanzar, supervisar y aprobar una compilación desde el andén del tren. [OpenAI]
- Un repositorio de GitHub de aspecto limpio puede engañar a tu agente de programación con IA para que ejecute malware — El equipo 0DIN de Mozilla mostró una trampa de tres etapas: un repositorio de aspecto normal, un paso de instalación que "da error" y le dice al agente que ejecute
python3 -m axiom init, comando que descarga en silencio una carga maliciosa desde un registro DNS controlado por el atacante y abre un shell inverso. Como lo expresaron los investigadores, "Claude Code nunca decidió abrir un shell: decidió arreglar un error". La carga se puede intercambiar por DNS, así que el repositorio pasa una revisión limpia y cambia después. [BleepingComputer]
La economía de la IA aplicada dejó de ser una promesa
Durante dos años, la crítica a la IA fue que la capacidad era real pero el negocio no. Esta semana apareció el negocio, y en tres industrias distintas a la vez.
Adobe acordó adquirir Topaz Labs, la firma ganadora de un Emmy por sus herramientas de IA de escalado y restauración de imagen, para integrar sus modelos de mejora en el dispositivo en Firefly y Creative Cloud: un actor consolidado que compra la vanguardia en vez de esperar a reconstruirla. En el sector salud, la insurtech francesa Alan levantó 480 millones de euros en una ronda liderada por Prosus con una valoración de 5 500 millones para escalar el "seguro de prevención", un modelo asistido por IA que ya factura más de 800 millones de euros en ingresos recurrentes anuales en cuatro países. Y dentro de los laboratorios el cambio es aún más marcado: los propios datos de OpenAI dicen que el 97,9 % de sus empleados usa ahora agentes de Codex, con un uso entre quienes no son desarrolladores que se ha multiplicado por más de cien desde finales de 2025 (todo autoinformado, conviene notarlo).
El patrón lo dice todo. Las adquisiciones, las rondas de nueve cifras, la adopción interna casi total: no son apuestas sobre lo que la IA podría hacer. Es dinero gastado en lo que ya hace.
Puntos clave
- La vanguardia abierta va de arriba abajo. Un modelo de 1,6 billones de parámetros que puedes descargar (DeepSeek V4-Pro) y uno de 230M que funciona en una Raspberry Pi y supera a modelos de más del doble de su tamaño (Liquid LFM2.5). Esta semana, tanto los modelos más capaces como los más fáciles de desplegar fueron abiertos.
- La IA está aprendiendo a actuar en el mundo físico. Un modelo entrenado con partidas de videojuegos ahora maneja un robot cuadrúpedo (General Intuition); el modelo del mundo de Yann LeCun planifica 48× más rápido (abajo); un modelo de 230M controla un humanoide; y los robots estrenaron su primera pila de seguridad de verdad (NVIDIA Halos). Los modelos del mundo y la robótica dejaron de ser problemas separados.
- La medicina es donde lo "aplicado" se vuelve real. GPT-5 Pro cerró una pregunta inmunológica de tres años con una predicción verificable, y Claude detectó un hallazgo benigno en un escáner que le ahorró a un paciente la radioterapia: en ambos casos con un experto humano de por medio, que es justo el punto.
- La economía de la IA aplicada ya está gastando dinero. Adobe comprando Topaz, los 480 millones de euros de Alan, los 200 millones de dólares de Quantifind, el uso interno casi total de Codex en OpenAI: el capital fluye hacia lo que la IA ya hace, no hacia lo que podría hacer.
Vale la pena leer
- El equipo de Yann LeCun construyó un modelo del mundo que planifica 48× más rápido, con 15M de parámetros — LeWorldModel es el primer modelo del mundo estable, de extremo a extremo y basado en píxeles que resuelve el problema del "colapso de representación" de JEPA, y es diminuto: 15M de parámetros, entrenable en una sola GPU en cuestión de horas, y planifica hasta 48× más rápido que los modelos del mundo basados en modelos fundacionales. Los modelos del mundo son la forma en que un robot imagina su próximo movimiento antes de hacerlo, y esto hace que salga barato. [arXiv]
- JetSpec lleva el speculative decoding a una aceleración de 9,64× — El Hao AI Lab de la UCSD construyó una cabeza de "causal parallel tree drafting" que alcanza hasta 9,64× de aceleración de extremo a extremo en razonamiento matemático (Qwen3-8B en MATH-500) y 4,58× en chat abierto, con ganancias de más de 7× en benchmarks de código. El speculative decoding no para de romper su propio techo. [GitHub]
- DeepSeek liberó como open-source el stack de entrenamiento detrás de la inferencia rápida — DeepSpec es una base de código integral con licencia MIT para entrenar y evaluar los "modelos borrador" de speculative decoding (DSpark, DFlash y Eagle3) que hacen que los modelos grandes generen más rápido, con scripts de preparación de datos, entrenamiento y evaluación que funcionan en distintas arquitecturas, incluidas Gemma y Qwen. La receta que los laboratorios tratan como ventaja propietaria ahora es pública. [GitHub]
- Un nuevo estudio tira el 87 % de la memoria de un LLM y obtiene mejores respuestas — InfoKV suma entropía predictiva y el cambio de representación por capas a la compresión de la caché KV para conservar los tokens que descartan los métodos basados solo en atención. En un benchmark de contexto largo conservó apenas entre el 12,5 y el 25 % de la caché y superó a la línea base con caché completa, y la brecha se ensanchó a medida que el contexto crecía hasta 64k tokens. La restricción que limita el razonamiento de contexto largo es la caché, y esto la gestiona más barato. [Hugging Face]
- Seis de los diez mayores bancos acaban de apostar 200 millones de dólares a que la IA atrapa el fraude que ellos no ven — Quantifind levantó 200 millones de dólares en una ronda liderada por Summit Partners (con Citi Ventures y S&P Global) para poner agentes de IA gobernados a trabajar sobre las alertas de delitos financieros; ya da servicio a seis de los diez mayores bancos del mundo. Un análisis de Celent citado en la ronda estima que un banco de primer nivel podría recortar los costos de procesamiento de alertas hasta en 177,9 millones de dólares al año. [PR Newswire]
- Claude ahora es un miembro de tu Slack, no una ventana de chat — Claude Tag permite a los equipos etiquetar a @Claude en un canal; construye el contexto a partir del historial del canal y actúa con las herramientas, los datos y las bases de código que se le concedan. Anthropic dice que su versión interna ya escribe el 65 % del código de su equipo de producto. Compartido esta semana por 5 de los expertos en IA que seguimos. [Anthropic]
- Nature: el sesgo de un modelo no se diseña, viene incrustado en los datos de entrenamiento — Los documentos en chino que coinciden con medios coordinados por el Estado aparecen en un conjunto de entrenamiento típico a un ritmo cercano a 41× el de la Wikipedia en chino. Preentrenar con apenas 6 400 documentos redactados por el Estado hizo que un modelo open-weight diera respuestas progubernamentales casi el 80 % de las veces. La cadena de suministro que no puedes auditar es el corpus. [Nature]
- Las herramientas de contratación con IA no solo discriminan: te rechazan en todas partes a la vez — Stanford HAI estudió 4 millones de solicitudes en 1 700 ofertas de empleo de 150 empresas y halló que el 10 % de los candidatos que se postularon a cuatro puestos fueron rechazados en todos ellos: un patrón de "rechazo sistémico" que no aparece sin el filtrado algorítmico, además de las disparidades raciales que las auditorías agregadas ocultan. [Stanford HAI]
- El Mundial impulsado por IA funciona con miles de trabajadores de datos humanos — Los datos en tiempo real de los partidos del Mundial de 2026 los producen anotadores en Brasil, Filipinas, India, Egipto y Europa del Este que etiquetan a mano hasta 3 000 acciones por partido por unos 70 dólares el partido. Detrás de cada estadística "automatizada" hay una persona mirando la grabación. Compartido esta semana por 5 de los expertos en IA que seguimos. [Rest of World]
Wait, What?
- Una IA diseñó una hamburguesa que le gana al Big Mac, y el planeta también gana — En un estudio revisado por pares en npj Science of Food, investigadores de Stanford construyeron "BurgerAI" a partir de 2 216 recetas de Food.com usando las mismas matemáticas de difusión que hay detrás de los generadores de imágenes. En una cata a ciegas con 101 personas, sus hamburguesas igualaron o superaron al Big Mac en gusto, sabor y textura; su versión con champiñones obtuvo un impacto ambiental un orden de magnitud menor, y su versión con frijoles casi duplicó el aporte nutricional. El encuadre es el verdadero titular: la IA generativa pasando "de la predicción al diseño". [npj Science of Food]
- El principal experto mundial en deepfakes ya no confía en sus propios ojos — Hany Farid pasó dos décadas como el experto de referencia en análisis forense digital, capaz de distinguir una imagen real de una falsa. Después de que su propia investigación mostrara que la mayoría de la gente ya no puede, él mismo empezó a fallar sus propias pruebas. "Cada imagen que veo, me pongo a trazar líneas para las sombras y a hacer geometría en la cabeza… Dentro de uno o dos años, todo nuestro sistema visual quedará completamente inútil."
La encuesta de esta semana
Una semana cargada de contenido en todos los frentes. ¿Qué rincón de la vanguardia sigues más de cerca?
— Alexis