AI Daily #21 — OpenAI sustituye el default de ChatGPT por GPT-5.5 Instant

MIÉRCOLES, 6 DE MAYO DE 2026

NOTICIA DESTACADA

OpenAI activa GPT-5.5 Instant como default de ChatGPT con 52,5% menos alucinaciones

El nuevo modelo sustituye a GPT-5.3 Instant para cientos de millones de usuarios y reduce alucinaciones un 52,5% en prompts de medicina, derecho y finanzas. Añade memory sources para mostrar qué contexto usa al personalizar respuestas.

4 MIN LECTURA

NOTICIAS DEL DÍA

AGENTES

Anthropic lanza 10 agentes financieros para banca y suma Microsoft 365 + datos de Moody's

Pitch builder, KYC screener, earnings reviewer y siete agentes más se distribuyen como plugins en Claude Cowork y Code. Claude se integra de forma nativa en Excel y PowerPoint y enchufa data feeds de Moody's.

Anthropic · 4 MIN LEER FUENTE →

REGULACIÓN

Microsoft, Google y xAI cederán modelos pre-release a CAISI para evaluación de seguridad

El acuerdo extiende a los tres laboratorios el esquema que ya tenían OpenAI y Anthropic, completando el mapa US de evaluaciones gubernamentales. CAISI lleva más de 40 evaluaciones de modelos, varias de sistemas aún no lanzados.

Reuters / The Hill · 3 MIN LEER FUENTE →

STARTUPS

Sierra de Bret Taylor cierra Serie E de 950M$ a 15.800M$ liderada por Tiger y GV

La startup de agentes para atención al cliente fundada por el chairman de OpenAI duplica valuación con Benchmark, Sequoia y Greenoaks dentro. Es la mayor ronda no-frontera del trimestre en agentes verticales.

CNBC · 3 MIN LEER FUENTE →

AGENTES

OpenAI llega a AWS: GPT-5.5, Codex y Bedrock Managed Agents en preview

Amazon Bedrock incorpora GPT-5.5 y 5.4 con governance unificada. Codex aterriza como producto en AWS y los Managed Agents permiten desplegar workflows multi-step de OpenAI sin salir del entorno cloud del cliente.

OpenAI · 3 MIN LEER FUENTE →

OPEN SOURCE

DeepSeek baja el precio de cache-hit a 1/10 y prolonga la promo de V4-Pro hasta el 31 de mayo

El recorte hace que los loops agénticos con system prompts estables se facturen al 10% del input nominal. V4-Pro mantiene 5x descuento sobre el precio post-promo, presionando al resto de proveedores en pricing de inferencia.

DeepSeek API Docs · 3 MIN LEER FUENTE →

REGULACIÓN

Trilogue de la AI Act Omnibus se cierra sin acuerdo: las obligaciones high-risk se juegan el 13 de mayo

Parlamento, Consejo y Comisión no consiguen alinear el aplazamiento propuesto al 2 de diciembre de 2027. Si el Omnibus no se adopta antes del 2 de agosto, las reglas high-risk de la AI Act entran en vigor según calendario original.

IAPP · 4 MIN LEER FUENTE →

Lo más importante hoy

La gran noticia del día llega de OpenAI: GPT-5.5 Instant sustituye a GPT-5.3 Instant como modelo por defecto de ChatGPT, con un recorte del 52,5% en alucinaciones sobre prompts de medicina, derecho y finanzas y un 37,3% menos de claims inexactos en conversaciones marcadas por usuarios. La compañía añade memory sources, un control que muestra qué memoria, archivo o chat anterior usó la respuesta — un guiño claro al debate de transparencia y personalización que arrastra ChatGPT desde la introducción de la memoria persistente. Anthropic completa la jornada con el lanzamiento de 10 agentes financieros —pitch builder, KYC screener, earnings reviewer, month-end closer, entre otros— que llegan como plugins en Claude Cowork y Claude Code, suman integración nativa con Excel y PowerPoint y enchufan los data feeds de Moody’s.

En regulación, Microsoft, Google y xAI firman con CAISI (Center for AI Standards and Innovation) acceso pre-release a sus modelos para evaluación de seguridad nacional, replicando el esquema que ya tenían OpenAI y Anthropic: el mapa US de evaluación gubernamental queda completo. En startups, Sierra —la firma de agentes para atención al cliente de Bret Taylor— cierra una Serie E de 950M$ a 15.800M$ con Tiger Global y GV al frente. OpenAI desembarca en AWS Bedrock con GPT-5.5, GPT-5.4, Codex y Managed Agents, abriendo por primera vez sus modelos al gran enterprise no-Azure. Y desde China, DeepSeek baja el precio de cache-hit de V4-Pro al 10% del input nominal y prolonga la promo hasta el 31 de mayo, manteniendo abierta la presión sobre la inferencia agéntica. Cierra el día el trilogue de la AI Act Omnibus sin acuerdo: el aplazamiento propuesto de las obligaciones high-risk se decide el 13 de mayo.

Por qué importa

El cambio de default de ChatGPT parece técnico, pero es la métrica más visible del año: los 52,5% menos de alucinaciones y la nueva capa de memory sources marcan que OpenAI ya no compite por benchmarks puros sino por factualidad y trazabilidad en producto consumer — el frente donde Claude y Gemini llevaban ventaja editorial. La doble jugada Anthropic + finanzas y OpenAI + AWS Bedrock confirma que la batalla enterprise se libra en integración + governance: quien quiera vender a banca o a Fortune 500 necesita ya plugins verticales, integración Office y data feeds. Para equipos técnicos, la lectura es directa: si construyes capa de agentes propietaria, vas a tener que justificar por qué no se hace en Bedrock Managed Agents o en Claude Cowork con plugins ya certificados. En el lado open weights, el recorte de DeepSeek al cache-hit pricing reabre el debate de coste por token efectivo en loops agénticos — un parámetro que cada vez más equipos miden por encima del precio de input nominal.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.

RESERVAR LLAMADA → VER SERVICIOS

VER TODAS LAS EDICIONES