MIÉRCOLES, 6 DE MAYO DE 2026
OpenAI activa GPT-5.5 Instant como default de ChatGPT con 52,5% menos alucinaciones
El nuevo modelo sustituye a GPT-5.3 Instant para cientos de millones de usuarios y reduce alucinaciones un 52,5% en prompts de medicina, derecho y finanzas. Añade memory sources para mostrar qué contexto usa al personalizar respuestas.
4 MIN LECTURAAnthropic lanza 10 agentes financieros para banca y suma Microsoft 365 + datos de Moody's
Pitch builder, KYC screener, earnings reviewer y siete agentes más se distribuyen como plugins en Claude Cowork y Code. Claude se integra de forma nativa en Excel y PowerPoint y enchufa data feeds de Moody's.
Microsoft, Google y xAI cederán modelos pre-release a CAISI para evaluación de seguridad
El acuerdo extiende a los tres laboratorios el esquema que ya tenían OpenAI y Anthropic, completando el mapa US de evaluaciones gubernamentales. CAISI lleva más de 40 evaluaciones de modelos, varias de sistemas aún no lanzados.
Sierra de Bret Taylor cierra Serie E de 950M$ a 15.800M$ liderada por Tiger y GV
La startup de agentes para atención al cliente fundada por el chairman de OpenAI duplica valuación con Benchmark, Sequoia y Greenoaks dentro. Es la mayor ronda no-frontera del trimestre en agentes verticales.
OpenAI llega a AWS: GPT-5.5, Codex y Bedrock Managed Agents en preview
Amazon Bedrock incorpora GPT-5.5 y 5.4 con governance unificada. Codex aterriza como producto en AWS y los Managed Agents permiten desplegar workflows multi-step de OpenAI sin salir del entorno cloud del cliente.
DeepSeek baja el precio de cache-hit a 1/10 y prolonga la promo de V4-Pro hasta el 31 de mayo
El recorte hace que los loops agénticos con system prompts estables se facturen al 10% del input nominal. V4-Pro mantiene 5x descuento sobre el precio post-promo, presionando al resto de proveedores en pricing de inferencia.
Trilogue de la AI Act Omnibus se cierra sin acuerdo: las obligaciones high-risk se juegan el 13 de mayo
Parlamento, Consejo y Comisión no consiguen alinear el aplazamiento propuesto al 2 de diciembre de 2027. Si el Omnibus no se adopta antes del 2 de agosto, las reglas high-risk de la AI Act entran en vigor según calendario original.
Lo más importante hoy
La gran noticia del día llega de OpenAI: GPT-5.5 Instant sustituye a GPT-5.3 Instant como modelo por defecto de ChatGPT, con un recorte del 52,5% en alucinaciones sobre prompts de medicina, derecho y finanzas y un 37,3% menos de claims inexactos en conversaciones marcadas por usuarios. La compañía añade memory sources, un control que muestra qué memoria, archivo o chat anterior usó la respuesta — un guiño claro al debate de transparencia y personalización que arrastra ChatGPT desde la introducción de la memoria persistente. Anthropic completa la jornada con el lanzamiento de 10 agentes financieros —pitch builder, KYC screener, earnings reviewer, month-end closer, entre otros— que llegan como plugins en Claude Cowork y Claude Code, suman integración nativa con Excel y PowerPoint y enchufan los data feeds de Moody’s.
En regulación, Microsoft, Google y xAI firman con CAISI (Center for AI Standards and Innovation) acceso pre-release a sus modelos para evaluación de seguridad nacional, replicando el esquema que ya tenían OpenAI y Anthropic: el mapa US de evaluación gubernamental queda completo. En startups, Sierra —la firma de agentes para atención al cliente de Bret Taylor— cierra una Serie E de 950M$ a 15.800M$ con Tiger Global y GV al frente. OpenAI desembarca en AWS Bedrock con GPT-5.5, GPT-5.4, Codex y Managed Agents, abriendo por primera vez sus modelos al gran enterprise no-Azure. Y desde China, DeepSeek baja el precio de cache-hit de V4-Pro al 10% del input nominal y prolonga la promo hasta el 31 de mayo, manteniendo abierta la presión sobre la inferencia agéntica. Cierra el día el trilogue de la AI Act Omnibus sin acuerdo: el aplazamiento propuesto de las obligaciones high-risk se decide el 13 de mayo.
Por qué importa
El cambio de default de ChatGPT parece técnico, pero es la métrica más visible del año: los 52,5% menos de alucinaciones y la nueva capa de memory sources marcan que OpenAI ya no compite por benchmarks puros sino por factualidad y trazabilidad en producto consumer — el frente donde Claude y Gemini llevaban ventaja editorial. La doble jugada Anthropic + finanzas y OpenAI + AWS Bedrock confirma que la batalla enterprise se libra en integración + governance: quien quiera vender a banca o a Fortune 500 necesita ya plugins verticales, integración Office y data feeds. Para equipos técnicos, la lectura es directa: si construyes capa de agentes propietaria, vas a tener que justificar por qué no se hace en Bedrock Managed Agents o en Claude Cowork con plugins ya certificados. En el lado open weights, el recorte de DeepSeek al cache-hit pricing reabre el debate de coste por token efectivo en loops agénticos — un parámetro que cada vez más equipos miden por encima del precio de input nominal.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.