Skip to content Skip to sidebar Skip to footer

Microsoft no ha baneado Claude, ha mirado la factura

Llevas dos semanas leyendo titulares que dicen, más o menos, lo mismo: “Microsoft ha baneado Claude”. Esto ha corrido como la pólvora por LinkedIn, Twitter y los grupos de Slack de medio sector tecnológico. El problema con ese titular es que no es verdad (al menos, no en el sentido morboso en el que casi todos lo estamos leyendo). Lo que ha hecho Microsoft es bastante más interesante y revelador.

Quédate hasta el final de este artículo porque te descubriré dos o tres señales que creo que de verdad importan si trabajas en una empresa que está pensando en meter agentes IA en serio.

Vamos por partes.

¿Que ha pasado realmente?

Microsoft ha cancelado las licencias internas de Claude Code. Como bien sabéis, esta es la herramienta que Anthropic ofrece a los developers para programar. La cancelación se aplica dentro de la división Experiences & Devices, que es la que construye Windows, Microsoft 365, Outlook, Teams y Surface (una buena parte de su columna vertebr.

El anuncio lo hizo Rajesh Jha, Executive VP de Microsoft, en un memo interno filtrado a The Verge a mediados de mayo. Los ingenieros afectados tienen hasta el 30 de junio de 2026 para migrar a GitHub Copilot CLI, la herramienta equivalente que Microsoft desarrolla internamente.

Uno de los matices que nadie cuenta es que lo que se cancela es la interfaz, no el modelo. Los modelos de Anthropic (Claude Sonnet, Opus y compañía)siguen siendo accesibles dentro del propio GitHub Copilot CLI. POr tanto no existe una ruptura comercial con Anthropic, sino una decisión muy concreta sobre qué interfaz usan sus ingenieros para escribir código asistido por IA.

Lejos de ser una guerra comercial abierta entre los grandes es un movimiento estratégico

La cita que vale la pena retener del memo de Rajesh Jha es ésta: “Claude Code was an important part of that learning. Copilot CLI has given us something especially important: a product we can help shape directly with GitHub” (cita textual). Traducido y sin filtros: “hemos aprendido mucho con Claude Code; ahora nos quedamos con un producto que podemos moldear nosotros, dentro de GitHub.” Eso, en lenguaje de empresa, suena a justificación estratégica. En lenguaje de CFO, suena a “vamos a recuperar control sobre una línea de gasto que se nos había ido de las manos”.

La razón oficial y la razón real

Microsoft ha vendido esta decisión como una unificación de herramientas”. La razón es real, pero hay un detalle que tiene que ver más con el calendario y tiene que ver con el deadline para migrar que es el 30 de junio (da la casualidad de ser el último día del año fiscal de Microsoft FY26).
Con este movimiento se cargan una importante “línea de gasto” justo antes de aprobar los presupuestos del año siguiente, y no es casualidad.

Las fuentes que han cubierto la historia en detalle (The Next Web, Fortune, Windows Central) coinciden bastante en el diagnóstico real. Los factores principales que apuntan son:

  • Por un lado el coste, porque Claude Code se hizo demasiado popular dentro de Microsoft y los facturones de tokens empezaron a doler
  • Por otro lado, el orgullo de producto, porque los ingenieros de Microsoft preferían la herramienta del competidor a la propia, lo cual es difícil de digerir en cualquier comité interno
  • Finalmente, el control estratégico: Microsoft está construyendo su propio stack agéntico de extremo a extremo y depender de Anthropic para una pieza tan central como el coding agent no encaja con esa tesis.

Sobre esto último ya os hablé hace unas semanas, cuando comentábamos el manifiesto Humanist Superintelligence con el que Microsoft empezaba a salir del armario de OpenAI. Esto forma parte de la misma estrategia: control sobre el stack agéntico, desde el modelo LLM hasta la interfaz que usa el developer. Este movimiento es muy coherente con esto

El espejo que importa: el caso Uber

Lo realmente jugoso de esta historia no está en Redmond, sino en San Francisco. Hace un mes, Praveen Neppalli Naga, CTO de Uber, declaró a The Information algo que merece la pena leer dos veces: Uber se había pulido el presupuesto completo de IA para 2026 en cuatro meses, sobre todo, con Claude Code.

Los números, también del propio Naga, son los que hacen palidecer cualquier hoja de cálculo de finanzas:

  • La adopción de Claude Code dentro de Uber pasó del 32% al 84% de sus cerca de 5.000 engineers en pocos meses.
  • El coste medio en tokens por engineer se movía entre 500 y 2.000 dólares al mes, según consumo.
  • Hoy, el 95% de los engineers de Uber usa herramientas de IA mensualmente; el 70% del código que se comitea en producción tiene origen en IA; y aproximadamente uno de cada diez deploys de backend se lanza sin humano en el loop.

Y aquí va la cita que, sinceramente, debería estar enmarcada en la pared de cualquier comité de inversión que esté pensando en agentes IA este año. Naga, hablando con The Information: “I’m back to the drawing board, because the budget I thought I would need is blown away already”. Regreso porque el presupuesto que pensaba que iba a necesitar ya se ha volatilizado.

(Si eso no os pone los pelos de punta como CFO, no sé qué lo hará.) Y conste que estamos hablando de Uber, que no es exactamente una startup pidiendo prestado para llegar a la siguiente ronda.)

Y es que el modelo de tarificación por tokens se comporta de manera distinta al de las licencias por usuario, algo que las empresas llevan veinte años sabiendo cómo presupuestar.

Y aquí tenemos la diferencia: una licencia tradicional es un número fijo multiplicado por el número de usuarios, mientras que una factura por tokens es una función de cuánto piensa el modelo, cuánto contexto carga, cuántas sesiones paralelas lanza y cuántos pasos de razonamiento ejecuta. El financiero llega al cierre del trimestre y se encuentra con que la línea de gasto se ha multiplicado por tres respecto de la previsión, no porque alguien haya hecho algo raro, sino porque los ingenieros se han enamorado del producto y lo usan mucho más de lo que cualquier modelo predictivo había previsto.

Uber quema presupuesto IA

Microsoft y Uber no son casos aislados

Si fuese solo Microsoft, sería una decisión interna curiosa, si fuese solo Uber, sería un titular llamativo, pero la cantidad de señales que salen a la vez empieza a contar otra historia.

En noviembre del año pasado, GitHub pausó los nuevos sign-ups de Copilot Pro y Pro+, su tier de pago, porque las cargas de trabajo agénticas de los clientes estaban generando costes que superaban su cuota mensual. Es decir: el cliente pagaba X al mes y, con un uso intensivo de la modalidad agéntica, generaba 2X, 3X o más en coste de cómputo para GitHub.

En abril de este año, Anthropic tuvo que cambiar sus condiciones de servicio en mitad de la noche para banear un framework open-source llamado OpenClaw, después de detectar que instancias únicas estaban consumiendo entre 1.000 y 5.000 dólares al día en costes de API, todo ello corriendo sobre planes Max de 200 dólares al mes. Hagan ustedes la cuenta del coste por suscripción, que es bastante didáctica.

A las pocas semanas, Bryan Catanzaro, VP de Applied Deep Learning de Nvidia, declaró a Axios algo todavía más demoledor: para su equipo, el coste del compute hoy es claramente superior al coste de los empleados que lo usan. Y conste que lo está diciendo el VP de la empresa que precisamente fabrica el silicio que se está cobrando esos costes — no tiene precisamente sesgo a inflar la cifra.

A mediados de mayo, Fortune publicaba una pieza en la que documentaba que el uso intensivo de herramientas de IA basadas en tokens puede acabar costando, por tarea concreta, más que el propio ingeniero humano al que iba a aumentar. Y Gartner, en una nota de mayo, proyectaba que el 25% del presupuesto de IA planificado para 2026 se va a retrasar a 2027 porque las pruebas de concepto están muriendo en el flujo de aprobación interno; de hecho sólo el 28% de proyectos de infraestructura de IA cumplen plenamente con su business case.

A esto le había añadido yo, en el artículo del riesgo de seguridad de los agentes IA en producción, otra señal independiente: en el otro lado del problema, además del coste, está la seguridad. Si juntas las dos, tienes un cuadro que explica por qué los comités de inversión de medio mundo están apretando el freno en los últimos meses.

SEGURIDAD AGENTES IA Blog Salvador Vilalta

Por qué pasa esto técnicamente (y por qué no se va a arreglar pronto)

Aquí viene la parte que es importante entender si lideras tecnología en cualquier organización. El precio por token de los modelos frontier ha caído aproximadamente diez veces cada dieciocho meses durante los últimos tres años. Eso es una caída brutal. La pregunta lógica sería: si los tokens son cada vez más baratos, ¿cómo es posible que la factura crezca?

La respuesta es bastante incómoda: el consumo de tokens por tarea está subiendo más rápido que el precio por token, ya que cada generación de modelo agéntico, por diseño, consume mucho más cómputo por unidad de trabajo, porque razona más, planifica más y se verifica contra el contexto.

La propia Anthropic ha comentado públicamente que sus cargas de razonamiento generan en torno a un orden de magnitud más de cómputo por consulta que las cargas de chat clásicas.

Dicho en plata, estamos comprando un producto cuyo precio unitario baja, pero cuya intensidad de uso crece aun más rápido. Esto implica que la factura mensual va a seguir subiendo a corto plazo, no a bajar. Cualquier modelo financiero que asuma que “los precios caerán y por tanto el coste total bajará” está, sencillamente, equivocado.

Lo que yo creo

Si lideras tecnología en una pyme española y estás pensando en agentes de IA, la fase experimental se está cerrando. La fase en la que las grandes plataformas absorbían el coste para que aprendiéramos, en la que se daba acceso amplio “para todo el mundo” sin medir el consumo, en la que los presupuestos se aprobaban con cifras de servilleta,se acaba este verano.

El próximo año van a llegar los caps por usuario, los tiers de acceso por rol, los runtime quotas, las alertas automáticas cuando un agente lleva 30 minutos consumiendo. El modelo de compra va a parecerse mucho más a cómo se compra electricidad o cómo se compra AWS que a cómo se compraba Office hace cinco años.

Aunque parezca paradójico, esta es una buena noticia para los que tomáis decisiones. Por primera vez, estamos midiendo el coste real de un agente de IA frente a su valor real, no frente a su demo. Hasta ahora, los pilotos eran románticos, funcionaban, salían bien las demos, los ingenieros contaban historias de productividad x3, y los CFOs firmaban el cheque sin entender exactamente qué estaba consumiendo el sistema. A partir de ahora, las decisiones se tomarán con números reales, casos de fracaso documentados y benchmarks honestos, y eso es exactamente lo que necesitábamos para profesionalizar la adopción.

Si ya tenéis un agente de IA en producción o lo estáis montando, mi consejo concreto es que reviséis, antes que nada, qué consume vuestro agente cuando no estáis mirando. Las facturas explosivas se deben al uso autónomo de estos agentes. En este punto es vital pedir al proveedor que os dé, literalmente, un cuadro de mando de consumo por usuario, por sesión y por tarea, y si no os lo da, no os metáis.

Generada con Gemini

¿Cómo lo estáis viendo vosotros desde vuestras empresas? ¿Ya os ha llegado la primera factura de tokens y os ha cogido desprevenidos, o todavía estáis en fase de demo?

Déjadme vuestros comentarios, me encantará leeros

Gracias por pasarte por aquí 🙂

¡Buena semana para todos!

¿Te ha gustado este contenido?

Si te ha gustado este contenido y quieres acceder a contenido exclusivo para suscriptores, suscríbete ahora. Agradezco de antemano tu confianza

Leave a comment

Go to Top
Suscríbete a mi Blog

Sé el primero en recibir mis contenidos

Descárgate El Método 7

El Método 7 puede será tu mejor aliado para incrementar tus ventas