Por qué el 95% de las GPU empresariales permanecen inactivas cuando las nuevas empresas de IA no pueden computar

Las recientes divulgaciones financieras de OpenAI pintan un panorama sombrío para el modelo económico de la industria. La compañía no cumplió con sus objetivos de ingresos internos y usuarios, mientras proyectaba pérdidas que podrían alcanzar los 14 mil millones de dólares en 2026.

Según The Wall Street Journal, la directora financiera Sarah Freer advirtió internamente que los crecientes costos de computación podrían superar los ingresos entrantes, lo que genera dudas sobre la capacidad de la compañía para financiar futuros contratos de computación.

Estos titulares son sintomáticos de una disfunción estructural más amplia en todo el sector, donde las empresas inflan las valoraciones a niveles sin precedentes y compran mucha más potencia informática de la que pueden desplegar eficientemente. Con una valoración de 852 mil millones de dólares, el crecimiento de los ingresos de OpenAI no puede seguir el ritmo del gasto en infraestructura de TI necesario para justificar esa cifra.

Último vídeo de

David Sherman

Estratega de IA e inclusión financiera en io.net.

OpenAI genera ingresos principalmente a través de tarifas de acceso a API y suscripciones a ChatGPT. Pero cada consulta de usuario cuesta tiempo de GPU, lo que significa que los márgenes de las estimaciones son muy reducidos o negativos.

Los ingresos aumentan con los clientes, pero los costos aumentan con la intensidad del consumo. Se invierten miles de millones en entrenar modelos de próxima generación que no generarán retornos durante meses o años.

Si bien estas empresas consumen potencia de GPU para capitalizar, no pueden implementar de manera rentable, ya que el hardware en sí no se utiliza en gran medida, potencia de procesamiento que podría destinarse a la atención médica, la educación o el desarrollo del mercado que más lo necesita.

La paradoja del poder pasivo

Un problema más profundo es que las GPU que estas empresas están acumulando no se están utilizando. La narrativa predominante entre las principales empresas de IA es la de escasez, que se utiliza para justificar los precios elevados. Pero el informe Estado de optimización de Kubernetes 2026 de Cast AI, que se basa en datos de casi 23.000 clústeres en AWS, GCP y Azure, encontró que el 95% de la capacidad de GPU empresarial no se utiliza. Miles de millones de dólares en cálculos, provisionados y pagados, rara vez se utilizan productivamente.

Eso significa que todos los que no pertenecen a las principales empresas modelo y a los gigantes de la computación en la nube están, en cierto sentido, excluidos. Las empresas emergentes, las grandes empresas y las instituciones desde Londres hasta Lagos pueden acceder a la computación a precios asequibles. El hardware existe, al igual que la demanda, pero el modelo actual no tiene ningún mecanismo para conectar ambos.

¿Por qué el uso es tan bajo?

Las razones son estructurales. Las empresas compran GPU para el peor de los casos, el equivalente a construir una autopista durante las horas pico y mantenerla vacía durante las otras 23 horas del día.

Luego está la cuestión de las acciones. En este mercado, la propiedad de GPU es una señal para los inversores. Las grandes empresas compran bienes más allá de lo que necesitan para realizar sus operaciones. El hardware se convierte en primer lugar en un activo del balance y en segundo lugar en una herramienta productiva.

Las carreras de entrenamiento lo empeoran. El entrenamiento del modelo de IA es intensivo pero iterativo. Una empresa podría impulsar su clúster de GPU con fuerza durante algunas semanas y luego dejarlo prácticamente inactivo hasta el siguiente ciclo de capacitación. No tiene ningún incentivo para permitir que otra persona use ese poder. Así que simplemente se queda ahí.

El resultado es que los jugadores más importantes acaparan hardware que apenas utilizan, mientras que todos los demás quedan excluidos del precio. Los que más sufren son los equipos pequeños que realmente contarán para un uso productivo, los desarrolladores en Nairobi o Sao Paulo que crean aplicaciones para mercados que las grandes tecnologías nunca han priorizado. Estos son los equipos que convertirán la IA en algo práctico y útil para la gente común, y están bloqueados por precios diseñados para subsidiar la infraestructura disfuncional de otra persona.

Opciones de entrega

La presencia continua de capacidad pasiva sugiere la necesidad de un enfoque diferente. En lugar de centralizar los recursos de GPU detrás de los muros corporativos, las redes informáticas distribuidas conectan hardware redundante a los desarrolladores que lo necesitan.

La mecánica es sencilla. Los propietarios de GPU, centros de datos con exceso de capacidad, organizaciones con hardware inactivo o personas con máquinas potentes se conectan a una red que verifica lo que cada máquina puede hacer. Cuando un desarrollador necesita un cálculo, la red se encarga del emparejamiento. Una tarea que requiere un tiempo de respuesta rápido se dirige a un hardware cercano de alto rendimiento. Un trabajo de capacitación por lotes que puede ejecutarse durante la noche se distribuye en máquinas más baratas y más distribuidas. El desarrollador no necesita saber dónde se encuentra físicamente el hardware.

La capa de orquestación agrupa el hardware compatible en clústeres, de modo que un desarrollador puede implementar cargas de trabajo en docenas de máquinas diferentes como si fueran un recurso unificado. La economía sigue naturalmente. Las GPU inactivas representan costos hundidos que podrían generar retornos si se emplean. Los desarrolladores obtienen acceso a un precio más bajo. Los propietarios de hardware monetizan activos que de otro modo permanecerían inactivos.

Más importante aún, las redes distribuidas reducen el riesgo sistémico de depender de un puñado de proveedores centralizados. Cuando el acceso a la computación no está vinculado al desempeño trimestral de una empresa, la cadena de suministro se vuelve más resistente.

El reloj de la escritura corre

La industria de la IA necesita una revisión. Las empresas han cargado sus balances con activos de GPU para su plena utilización. El uso real es del 5%. En algún momento, los libros deben reflejar la realidad. Cuando se trata de contabilidad, Compute Access se ocupa de la industria en general. Las organizaciones que dependen de proveedores centralizados serán las primeras en sentir esto. Aquellos conectados a opciones ya distribuidas no lo harán.

Existe infraestructura. La demanda existe. Lo único que falta es un modelo que coincida con ambos sin necesidad de una valoración de un billón de dólares para funcionar. Ese modelo ya se está desarrollando. La pregunta restante es cuántos escribir antes de que el resto de la industria preste atención.

Más de 70 de las mejores herramientas de IA probadas.

Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.

Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí:

Enlace de origen

Continue Reading

Previous: Les Républicains lancent une proposition à long terme visant à mettre fin à la ligne de carte verte Visa H-1B
Next: Le remaniement de CBS News et l’avenir de la presse grand public

Related Stories

‘Los gobiernos olvidan que la mayoría de los centros de datos necesitan agua para enfriar sus sistemas’: la junta de comercio de la industria advierte al gobierno del Reino Unido sobre la sed de recursos de los centros de datos

Le modèle OpenAI échappe au contrôle des tests alors que les versions des grandes technologies augmentent : rapport

X supprime 42 000 comptes utilisant des chatbots IA pour des solutions fixes

You may have missed

El rapero y YouTuber Yung Philly subirá al estrado durante un juicio por agresión sexual

‘Los gobiernos olvidan que la mayoría de los centros de datos necesitan agua para enfriar sus sistemas’: la junta de comercio de la industria advierte al gobierno del Reino Unido sobre la sed de recursos de los centros de datos

Comment un scandale royal a donné naissance à l’un des plus grands chefs-d’œuvre du monde

L’agent immobilier émet un avertissement sévère concernant une “arnaque” de location sur TikTok qui trompe les locataires avec des offres leur coûtant des centaines