El auge de las herramientas de inteligencia artificial a menudo se presenta como una carrera para asegurar la GPU antes de que alguien más lo haga. La posición de la competencia generalmente se mide en términos de CapEx del hiperescalador, participación de chips y cantidad de unidades Nvidia implementadas.
Sin embargo, cuando dos tercios de las organizaciones luchan por centralizar sus datos y menos de una cuarta parte (23%) informa capacidades sólidas de GPU, la carrera cambia. Ya no parece una carrera por el silicio escaso, sino un estancamiento en hora punta de clústeres mal conectados.
Responsable Internacional de vCluster.
La disrupción se produce en un momento de creciente preocupación por la soberanía digital. Los ministros europeos ahora han descrito la infraestructura digital como una “cuestión de supervivencia nacional”, advirtiendo que la dependencia de sistemas cerrados y controlados desde el extranjero crea vulnerabilidades estratégicas.
El artículo continúa a continuación.
Dado que los proveedores de nube estadounidenses controlan alrededor del 85% del mercado europeo –y que se prevé que el gasto soberano en la nube se triplique a 23 mil millones de dólares para 2027–, la presión para asegurar el control está realmente en marcha.
La escasez de GPU es real. Pero la mayoría de las limitaciones actuales son el resultado de entornos de Kubernetes fragmentados, clústeres duplicados e infraestructura de TI que nunca fue diseñada para un escalamiento seguro y eficiente a la escala requerida por la IA. Para muchas organizaciones, Kubernetes se ha convertido en el sistema predeterminado para ejecutar aplicaciones modernas.
Actúa como una plataforma de orquestación, administra contenedores, asigna recursos informáticos y mantiene todo en su lugar de manera confiable en todos los servidores. Estos se dividen en clústeres: grupos de potencia informática que los equipos utilizan para ejecutar cargas de trabajo.
El problema es que Kubernetes se diseñó en una era anterior a la IA, cuando las cargas de trabajo eran significativamente más ligeras. Está mucho menos optimizado para compartir recursos de GPU escasos y de alto valor, y es por eso que está empezando a fallar.
Los costos ocultos (y crecientes) de la expansión de los clusters
En la prisa por implementar la IA de forma segura, muchas organizaciones se han duplicado y aislado. Esto significa crear clústeres y entornos completamente separados para cada equipo o carga de trabajo, en lugar de compartir de forma segura la misma infraestructura subyacente.
En la práctica, si un grupo necesita autonomía, obtendrá su propio grupo. La carga de trabajo del otro equipo debe ser sensible, separada físicamente y no lógicamente. Si la gobernanza es compleja, la respuesta más sencilla es delimitar en lugar de repensar cómo se divide la infraestructura. El resultado es una expansión masiva de los conglomerados.
Si bien cada grupo puede parecer una decisión acertada para reducir el riesgo, la realidad es que se convierte en un pasivo económico. Los entornos habilitados para GPU son costosos de mantener, pero aún más costosos si no se utilizan. Al quedar fragmentados entre grupos, la visibilidad de los clusters disminuye mientras que la capacidad pasiva aumenta.
Es mucho más que un dolor de cabeza operativo. Estas ineficiencias estructurales reducen el rendimiento de la inversión. Las GPU deben verse como un activo de capital, no como un vestigio de hardware experimental en los presupuestos de I+D. Encerrarlos detrás de silos equivale a construir una planta de energía y operarla a la mitad de su capacidad porque la red no puede suministrar energía de manera eficiente.
Es posible que Kubernetes haya revolucionado la forma en que se construye y administra la infraestructura, pero nunca se diseñó teniendo en mente el uso compartido de GPU entre múltiples inquilinos. En pocas palabras, permite que varios equipos o cargas de trabajo compartan de forma segura la misma infraestructura subyacente, todo con límites, aislamiento y gobernanza claros sin duplicar el hardware en sí.
Sin una verdadera multiinquilino, los entornos compartidos se basan en cargas de trabajo de IA. Esto deja la opción entre comprometer el aislamiento o volver a un clúster dedicado. Tanna escala y el modelo queda desactivado. Es por eso que la descripción de la deficiencia de GPU oculta un defecto más profundo.
La tenencia de la soberanía avivó el debate
Mover cargas de trabajo a entornos locales o soberanos no resuelve mágicamente las ineficiencias. De hecho, puede ampliarlo. Cuando las organizaciones acercan la infraestructura de IA a casa para abordar preocupaciones regulatorias, de seguridad o geopolíticas, asumen total responsabilidad por su uso. Esta propiedad, sin orquestación, no puede considerarse soberanía. Está simplemente por encima.
A medida que se aceleran las cargas de trabajo de la IA, la carrera no se centrará en la adquisición de hardware sino en la implementación segura y la monetización eficiente. Esto requiere una capa de control para la economía de la IA, como un software que se asiente sobre la infraestructura en bruto y controle cómo se asigna, comparte y aísla la computación.
Permite el aislamiento sin duplicaciones, la gobernanza sin fricciones y la autonomía sin expansión. La verdadera multiinquilino surgirá como la capa faltante de la computación de IA, preservando tanto el cumplimiento como el rendimiento al tiempo que desbloquea una mayor utilización.
Dado que la soberanía ocupa un lugar tan alto en la agenda, la tenencia múltiple restablecerá la resiliencia como un mecanismo incorporado. En lugar de responder a las limitaciones de capacidad gastando una fortuna, las empresas pueden optimizar lo que ya tienen. Las nuevas cargas de trabajo no deberían justificar un nuevo clúster cuando puede ser un recurso compartido gestionado de forma inteligente.
En cualquier carrera, la velocidad bruta es sólo una parte de la ecuación. El control, la coordinación y la capacidad de sortear la complejidad a menudo determinan si se mantiene el impulso. La infraestructura de IA no es diferente. Ninguna velocidad bruta alcanzará su verdadero potencial a menos que esté diseñada para una escala segura y compartida.
Lea nuestra lista de las mejores herramientas de gestión de TI.