Un vistazo rápido a los titulares actuales sobre el gasto en IA sigue mostrando una imagen clara de la inversión masiva en infraestructura de TI.
Por ejemplo, sólo en abril hubo más anuncios multimillonarios de empresas como Nvidia, Oracle y Disney, así como historias sobre el acuerdo Amazon-Anthropic de 100 mil millones de dólares.
Director General de Leaseweb Reino Unido.
En particular, está en el punto de mira el suministro de RAM y almacenamiento de acceso rápido, como SSD, unidades NVMe y otras tecnologías de baja latencia y alto rendimiento. Como lo expresó recientemente un análisis, “los gigantes de la IA están aumentando el suministro de memoria en el mundo, y todos los demás pagarán por ello con precios más altos, productos retrasados y lanzamientos cancelados”.
Las cadenas de suministro de estos componentes son finitas, las capacidades de fabricación y distribución están bajo presión y, en términos generales, no pueden seguir el ritmo. Está surgiendo rápidamente un desequilibrio entre la oferta y la demanda, con una disponibilidad reducida y una importante presión al alza sobre los precios.
Una gran parte del problema es que estos problemas no están aislados de entornos específicos de IA; Los mismos componentes sustentan la infraestructura empresarial general, la electrónica de consumo y otras categorías de productos relevantes.
Alta demanda y oferta limitada
Como siempre, el diablo está en los detalles. Los proveedores están asignando capacidad limitada a proyectos de infraestructura de IA grandes y de alto margen. Casi todos están teniendo que pasar de cobros predecibles a estrategias caracterizadas por el corto plazo y el retraso.
Mientras que la planificación de la infraestructura normalmente se basaba en el crecimiento previsto de la carga de trabajo, el factor clave ahora es la disponibilidad de materiales. En este contexto, el tiempo de adquisición se convierte en un factor crítico, y las organizaciones necesitan asegurar la capacidad antes de las necesidades. La flexibilidad es aún más importante, ya que las arquitecturas rígidas son difíciles de adaptar a estas condiciones del mercado.
Para algunas organizaciones, el sobreaprovisionamiento ha resurgido como una estrategia de mitigación de riesgos. Donde antes se minimizaba el exceso de capacidad para controlar los costos, algunas empresas ahora mantienen margen para protegerse contra demoras en las adquisiciones y el riesgo de que los componentes de la infraestructura no estén disponibles cuando se necesitan.
Considere este escenario cada vez más común: una organización planifica una actualización rutinaria de la infraestructura para respaldar sus objetivos de crecimiento y sus aplicaciones comerciales principales. Este requisito no está impulsado por la IA, solo la expansión estándar de computación, memoria y almacenamiento. Cuando fueron a adquirir hardware, los plazos de entrega fueron significativamente más largos de lo esperado y los precios aumentaron significativamente en comparación con los ciclos de actualización anteriores.
Es más, las configuraciones deseadas no están disponibles de inmediato, lo que requiere compromisos en las especificaciones o el tiempo. La organización debe decidir si retrasar el proyecto, aceptar costos más altos o rediseñar la implementación. En algunos casos, la infraestructura existente se retrasa más de lo previsto para evitar interrupciones. Cualquiera sea el camino que tomen, los retrasos tienen un efecto en cadena sobre la inversión en infraestructura y, en última instancia, sobre el desempeño final.
No te emociones demasiado
Estos problemas no muestran signos definitivos de terminar pronto, entonces, ¿qué opciones les quedan a los líderes de TI?
En primer lugar, las organizaciones deben poner mayor énfasis en asegurar el acceso a las capacidades en lugar de asumir la disponibilidad. Desde el principio, la planificación de la infraestructura debe tener en cuenta la carga de trabajo y los requisitos de desempeño, así como las limitaciones de suministro.
Por ejemplo, todavía hay proveedores de servicios que mantienen inventario disponible o pueden entregar capacidad rápidamente para reducir la exposición a retrasos. Las empresas que mantienen cierto nivel de capacidad fácilmente desplegable pueden ayudar a evitar interrupciones cuando la demanda cambia o sus componentes preferidos dejan de estar disponibles.
Es fundamental para el proceso de planificación general maximizar la visibilidad entre los niveles de uso actuales y futuros esperados para respaldar pronósticos más precisos y reducir el riesgo de aprovisionamiento insuficiente o excesivo. Como parte de este enfoque, reducir la dependencia de un único entorno o configuración fija puede mejorar la resiliencia a medida que cambian las condiciones. Actualmente se habla cada vez más de una corrección en los precios de las RAM, pero el análisis señala que, dado el aumento del 2.200%, los compradores no deberían “emocionarse demasiado”.
De hecho, analistas como IDC argumentan que “los efectos en cadena para los fabricantes de dispositivos y los usuarios finales podrían continuar hasta bien entrado 2027”. Tanto para los consumidores como para las empresas, explican, “esto señala el fin de la era de la memoria y el almacenamiento baratos y abundantes, al menos a medio plazo”.
Esto es difícil de discutir. Lo que estamos presenciando no es una disrupción a corto plazo, sino un cambio estructural en la forma en que se entrega y utiliza la infraestructura. Dado que la demanda de IA seguirá siendo elevada, la presión sobre la disponibilidad de componentes puede continuar, influyendo en las decisiones de infraestructura en todos los mercados.
Para las empresas, la dinámica actual del mercado todavía sugiere fuertemente cambiar el enfoque de maximizar la eficiencia a garantizar la mayor coherencia y previsibilidad posible.
Hemos repasado el mejor almacenamiento en la nube..
Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.
Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: