La IA está exponiendo una vulnerabilidad que la nube, la transformación digital e incluso la cibernética nunca han expuesto. La verdad es que muchas organizaciones todavía están construyendo arquitecturas como las de los 90, comprando full-stack, monopolizando propiedades y pensando centrado en el hardware.
Pero ya no estamos en los años 90 y, si bien es posible que no tengamos el tan esperado auto volador o Nike con cordones automáticos, las demandas sobre nuestra infraestructura de TI han cambiado significativamente con el auge de la IA. El problema es que no tenemos hábitos de compra.
Director de Soluciones para Reino Unido e Irlanda en NetApp.
En esta etapa inicial del ciclo de compra de tecnología, las organizaciones no deben permitir que el optimismo nuble su juicio.
Las decisiones que se tomen hoy definirán las capacidades para la próxima década, y la tendencia a comprar en masa a proveedores confiables no es consistente con la forma en que deberíamos diseñar nuevas tecnologías de inteligencia artificial.
Es esta confusión fundamental la que ha creado la trampa de la infraestructura de IA.
Simplicidad de pila completa frente a libertad arquitectónica
La infraestructura empresarial se ha construido, durante décadas, con cargas de trabajo que son fundamentalmente predecibles. Las bases de datos, los sistemas ERP y las aplicaciones de productividad imponen demandas consistentes y bien comprendidas sobre el hardware, lo que significa que el hardware se dimensiona y se compra en consecuencia.
El modelo full-stack que surgió de esta era era lógico. Un único proveedor que proporcionara computación, almacenamiento y redes integrados ofrecía una simplicidad operativa real, y la mayoría de las organizaciones estaban dispuestas a aceptar el equilibrio entre la dependencia del proveedor y la comodidad de la gestión de TI.
Pero las cargas de trabajo de IA operan en condiciones completamente diferentes. La capacitación de modelos grandes requiere una computación repentina y sostenida que no es familiar para los perfiles de cargas de trabajo empresariales tradicionales. La ejecución de estos modelos en producción introduce demandas de recursos que cambian con la evolución de los patrones de uso y las versiones de los modelos.
Por lo tanto, los canales de datos subyacentes a los sistemas de IA requieren un almacenamiento que pueda responder dinámicamente en lugar de operar en ciclos fijos. En conjunto, estas características describen requisitos de infraestructura que son inherentemente variables y de rápida evolución, lo que dificulta su planificación por adelantado.
No es algo para lo que una propiedad monolítica centrada en el hardware esté diseñada para adaptarse. Para cuando las empresas comiencen a experimentar deuda técnica debido a esta infraestructura, tardarán cinco años en arreglarla.
Costos compuestos de complicaciones tardías
Las compras full-stack se presentan a los CIO como una opción segura y manejable a lo largo de este ciclo y, en el corto plazo, están a la altura de estas afirmaciones.
Los sistemas integrados de un único proveedor son más fáciles de implementar, respaldar y explicar ante una junta. Las soluciones full stack son más sencillas porque la complejidad se pospone en lugar de eliminarse.
Esto acumula interés en forma de bloqueo de hardware, interoperabilidad limitada y una salida cada vez más costosa si las necesidades de la organización evolucionan más allá de lo que la plataforma fue diseñada para soportar.
Cinco años después de un compromiso de infraestructura de IA de pila completa, las organizaciones se encontrarán en una posición que cualquiera que haya pasado por una migración importante a la nube reconocerá de inmediato. La antigüedad del patrimonio y las relaciones con los proveedores a menudo pasan de la asociación a la dependencia con el tiempo.
Además, los costos del cambio aumentan lo suficiente como para que quedarse quieto parezca la única opción realista, aunque se corre el riesgo de desacelerar el progreso. El error en esto no es comprar el hardware incorrecto, sino elegir la conveniencia a corto plazo en lugar de la adaptabilidad a largo plazo.
Virtualización, contenerización y abstracción como fundamentos estratégicos
La IA requiere una arquitectura que se base en la flexibilidad más que en la integración. La interoperabilidad que ofrecen las soluciones integradas hace que los componentes sean mutuamente dependientes.
En cambio, la IA requiere flexibilidad para reconfigurar la infraestructura a medida que cambian las demandas que se le imponen, lo que significa que las cargas de trabajo no están sujetas a límites de hardware físico específicos, y el ritmo del cambio tecnológico en sí no obliga a las organizaciones a cambiar de plataforma de manera constante y costosa.
La base de la virtualización. Cuando se virtualizan la computación, el almacenamiento y las redes, las cargas de trabajo se pueden mover, escalar y reasignar dinámicamente sin estar vinculadas a máquinas físicas. Esto es de vital importancia para la IA porque el perfil de recursos de las cargas de trabajo de IA cambia constantemente.
La producción de un modelo de capacitación tiene requisitos de infraestructura completamente diferentes a los de la estimación del mismo modelo, y una propiedad que no pueda acomodar esta diferencia sin intervención manual creará costosos cuellos de botella.
La contenedorización extiende esta flexibilidad a la capa de aplicación. Las aplicaciones de IA empaquetadas como contenedores conllevan sus propias dependencias y se pueden implementar de manera consistente en la infraestructura local, la nube pública y los entornos de borde sin modificaciones. A medida que las organizaciones pasan de los experimentos de IA a las implementaciones de producción y a la inferencia de borde, esta portabilidad se convierte en un requisito operativo práctico.
La capacidad de mover cargas de trabajo entre entornos sin necesidad de reconstruir hace posible seguir la economía de la infraestructura de IA a medida que evoluciona, en lugar de quedar atrapado en una estructura de costos que solo tiene sentido en el momento de la aprobación.
La abstracción reúne estos elementos. La infraestructura que está verdaderamente abstraída (es decir, desacoplada o aislada) del hardware subyacente permite a las organizaciones actualizar, reemplazar o mejorar ese hardware sin interrumpir las aplicaciones y cargas de trabajo que se ejecutan sobre él.
Esto es especialmente importante cuando las generaciones de GPU giran más rápido que los ciclos de actualización de servidores tradicionales y el panorama de herramientas está evolucionando a un ritmo que hace que los planes de infraestructura a cinco años sean en gran medida especulativos.
Diseñando para el cambio
Las empresas que construyen infraestructura de IA sobre una base virtualizada, en contenedores y abstracta no son necesariamente las que se mueven más rápido o tienen los mayores presupuestos en el ciclo actual. Ellos son los que entienden la diferencia entre comprar para las necesidades actuales y construir para una serie de futuros que no pueden anticipar por completo.
Ha pasado mucho tiempo desde los años 90, cuando se implementaron estas soluciones exclusivas, centradas en hardware y de pila completa; la tecnología y los negocios han evolucionado significativamente a lo largo de los años. No podemos predecir lo que sucederá en los próximos 3 años, y mucho menos en 10, aparte del hecho de que las necesidades de infraestructura seguirán evolucionando.
El ritmo del cambio en la IA significa que la infraestructura que no pueda adaptarse se convertirá en una limitación activa de lo que las empresas pueden hacer. Por lo tanto, es hora de plantear preguntas difíciles sobre flexibilidad, portabilidad y libertad arquitectónica antes de firmar el acuerdo, de modo que en lugar de quedarse quieto a medida que la tecnología evoluciona, su organización pueda crecer con ella.
Hemos presentado el mejor software de gestión de activos de TI..
Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.
Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: