Actualmente, el mundo empresarial es testigo de un marcado contraste entre las ambiciones de la IA y la ejecución en el mundo real. Si bien la narrativa de los últimos dieciocho meses ha estado dominada por el potencial transformador de los grandes modelos de lenguaje y la IA generativa, la realidad operativa para muchas empresas es un “cementerio de pruebas de conceptos”.
Las empresas están realizando inversiones importantes pero a menudo no logran obtener el rendimiento esperado de la inversión.
Director de IA en Hammer Distribution.
Para entender por qué estos proyectos se están estancando, debemos mirar más allá del software y la interfaz de usuario. El obstáculo no es la falta de imaginación; Se trata de una profunda división fundamental que se produce a nivel de infraestructura.
A medida que pasamos de la era de la experimentación a la era de la implementación, la industria está descubriendo que las “conexiones” de la IA son mucho más complejas que las aplicaciones.
Los comienzos en falso y la paradoja de la nube pública
Para muchas organizaciones, el paso inicial a la nube pública proporciona un punto de entrada lógico y sin barreras para la experimentación con IA. Capacidad para poner en marcha rápidamente instancias de potencia informática para la creación rápida de prototipos sin necesidad de una inversión de capital inmediata.
Sin embargo, a medida que estas cargas de trabajo han pasado de pruebas a pequeña escala a producción a gran escala, las limitaciones de este modelo se han convertido en una carga financiera y operativa significativa.
La infraestructura de la nube pública es inherentemente flexible en el corto plazo, pero a menudo introduce costos inesperados que afectan la planificación financiera a largo plazo. Cuando las cargas de trabajo de IA se ejecutan a escala, un enfoque de facturación “medido” puede provocar “shocks” presupuestarios que pueden paralizar las juntas directivas o incluso cancelar proyectos.
Además, el concepto de gravedad de los datos se está convirtiendo en una preocupación primordial. Ésta es la idea de que a medida que los conjuntos de datos crecen, su traslado se vuelve difícil y costoso.
Enormes conjuntos de datos propietarios están efectivamente encerrados en ecosistemas hiperescalares. Cuando se tienen en cuenta las tarifas de salida y las penalizaciones por latencia asociadas con el movimiento repetido de datos desde la nube, el procesamiento en tiempo real se vuelve casi imposible.
Esto crea una separación física entre los datos y la potencia informática, creando barreras arquitectónicas que sofocan el rendimiento e impiden que las empresas vean resultados reales.
Tres pilares de división
La brecha actual entre inversión y retorno de la inversión está impulsada por tres áreas específicas de fragmentación que la mayoría de las empresas actualmente no están preparadas para manejar internamente.
1. Información fragmentada y crisis de soberanía Hoy en día, las organizaciones luchan por consolidar datos aislados en diferentes regiones, departamentos y jurisdicciones regulatorias. A medida que los requisitos de residencia y soberanía se vuelven más estrictos a nivel mundial, la capacidad de entrenar e implementar modelos donde realmente residen los datos se está convirtiendo en un requisito previo para el éxito.
Estamos viendo un cambio importante hacia la necesidad de una IA soberana. Las organizaciones necesitan esto para mantener un control total sobre la ubicación física de sus datos, su propiedad intelectual y sus modelos.
Sin este nivel de control, una empresa corre el riesgo no sólo de incumplimiento normativo sino también de la posible divulgación de propiedad intelectual sensible. Si la infraestructura no respalda la soberanía, el proyecto suele estar condenado al fracaso antes de salir de la fase piloto.
2. Brecha de habilidades especiales La IA requiere una intersección altamente especializada entre la ciencia de datos y la arquitectura de sistemas. Contar con un simple equipo de TI para gestionar estos entornos ya no es suficiente. Las implementaciones exitosas de IA requieren experiencia en la distribución de almacenamiento de alto rendimiento, redes de baja latencia y GPU de gran consumo energético.
Muchas empresas se encuentran con las herramientas de software adecuadas pero sin el conocimiento técnico profundo necesario para optimizar toda la pila. Esto da como resultado lo que llamamos “arquitecturas accidentales” que son ineficientes y frágiles.
En última instancia, estos sistemas no pueden soportar el rendimiento requerido para la IA a nivel de producción, lo que resulta en una degradación del rendimiento que acaba con el argumento comercial de la tecnología.
3. Complejidad de la infraestructura y desafíos a nivel de rack Crear un entorno de IA listo para producción ya no consiste solo en comprar componentes de hardware individuales. Se trata de validar un ecosistema complejo a nivel de rack.
Desde la administración de energía de alta densidad hasta la integración de refrigeración líquida y la agrupación de GPU de múltiples nodos, los requisitos físicos de la IA son inmensos. Cuando estos componentes se obtienen y gestionan de forma fragmentada, aumenta el riesgo de fallos arquitectónicos.
Muchos proyectos fracasan durante la compleja transición de un entorno de pruebas controlado a un entorno de producción de misión crítica porque la infraestructura subyacente simplemente no puede escalar a la misma velocidad que los datos.
Barreras económicas a la recaudación.
Un factor importante y a menudo pasado por alto en el cementerio de pruebas de concepto es el desajuste económico entre cómo se construye la IA y cómo se paga. Tradicionalmente, la infraestructura empresarial requería enormes gastos de capital iniciales.
En el cambiante panorama de la IA, comprometerse con millones de piezas de hardware que podrían quedar obsoletas en dos años es un riesgo que muchos directores financieros no están dispuestos a correr.
Por el contrario, el modelo de gasto operativo de la nube, que parecía atractivo para la experimentación, se volvió prohibitivamente caro cuando se utilizaba para cargas de trabajo constantes y de alta intensidad.
La industria necesita un término medio. Esto requiere previsibilidad económica y control físico de la infraestructura local, combinado con la flexibilidad del flujo de caja asociada con el uso de la nube.
Hasta que el canal pueda ofrecer enfoques de implementación por etapas y modelos de financiamiento que alineen los costos de infraestructura con la absorción real de la carga de trabajo, la brecha de retorno de la inversión seguirá siendo amplia.
Superar el argumento de venta
Para cerrar esta brecha y rescatar proyectos del cementerio, se deben desarrollar métodos industriales de entrega de IA. El modelo tradicional de adquisición de hardware fragmentado, en el que una empresa compra aquí un servidor y una matriz de almacenamiento, es inadecuado para las necesidades de la IA moderna.
Avanzamos hacia la necesidad de un ecosistema unificado. Esto significa alejarse de los llamativos argumentos de venta y avanzar hacia una rigurosa validación técnica. La industria necesita un entorno donde las empresas puedan probar sus cargas de trabajo específicas en pilas válidas antes de comprometer una libra de capital.
Esto requiere un nuevo nivel de colaboración entre proveedores de hardware, consultores especializados en IA e integradores de infraestructura. El objetivo debe ser eliminar riesgos del proceso demostrando resultados antes de finalizar la inversión.
El camino a seguir: la IA como utilidad
La transición de la IA como tendencia a la IA como utilidad requiere un replanteamiento fundamental de la tecnología. La soberanía, el desempeño y la previsibilidad económica deben ser las tres métricas con las que se mide el éxito.
Para que la IA realmente cumpla su promesa, las organizaciones deben estar capacitadas para ejecutar sus modelos donde sus datos, políticas y prioridades lo dicten, donde un hiperescalador decide construir un centro de datos.
Al abordar estos desafíos fundamentales de infraestructura y avanzar hacia un ecosistema más colaborativo y legítimo, finalmente podremos ir más allá de la era del fracaso experimental. Sólo entonces podremos construir un futuro de IA sostenible, impulsado por el retorno de la inversión (ROI), que ofrezca valor real a la empresa.
Hemos presentado las mejores herramientas de IA.
Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.
Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: