Hoy en día, la mayoría de las conversaciones sobre la IA se desarrollan en la superficie. Los modelos son cada vez más grandes. La capacidad está mejorando. Casi a diario surgen nuevos casos de uso de herramientas de IA.
Ahí es donde está el foco y, hasta cierto punto, tiene sentido. Es visible. Es emocionante. Es fácil de entender.
Pero debajo de estos sistemas, algo más está sucediendo y está empezando a ser mucho más importante de lo que la gente espera.
CEO y cofundador de DH2i.
La IA está empujando a las empresas de todos los sectores hacia una nueva realidad funcional. Salud, finanzas, fabricación, SaaS, comercio minorista, servicio al cliente, viajes, gobierno, no importa.
En el momento en que la IA se convierte en parte de la experiencia del cliente o del flujo de trabajo central del negocio, las expectativas cambian. El sistema siempre debe estar encendido. Necesitan responder en tiempo real. Tienen que tener razón en todo momento.
El problema es que la mayor parte de la infraestructura que respalda esos sistemas nunca fue diseñada para ello.
Ahí es donde la brecha comienza a mostrarse.
Si miras de cerca, lo verás: los sistemas de IA están cada vez más orientados al cliente. Eso significa que la latencia ya no es una métrica técnica. Es un problema empresarial. Si un sistema se ralentiza, la experiencia se degrada. Si no es suficiente, la transacción no se realizará. Los ingresos están directamente relacionados con la capacidad de respuesta.
Al mismo tiempo, los entornos de datos que alimentan estos sistemas se han vuelto más complejos de lo que la mayoría de las organizaciones se sienten cómodas admitiendo. Los datos se distribuyen en entornos locales, múltiples nubes, plataformas en contenedores y ubicaciones de borde. Ya no está centralizado y está en constante movimiento.
Las empresas están tratando de equilibrar el rendimiento, los costos y la resiliencia, a menudo mientras cambian las cargas de trabajo, modernizan las aplicaciones y experimentan con la IA: las estrategias de infraestructura de TI se están repensando en tiempo real. De repente. Son muchas partes móviles.
Y luego está la seguridad y el cumplimiento. A medida que los datos se vuelven más distribuidos y más importantes para las decisiones en tiempo real, la superficie de exposición se expande. Los controles no siempre se traducen tan claramente en un entorno más estático. Ninguno de estos problemas existe de forma aislada. Son compuestos.
La brecha de disponibilidad de la IA
Lo que está empezando a surgir sólo puede describirse como una “brecha en la disponibilidad de la IA”.
Es la brecha entre lo que los sistemas de IA necesitan para funcionar de manera efectiva y lo que la infraestructura subyacente puede ofrecer de manera confiable. Y lo más importante es que este no es un problema de modelo.
Las organizaciones están invirtiendo mucho en modelos: afinándolos, optimizándolos e integrándolos en los flujos de trabajo. Pero el éxito de esas iniciativas está cada vez más limitado por algo mucho más fundamental:
Si el sistema permanece en línea.
Porque la disponibilidad no se trata sólo del tiempo de actividad cuando la IA se convierte en parte de un proceso en vivo. Se trata de coherencia… y de garantizar que los datos sean accesibles, coherentes y estén en el momento adecuado cuando se necesitan.
Este requisito es muy diferente de lo que la mayoría de los sistemas fueron diseñados originalmente para soportar.
Stack no oculta este problema
Lo que lo hace particularmente interesante es que no se puede aislar a un nivel. Lo ve como retrasos, tiempos de espera o experiencia de usuario degradada a nivel de aplicación… lo ve como retrasos en la replicación, inconsistencias o la brecha entre cuando algo sale mal y cuando el sistema lo detecta a nivel de datos… y los problemas comienzan en el nivel de la base de datos y tardan unos minutos en aparecer a nivel del sistema en muchos entornos. En una aplicación tradicional, esto puede ser aceptable. En un flujo de trabajo impulsado por IA, no lo es.
Esto se ve en la complejidad de las implementaciones híbridas y en contenedores a nivel de infraestructura. Los modos de falla son más complejos y difíciles de predecir porque los sistemas están distribuidos por diseño. Y si no se maneja con precisión, un solo problema puede afectar al medio ambiente.
Las plataformas como Kubernetes hacen exactamente lo que se supone que deben hacer, pero eso no necesariamente se traduce en disponibilidad de datos, incluso a nivel de orquestación. Reiniciar un pod no es una medida adecuada de disponibilidad para mantener una base de datos consistente y activa… ni siquiera un poco.
El problema aparece en todas partes porque no está ligado a ningún componente en particular. Es sistémico.
¿Por qué es cada vez más difícil y no más fácil?
Existe la suposición natural de que las arquitecturas modernas lo hacen fácil. en el contenedor Kubernetes. Nubes múltiples Se supone que brindan a las organizaciones más flexibilidad y resiliencia. En realidad introducen diferentes tipos de complicaciones.
Ahora tiene datos y cargas de trabajo que pueden residir en cualquier lugar, moverse en cualquier momento y escalar dinámicamente. Esto es poderoso, pero también significa que mantener la disponibilidad requiere coordinación entre capas que nunca antes estuvieron estrechamente acopladas.
No basta con mantener la infraestructura en funcionamiento. Debe asegurarse de que la capa de datos permanezca estable y accesible a medida que todo lo que la rodea cambia.
Ahí es donde la mayoría de las organizaciones sienten la presión.
Los verdaderos límites del éxito de la IA
Existe una tendencia a pensar que la adopción de la IA estará limitada por el rendimiento del modelo o la calidad de los datos.
Estos son importantes. Pero no son ellos los que impedirán que la mayoría de las empresas crezcan. La limitación original es funcional.
Se trata de si los sistemas subyacentes pueden soportar cargas de trabajo continuas y en tiempo real sin interrumpirse. Se trata de si pueden detectar el problema a tiempo para prevenirlo. Si pueden mantener la coherencia en entornos distribuidos.
Y cada vez más, si las organizaciones han desarrollado una estrategia de disponibilidad que refleje cómo se utilizan estos sistemas en la actualidad. Porque no importa el modelo si el sistema no está disponible.
Qué están haciendo de manera diferente los equipos más eficaces
Los equipos que no esperan al fracaso para descubrir huecos son los que van por delante. Están reconsiderando la accesibilidad no como una ocurrencia tardía sino como un principio central de diseño. Están agregando visibilidad a un nivel más profundo para poder detectar problemas antes de que afecten al sistema, lo que significa acercarse a los datos.
En lugar de tratar las cargas de trabajo locales, en la nube y en contenedores como cuestiones separadas, están estandarizando cómo se gestiona la disponibilidad en todos los entornos.
Y reconocen que la resiliencia de un mundo distribuido requiere más que redundancia de infraestructura. Se requiere coordinación, precisión y comprensión de cómo se propagan realmente las fallas a través de la pila.
La IA no falla porque los modelos no sean lo suficientemente buenos
La IA está limitada por el siguiente sistema. La brecha de disponibilidad es real. Está creciendo. Y no se solucionará con mejoras incrementales en la superficie.
Requiere un cambio en la forma en que las organizaciones piensan sobre las capas de datos, la infraestructura y lo que significa mantener un sistema “en la cima” en un mundo donde todo sucede en la realidad.
Porque al final del día, la pregunta no es qué tan inteligente es el modelo. Ya sea que esté ahí cuando lo necesites.
Contamos con las mejores herramientas de gestión TI.
Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.
Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: