Durante la última década, los proveedores de observabilidad han estado atrapados en una guerra de interfaces. Competir sobre cómo se ven y se sienten las herramientas. A medida que la ingesta de datos se ha convertido en un producto básico a través de estándares como OpenTelemetry, la verdadera diferenciación se ha trasladado a la interfaz de usuario (UI).
En Clickhouse, Mike Shi es director de producto y Arno van Driel es vicepresidente de EMEA.
A medida que los proveedores compiten en visualizaciones, paneles y flujos de trabajo, está comenzando a producirse un cambio más profundo hacia la unificación de registros, seguimientos y métricas en una única experiencia exploratoria.
Esto significa que los equipos pueden ver toda la actividad en una sola vista y comprender más fácilmente lo que sucede en sus sistemas en tiempo real. La observabilidad, en muchos sentidos, se ha convertido en un problema de la interfaz de usuario, basado en la eficacia con la que las personas pueden navegar e interrogar datos complejos para convertirlos en conocimientos procesables.
Eso sirvió bien al arte del encuadre. Pero ahora está siendo desafiado por un nuevo nivel de sofisticación en los sistemas modernos.
Los consumidores están cambiando
A medida que surgen sistemas de IA agentes en toda la empresa, el principal consumidor de datos observables está pasando de un operador humano a una máquina.
Cuando esto sucede, el valor de los flujos de trabajo pulidos con integración de señales disminuye y el centro de gravedad se desplaza hacia abajo en la pila.
La pregunta ya no es qué tan eficientemente una persona puede navegar por la telemetría y llegar a la causa raíz. Se trata de razonar sobre si el sistema subyacente tiene los datos correctos, la retención adecuada y las características adecuadas para las máquinas.
Esta transición aún no está completa aquí, pero la dirección no está clara. Los agentes de IA ya son capaces de detectar patrones y correlaciones en grandes cantidades de telemetría, incluso si todavía tienen dificultades con el verdadero razonamiento causal.
Esa brecha se está cerrando activamente. Todos los principales proveedores de nube y laboratorios de inteligencia artificial están invirtiendo en capacidades de agentes que van más allá de la interfaz de chat hasta la toma de decisiones autónoma. Una pregunta más importante es si las plataformas de observabilidad existentes están diseñadas para este futuro.
Las compensaciones que tenían sentido ya no lo tienen
Las plataformas de monitoreo dominantes en la actualidad se construyeron a partir de suposiciones de que cuando los humanos eran los únicos operadores del circuito. En ese entorno, los sistemas se diseñaron en torno a cómo los ingenieros investigaban y resolvían problemas manualmente.
Como resultado, los períodos de retención de datos son cortos, a veces solo días, porque los ingenieros rara vez necesitan mirar hacia atrás.
Del mismo modo, el muestreo y los resúmenes son invasivos porque un operador capacitado puede llenar los vacíos con experiencia e intuición. Incluso los modelos de precios reflejan esta realidad, ya que están optimizados para consultas relativamente poco frecuentes impulsadas por humanos en lugar de análisis continuos.
Esta compensación era razonable para todo ser humano. Las máquinas se convierten en un problema sólo cuando se espera que realicen tareas analíticas.
Los períodos de retención cortos impiden que los agentes de IA identifiquen tendencias, estacionalidades y relaciones entre eventos. Un agente de IA que solo puede observar los datos de las últimas 72 horas, por ejemplo, no puede aprender que un pico de tráfico particular se repite en un ciclo predecible vinculado a tendencias estacionales.
Sin un contexto a largo plazo, los agentes de IA permanecen atrapados en el mismo bucle reactivo del que se suponía que la observabilidad ayudaría a escapar a las organizaciones.
El muestreo agresivo plantea un problema diferente. La acumulación y la preconvergencia eliminan las señales detalladas que la máquina necesita para una lógica correcta.
Una persona que revisa un gráfico de latencia puede tomar una decisión sobre si la distribución subyacente es importante. Un agente de IA no puede permitirse ese atajo. Requiere datos de total fidelidad, porque las señales en las que se basa están sobremuestreadas con precisión.
Luego está la cuestión de la economía. Las plataformas que cobran por consulta, limitan la concurrencia o vinculan el acceso a usuarios humanos designados están fundamentalmente en desacuerdo con la forma en que trabajan los agentes de IA. Los agentes de IA no ejecutan una consulta ni estudian un gráfico. Realizan análisis continuos y paralelos en múltiples dimensiones simultáneamente.
Un modelo de precios que penalice el acceso a máquinas de gran volumen generará costos insostenibles o obligará a los equipos a limitar artificialmente lo que están tratando de habilitar.
Estos patrones ya influyen en cómo evoluciona la infraestructura de datos subyacente. Sistemas de gestión de bases de datos que tratan la observabilidad como una carga de trabajo de primera clase.
En lugar de segregar registros, métricas y seguimientos en diferentes sistemas o muestrear grandes cantidades de datos, están diseñados para almacenar y buscar conjuntos de datos de telemetría completos a escala dentro de una única capa de base de datos.
Esto hace posible retener y analizar todos los datos en lugar de trabajar desde una visión reducida del comportamiento del sistema.
Obviamente preparándonos ahora para lo que está por venir.
La buena noticia es que las organizaciones no tienen que esperar a que el monitoreo autónomo total comience a prepararse. Los requisitos ya son visibles y trazan las decisiones que los líderes pueden tomar hoy.
La retención es más importante que nunca. Si una plataforma solo contiene unos pocos días de datos de alta resolución, esto crea un límite estricto para las capacidades de los futuros agentes de IA antes de su implementación.
La fidelidad absoluta no es un lujo de datos. La tendencia hacia el muestreo se entiende cuando el almacenamiento y la computación eran limitaciones y los humanos eran los únicos consumidores. A medida que los costos de almacenamiento y recuperación de telemetría sin procesar continúan disminuyendo, conservar los datos originales se ha convertido en una opción más conservadora.
La economía debe alinearse con los patrones de acceso a las máquinas. Esto significa evaluar no solo el precio de etiqueta de una plataforma observable, sino también cómo cobra por las cargas de trabajo continuas y altamente consistentes que crean los agentes de IA.
Las organizaciones que hagan esto bien podrán implementar agentes de IA con confianza. Los que no se defienden.
Hemos presentado las mejores herramientas de IA.
Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.
Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: