Arquitectura de observabilidad evolucionada para datos de eventos a escala de la nube

Las empresas modernas producen grandes cantidades de telemetría y, a medida que los sistemas se vuelven más complejos, aumenta el riesgo de fallas.

En condiciones normales, las plataformas observables funcionan bien y proporcionan paneles de control receptivos y alertas confiables.

El artículo continúa a continuación.

Eric Chatter

Arquitecto Principal en Employ.

Cuando la arquitectura no coincide con la carga de trabajo

La escala y complejidad de la telemetría moderna presenta un problema arquitectónico clave. Muchas plataformas de observabilidad están diseñadas para un monitoreo predecible y estable, no para las preguntas exploratorias impredecibles que se requieren durante los eventos.

Los sistemas de observabilidad monolíticos basados en la detección suponen que pueden soportar tanto observaciones predefinidas como investigaciones abiertas. Pero en la práctica, estos sistemas están optimizados para flujos de trabajo en los que las preguntas se conocen de antemano.

Cuando surgen problemas inesperados, estos sistemas tienen dificultades para manejar grandes conjuntos de datos y consultas ad hoc entre varios equipos.

Esta no es una brecha de características. Este es un desajuste arquitectónico.

Cómo los entornos de observabilidad en evolución aumentan la complejidad y el costo

Los entornos digitales actuales producen mucha más telemetría que la mayoría de las organizaciones en años anteriores, y todo está impulsado por microservicios, infraestructura nativa de la nube y cargas de trabajo de IA. A medida que crecen los datos, los equipos dependen de grandes conjuntos de datos históricos para investigar problemas, lo que a menudo requiere acceso simultáneo de varios usuarios.

Al mismo tiempo, la economía de la nube ha cambiado. El almacenamiento en la nube es relativamente económico, pero la computación (especialmente durante consultas exploratorias grandes) se ha convertido en un factor de costo dominante. Muchas plataformas de observabilidad combinan estrechamente el almacenamiento, la indexación y la computación en la nube, lo que obliga a las organizaciones a escalar los tres juntos.

Esto crea una ineficiencia estructural: los costos aumentan con el volumen de datos, incluso cuando esos datos se consultan con poca frecuencia. Los equipos deben elegir entre retener menos datos, aceptar investigaciones más lentas o aprovisionar en exceso la infraestructura de TI para lograr el máximo rendimiento.

Por qué la observabilidad avanza hacia sistemas desacoplados y nativos de eventos

Para abordar estos desafíos, las arquitecturas de observabilidad se están alejando de sistemas estrechamente acoplados hacia un modelo desacoplado donde el almacenamiento, la computación y la visualización de datos actúan como capas independientes. Esta separación introduce flexibilidad y permite a las organizaciones almacenar más telemetría, realizar cálculos bajo demanda y acceder a los mismos datos subyacentes a través de múltiples herramientas sin duplicación.

Al mismo tiempo, la propia estructura de datos está evolucionando. Los sistemas nativos de eventos tratan los eventos (como registros de aplicaciones, solicitudes de usuarios y llamadas API) como la unidad básica de análisis. En lugar de depender de técnicas de indexación predefinidas, los datos se almacenan en un formato optimizado para escaneos a gran escala y consultas de alta cardinalidad.

Esto permite investigaciones más flexibles y varios equipos pueden buscar los mismos datos simultáneamente sin una degradación significativa del rendimiento.

Los sistemas creados según este modelo, como Apache Druid, han demostrado la capacidad de soportar cargas de trabajo militares rápidas y de gran intensidad manteniendo al mismo tiempo el rendimiento interactivo a escala. Esto es importante para los flujos de trabajo de investigación, donde los patrones de consulta son impredecibles y, a menudo, colaborativos.

Los sistemas nativos de eventos resuelven problemas de descubrimiento de datos, mientras que las arquitecturas de observabilidad desacopladas resuelven problemas de escala y costos. La monitorización moderna y eficaz requiere la arquitectura y el modelo de datos adecuados. Este cambio refleja patrones observados en otros dominios de datos.

Las plataformas de inteligencia empresarial, por ejemplo, inicialmente dependían de arquitecturas estrechamente acopladas antes de evolucionar hacia sistemas desacoplados. A medida que crecen los volúmenes de datos, separar el almacenamiento, el procesamiento y la visualización permite que cada capa escale de forma independiente e innove más rápidamente. La observabilidad sigue ahora el mismo camino.

Almacén observable: una capa de datos dedicada

La próxima evolución arquitectónica de los sistemas de observabilidad introduce una capa de datos especialmente diseñada que se encuentra debajo de plataformas de observabilidad tradicionales como Splunk, Grafana y Kibana.

Conocido como almacén observable, permite a las organizaciones almacenar grandes cantidades de telemetría, consultarla rápidamente cuando sea necesario para investigaciones y realizar cálculos en función de la demanda (en lugar del tamaño de los datos). Mejora la rentabilidad y la resiliencia operativa.

Separar la capa de datos brinda a los equipos más flexibilidad para analizar los mismos datos nativos de eventos en múltiples herramientas, adaptarse a nuevas tecnologías a lo largo del tiempo y evitar verse limitados por una arquitectura de plataforma única. Las técnicas de retención, los motores de consulta y las capas de visualización se pueden desarrollar de forma independiente.

Las investigaciones serán más colaborativas y requerirán más datos a medida que aumenten los volúmenes de telemetría. Las organizaciones que alineen su arquitectura de observabilidad con el comportamiento de estas cargas de trabajo estarán mejor posicionadas para responder rápidamente, controlar los costos y operar de manera confiable a escala.

Hemos clasificado las mejores herramientas ITSM.

Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.

Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí:

Enlace de origen