Recientemente, durante unas horas, la plataforma global de nube Cloudflare dejó de funcionar, y con ella una parte importante de Internet.
Los servicios se paran, las plataformas se paran y las empresas se enfrentan a fallos que no provocaron y que no pueden controlar, desde cajas defectuosas hasta equipos internos retrasados.
Director de Información de la Tribu.
Desde fuera, parecía el habitual alboroto de Internet. Una actualización rápida, una espera breve y la mayoría de la gente se muda. Dentro de las organizaciones que dependían de esas capas superiores, el ambiente era muy diferente.
El artículo continúa a continuación.
Los equipos han visto sistemas ralentizarse o cerrarse por completo, y queda claro (nuevamente) con qué facilidad un solo error en un proveedor puede propagarse a través de un amplio ecosistema digital.
Y estos incidentes no son aislados.
A fines del año pasado, surgió otro problema de CloudFlare (esta vez un cambio de configuración salió mal) y desconectó las principales plataformas en cuestión de minutos. Las interrupciones en las plataformas tecnológicas globales y en los hiperescaladores como AWS han demostrado cómo la disrupción en una región puede extenderse rápidamente hacia afuera.
Incluso eventos externos como conflictos en Medio Oriente han dejado fuera de servicio a los centros de datos y obligado a los proveedores a redirigir el tráfico bajo presión. Además, los cambios asistidos por la IA han introducido una volatilidad inesperada.
Los desencadenantes varían, pero el patrón se vuelve familiar: una capa tropieza y todo lo construido sobre ella siente el impacto.
¿Por qué no se mantiene el corte?
La mayoría de las empresas no se consideran dependientes de Cloudflare, AWS o cualquier otro proveedor upstream. De hecho, están integrados en casi todos los aspectos de los servicios digitales modernos.
Los sistemas actuales se basan en una infraestructura apilada: plataformas en la nube, capas de enrutamiento y seguridad, CDN, sistemas de autenticación y API de terceros. Cada nivel agrega capacidades, pero también dependencias.
Cuando algo se rompe río arriba, no se queda. Se mueve hacia afuera a través de esas capas, afectando a los sistemas eliminados de la falla original.
Lo que asusta a la gente es lo lejos que está este viaje. El fracaso de un proveedor no sólo perjudica a sus clientes directos; Afecta a las plataformas construidas sobre ellas, a las herramientas de las que dependen esas plataformas y a las empresas de las que dependen para operar. Cuando el problema es visible, el radio de la explosión ya se ha extendido mucho.
Donde aparecen las primeras grietas
Los pagos exponen estas fallas antes que la mayoría. Una sola transacción afecta a una larga cadena de sistemas: infraestructura en la nube, motores de fraude, servicios de autenticación y redes de procesamiento. Si un enlace se rompe, el efecto se muestra inmediatamente. Las transacciones se cierran, las cajas se cierran y los clientes abandonan los carritos.
Eso tiene un coste comercial directo en minutos o incluso segundos.
Pero los pagos no son inherentemente frágiles; Es allí donde la gente siente más la interrupción: es su dinero el que está en juego. La misma dependencia se extiende a través de plataformas de comercio electrónico, herramientas SaaS, sistemas logísticos, atención al cliente y operaciones internas. Los pagos hacen que el problema sea imposible de ignorar.
Esto es lo que hace que la congestión de la infraestructura sea un riesgo tan grande. Un número relativamente pequeño de proveedores se encuentra actualmente en el centro de una enorme porción de servicios digitales. Esta escala aporta alcance y confiabilidad, pero también significa que el impacto no es aislado: cuando algo sale mal, rara vez afecta a una sola empresa.
Planifique para el fracaso, no para la perfección
A pesar de todo esto, las interrupciones todavía se tratan como “lo solucionaremos cuando suceda”, en lugar de algo que usted diseña de manera proactiva.
La redundancia se compara con el costo; El mapeo de dependencia está incompleto y la planificación de continuidad permanece intacta. Y persiste la suposición de que los principales proveedores no “se hunden”, aunque la historia reciente muestra que con toda seguridad sí lo hacen y lo volverán a hacer.
Hay otro problema detrás de todo esto, y es uno del que la mayoría de las organizaciones no hablan en voz alta: ya no controlan la infraestructura de la que dependen.
Durante la última década, las empresas han subcontratado la mayoría de sus sistemas centrales a una combinación de hiperescaladores y proveedores externos. Ha sido fantástico por su velocidad y escala. Pero cada vez que el servicio upstream falla, el comercio se detiene.
Cuando algo se rompe varios niveles por encima de ti, puedes esperar y hacer poco más que observar el impacto rodar hacia abajo.
La mayoría de las organizaciones ya cuentan con marcos para cubrir esto. Pero cuando Internet falla, lo que se pone a prueba no es la seguridad o el cumplimiento: es la disponibilidad. Y esa es la parte que se sostiene en el mundo real.
Especialmente en los servicios financieros, ha habido un movimiento silencioso hacia configuraciones híbridas: mantener las grandes nubes en juego pero agregar proveedores regionales o especializados como rutas de respaldo.
Parte de ese cambio radica tanto en la geopolítica como en la tecnología. La mayoría de las empresas europeas todavía operan en plataformas de inteligencia artificial y nube estadounidenses, y eso está bien hasta que la política global se calienta. Los bancos en particular se hacen una pregunta simple: ¿Qué pasa si esos servicios se enredan en una disputa política sobre la que no tienen control?
Cuando una sola interrupción puede anular la autenticación, el enrutamiento o los pagos en toda una región, tener otra ruta deja de ser algo bueno y comienza a ser una cuestión de autoconservación básica.
Diferentes organizaciones se mueven a diferentes velocidades debido a la regulación o al riesgo. Pero el mensaje es claro: estar en línea no es cuestión de suerte. Es algo de lo que estás hecho.
La presión no hace más que aumentar
Las condiciones que hacen que estos fenómenos sean tan disruptivos (infraestructura compartida, sistemas estrechamente conectados, servicios digitales en tiempo real) no van a desaparecer. En todo caso, se están volviendo más intensos.
Por lo tanto, la verdadera pregunta para las empresas no es si se producirá otra interrupción, sino qué tan expuestas estarán cuando ocurra y con qué rapidez esa exposición se convierte en pérdida de ingresos, interrupción operativa y frustración de los clientes.
Dado el comportamiento de la Internet moderna, estar en línea no es el destino; Debe estar diseñado para. Entonces, recuerde… haga las cosas básicas para suavizar el golpe: rutas de respaldo, una vista clara de sus dependencias y ningún punto de falla oculto esperando para derribarlo.
Hemos presentado las mejores herramientas de experiencia del cliente (CX).
Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.
Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: