En marzo de este año, el CEO de NVIDIA, Jensen Huang, dijo: “Aproximadamente el 90% (de los datos) generados cada año son datos no estructurados. Hasta ahora, estos datos son completamente inútiles para el mundo”.
Si toma este comentario al pie de la letra, debería ser una preocupación importante. La cifra del 90% se cita ampliamente como representativa del correo electrónico, imágenes, videos, audio o cualquier cosa que las organizaciones creen y retengan pero que no sea fácil de categorizar o analizar utilizando sistemas tradicionales.
Vicepresidente de marketing de productos, DataDoB.
Es lógico que si las organizaciones no pueden utilizar casi todos los datos que generan, se enfrentan a una brecha significativa entre la información que poseen y el valor que derivan de ella.
Entonces, ¿cómo llegamos aquí? El “fracaso” de los datos no estructurados se debe en parte a que no están bien atendidos por las herramientas tradicionales de gestión y análisis. Como resultado, muchas organizaciones todavía luchan por responder preguntas básicas, como: ¿qué datos tenemos, dónde están, cómo se utilizan y si tienen algún valor?
Patea la lata por el camino
Es un conjunto de desafíos que casi todas las empresas quieren abordar. La visibilidad de los datos es un buen ejemplo. ¿Qué tan bien, por ejemplo, pueden las empresas típicas distinguir entre datos activos e inactivos o identificar los más valiosos, los redundantes o los que ya no son necesarios?
La respuesta es que muchas organizaciones no pueden y, para solucionar el problema, optan por mantener casi todo. Cuando su infraestructura de almacenamiento comienza a llenarse, agregan más. El problema de dejar de lado la estrategia de datos es que es un problema de control y gestión muy costoso.
Además de almacenar lo que es importante, las organizaciones casi inevitablemente retienen cantidades significativas de datos inactivos o sin valor. Al costo se suma el hecho de que a menudo está alojado en un almacenamiento empresarial de alto costo y alto rendimiento, un gasto que puede aumentar considerablemente con el tiempo.
Desafortunadamente, los problemas no necesariamente terminan ahí. Sin procesos claros de propiedad y manejo de datos, eso exacerba innecesariamente los ya complejos desafíos de gobernanza y cumplimiento.
Esto es problemático en cualquier momento, pero es especialmente doloroso ahora debido a la extrema volatilidad de los precios de almacenamiento. Algo tiene que ceder, y muchas empresas necesitan un cambio estratégico que deje de conservar datos a casi cualquier costo y se centre mucho más en la eficiencia y la gestión eficaz. La conclusión es que la expansión descontrolada de los datos no estructurados no tiene ventajas.
Convertir el caos en orden
Estos problemas adquieren mayor importancia a medida que aumentan los volúmenes de datos, especialmente porque la calidad de los datos rara vez permanece constante en el tiempo. En muchos entornos, el período para el uso activo de datos suele ser de 30 a 90 días, después del cual su relevancia comienza a disminuir a medida que se genera nueva información. Muchas empresas también descubren que más del 60 % de sus datos almacenados no han sido accedidos ni modificados durante años, pero se conservan debido a la falta de visibilidad o de una orientación política clara.
Esto refuerza la necesidad de una gestión basada en el ciclo de vida, en la que los datos se evalúen y muevan, archiven o muevan continuamente según criterios definidos en lugar de conservarlos indefinidamente de forma predeterminada. El primer paso para recuperar el control sobre la gestión de datos y los costos de infraestructura de TI es que las empresas desarrollen una mejor comprensión de los datos que existen en su entorno. Requieren información sobre los metadatos asociados (y detallados), incluida la edad, la actividad, la propiedad y otras etiquetas clave.
Entonces es posible aislar activos de datos de alto valor que ya no son relevantes o necesarios. Proporciona la base para gestionar datos de forma más segura y eficaz a lo largo de su ciclo de vida y permite a los equipos de TI tomar decisiones informadas sobre retención, archivado y eliminación.
A lo largo de este proceso, la coherencia y la gobernanza del sistema son fundamentales, ya que en los entornos modernos donde los datos se distribuyen cada vez más en las instalaciones y en la nube, un sistema fragmentado puede colapsar rápidamente. La buena gobernanza ayuda a mantener todo encaminado al establecer hitos clave y responsabilidades para los activos de datos, mientras que las políticas de gestión coherentes garantizan que los conjuntos de datos cumplan tanto con los requisitos operativos como con las obligaciones regulatorias.
Ahora que muchas empresas dependen profundamente de los datos, recuperar el control sobre los datos de alto valor y tener la confianza para almacenar y eliminar lo que ya no es necesario debería ser una prioridad operativa y financiera. Si se hace bien, existe una posibilidad muy real de que todos salgan ganando cuando los datos empresariales no sólo se gestionen mejor sino que tengan más probabilidades de respaldar el éxito final.
Contamos con las mejores herramientas de migración de datos..
Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.
Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: