¿Ropa nueva, datos viejos, no sólo big data?
Las innovaciones en IA están generando un crecimiento exponencial en la cantidad y el valor de la información. Más específicamente, la IA generativa finalmente está cumpliendo la promesa del big data: convertir los datos en inteligencia procesable.
Pero aquí está el verdadero cambio: esos conocimientos no provienen sólo de los datos de ayer. Provienen de todo lo que una empresa haya capturado. Cada byte puede contener el siguiente progreso.
Por eso las empresas están reconsiderando los datos como un activo estratégico a largo plazo, no como algo que deba descartarse. Big data te ofrece el “ahora”. Los datos históricos le dan el “por qué”. Juntos, alimentan la inteligencia.
Melissa Banda es vicepresidenta sénior de almacenamiento y servicios perimetrales en Seagate
¿Por qué son tan importantes los datos heredados (IA, ML) y dónde se encuentran principalmente? (¿Cinta? ¿Un disco duro viejo? ¿Papel?)
La IA no existe sin datos y los modelos más potentes se basan en patrones que abarcan el tiempo. Los datos históricos brindan contexto a la IA, convirtiendo las predicciones en precisión y las ideas en innovaciones.
Piénselo de esta manera: la humanidad siempre ha almacenado información, desde tablillas de arcilla en Mesopotamia hasta tarjetas perforadas para el censo de Estados Unidos. La diferencia hoy es que hay más en juego. La IA se nutre del volumen y la variedad. Más datos significa mejores resultados, lo que brinda a las organizaciones una ventaja competitiva.
Donde residen esos datos, la gran mayoría, aproximadamente el 87% en implementaciones grandes, se almacena en discos duros. Las cargas de trabajo modernas de IA exigen discos duros escalables y de alta capacidad optimizados para un rendimiento y estabilidad sostenidos. Ya no se trata sólo de velocidad, sino de manejar grandes volúmenes, garantizar la retención a largo plazo y hacerlo a escala.
El mantenimiento de datos antiguos conlleva un coste. ¿Qué puede pasar si las empresas deciden eliminar por completo los datos antiguos?
Borrar datos no significa ahorrar costos, sino borrar valor potencial. Cada byte eliminado es una oportunidad perdida para entrenar mejores modelos y generar conocimientos propios.
En sectores como el financiero, el sanitario y el manufacturero, los datos históricos son esenciales para la detección de anomalías, el mantenimiento predictivo y el análisis de tendencias. Sin ella, la IA se vuelve menos precisa, menos transparente y menos confiable.
También hay un aspecto de cumplimiento. Los reguladores exigen cada vez más la auditabilidad de la toma de decisiones de la IA. Si no puede rastrear sus datos de entrenamiento, no podrá demostrar su responsabilidad.
Borrar datos históricos es como borrar la memoria institucional. Se pierde la materia prima para la innovación. Una vez desaparecido, su valor desaparece.
Hace unos años, los clientes preguntaban: “¿Por qué almacenamos todos estos datos?” Hoy se preguntan: “¿Por qué lo borramos? Ayúdanos a salvarlo”.
¿Qué soluciones pueden reducir el OPEX del almacenamiento de datos antiguos?
El objetivo no es sólo almacenar datos de forma económica, sino también de forma inteligente. Muchas organizaciones están migrando a arquitecturas de almacenamiento por niveles, donde los datos a los que se accede con frecuencia se encuentran en sistemas de alto rendimiento, mientras que los datos más antiguos o a los que se accede menos se trasladan a niveles con costos optimizados.
Este enfoque garantiza que las empresas no paguen por un rendimiento que no necesitan. En resumen, almacenar de forma más inteligente, no sólo más barata.
En una declaración, usted y Seagate dijeron que las organizaciones deben repensar la gestión del ciclo de vida de los datos, pero con la tecnología avanzando tan rápido como lo hace actualmente, ¿es eso realmente posible?
La IA ha redefinido el valor de los datos, lo que significa que la gestión del ciclo de vida de los datos ya no puede significar archivarlos. Se trata de construir una infraestructura flexible y escalable que se adapte a medida que evolucionan las cargas de trabajo.
El antiguo modelo de “almacenar y olvidar” ya no funciona. Piense en los datos como capital, son dinámicos y la tecnología también los impulsa. Las organizaciones que hoy en día reconsideran la gestión del ciclo de vida no sólo se mantienen al día, sino que también construyen una base que crece con ellas.













