Oswald Regular
OpenSans Regular
Pasión por el archivado
Una importante empresa de difusión necesita un archivado de datos con capacidad de respuesta y suficiente potencia.

El archivado de datos es un tema aburrido. Incluso su definición es aburrida:

“El archivado de datos es el proceso consistente en mover los datos que se hayan dejado de utilizar activamente a un dispositivo de almacenamiento independiente para su retención a largo plazo. Los archivados de datos constan de datos más antiguos que siguen siendo importantes y necesarios para consultarlos en el futuro. Los archivados de datos están indexados y tienen funciones de búsqueda para que estos se puedan ubicar y recuperar.” –Whatis.com

Con una antigüedad de más de 25 años, el archivado de datos no es un concepto que despierte interés entre los curiosos de la tecnología. No suscita, desde luego, la atención que generan las redes sociales o el último iPad. Tampoco figura, como tema de conversación, entre los más estimulantes. Sin embargo, en los últimos años, el archivado de datos se ha convertido en un asunto de importancia creciente para los departamentos de TI. ¿Por qué será que interesa tanto ahora?

Ocurren dos cosas. En primer lugar, la necesidad de archivar datos se ha incrementado significativamente como consecuencia de los cambios en la regulación y por el deseo de las empresas de retener cuanto más tiempo la mayor cantidad de datos disponibles. En segundo lugar, la variedad y la cantidad de datos dificulta cualquier proceso desde un punto de vista técnico. Basta pensar en la configuración de los procesos para capturar los datos desde diferentes bases de datos y archivos, como por ejemplo, XML; o pensar en el almacenamiento físico de los datos y el acceso rápido ad-hoc a los mismos. (Es posible que lo anterior no parezca demasiado complicado, pero si no se cumplen estos requisitos, un negocio puede llegar a cerrar).

Una importante compañía de difusión se enfrentaba a esta clase de desafíos. En su caso, la cantidad de datos que se agregan cada mes a los sistemas empresariales centrales, como la administración de relaciones con los clientes (CRM) y la facturación, provocaba problemas operacionales. Así, los tirajes de facturación tomaban demasiado tiempo. Los representantes del servicio de atención al cliente obtenían tiempos de respuesta muy malos cuando respondían a los clientes por teléfono. Etcétera… En resumidas cuentas: los problemas del archivado de datos estaban afectando negativamente a la compañía tanto desde un punto de vista de la calidad del servicio al cliente, como desde un punto de vista financiero. La resolución de estos problemas era de interés prioritario.

PRIMERAS SOLUCIONES

Como no podía ser de otro modo, la primera solución posible que exploró la compañía fue la agregación de hardware a los sistemas operacionales preexistentes y, en consecuencia, la eliminación de la necesidad de archivar datos. Sin embargo, dada la cantidad de datos que se agregan a las bases de datos todos los meses, esta opción habría conllevado una serie continua de actualizaciones costosas a lo largo del tiempo. Con ventajas limitadas, además. El problema residía en la arquitectura interna de las bases de datos que contienen los datos, ya que éstas no se podían escalar de forma lineal. Después de realizar muchas comprobaciones, se concluyó que la única respuesta práctica y rentable consistía, sencillamente, en reducir el tamaño de las grandes tablas de bases de datos. Aunque por ley está obligada a almacenar los datos de los últimos siete años, la compañía de difusión precisa únicamente conservar en los sistemas operacionales los datos de los últimos 18 meses. Los restantes se pueden archivar. La gran mayoría de los datos (miles de millones de registros) se concentran en unas pocas grandes tablas de “hechos”, como las facturas o los contactos. Al archivar estos datos y quitarlos de los sistemas operacionales originales, el análisis mostraba que se podían mejorar significativamente el rendimiento y los tiempos de respuesta.

Sin embargo, esta solución tenía una desventaja. Muchos miles de usuarios dentro de la compañía seguían necesitando acceder a todos los datos en tiempo real. Y muchos de ellos, eran representantes de atención al cliente que exigían tiempos de respuesta de unos segundos. La dificultad se incrementaba por el hecho de que otro conjunto de usuarios deseaba poder combinar los datos desde el archivo con otros datos conservados en sistemas operacionales y en sistemas de inteligencia empresarial: una “consulta federada” compleja.

La combinación de estos desafíos técnicos significaba que no existía un paquete comercial disponible al que se pudiera recurrir. La única compañía que podía solucionar todos los aspectos de los requisitos de archivado era Ab Initio.

EXTRACCIÓN DE DATOS MIENTRAS SE FACILITA EL ACCESO

Al utilizar el Co>Operating System® de Ab Initio®, los desarrolladores de la compañía construyeron aplicaciones en paralelo llamadas “grafos”, concebidas para descargar los miles de millones de registros que se quieren archivar desde sus bases de datos operacionales. Los datos extraídos fueron escritos en paralelo en un sistema Indexed Compressed Flat File (ICFF) de Ab Initio. Los sistemas ICFF no sólo pueden cargar datos a una velocidad mucho mayor que las bases de datos tradicionales, sino que también requieren solamente una pequeña fracción del disco para contener los datos (lo que es ideal para un archivo). Para acceder a estos dispositivos de almacenamiento, Ab Initio suministraba una interfaz de servicios web y una interfaz SQL estándar para ANSI para las consultas ad-hoc. La interfaz SQL también es compatible con consultas federadas a través del archivo y de las bases de datos operacionales. En resumen: Ab Initio ofrecía una solución completa.

AHORRO DE COSTOS

El proyecto ha sido extremadamente exitoso para este cliente. Han mejorado significativamente el rendimiento y el tiempo de respuesta de sus sistemas operativos. Al mismo tiempo, tienen acceso a terabytes de datos archivados en menos de un segundo. Y dado que la mayoría de los datos centrales se han movido desde un almacenamiento Tier-1 a datos comprimidos en un disco de bajo costo, también se han ahorrado así costos para el negocio.

Tal vez después de todo, el viejo tema del archivado de datos pueda resultar apasionante.

English
Français
Idioma:
Español
Deutsch
简体中文
日本語