Oswald Regular
OpenSans Regular
Prepararse para el despegue
Los metadatos permiten que los almacenes de datos empresariales despeguen más rápidamente de lo que se podría esperar.

Los usuarios tienden a subestimar el desafío que representa el armado de los almacenes de datos empresariales (EDW).

A modo de comparación, tomemos como ejemplo el proceso de fabricación de un avión. Aunque un aparato puede estar compuesto de cientos de miles de piezas, cada avión que sale de la línea de montaje es más o menos idéntico al que se fabricó con anterioridad. Las piezas se diseñan por adelantado y se fabrican de manera que encajen las unas con las otras. La arquitectura de un avión es bien conocida: la forman dos alas, un fuselaje, el tren de aterrizaje… La ingeniería necesaria para decidir los tamaños, las formas y los materiales también se conoce con exactitud durante la fase de diseño. Además, todos los aviones se desplazan por el aire y las propiedades del aire en la atmósfera de la Tierra están bien documentadas. En resumidas cuentas: por muy difícil que sea fabricar aviones, hacerlo es una tarea fácilmente reproducible y con resultados predecibles.

No puede decirse lo mismo en el caso de los almacenes de datos empresariales. Cada almacén de datos empresariales es diferente de todos los demás. Cada uno tiene un conjunto completamente diferente de entradas y salidas, con métodos diferentes para organizar los datos en una estructura comprensible. En un intento de crear conformidad y facilitar la reutilización, los clientes se han inclinado por utilizar “modelos estándar en la industria”. Aunque a priori esto parece ser una buena idea, la realidad es distinta. Partir de una premisa semejante equivaldría a decir que los aviones, los helicópteros y las naves espaciales se pueden fabricar a partir de los mismos planos maestros. Conceptualmente, todos esos artefactos son la misma cosa, pero un análisis más detallado revela que, entre ellos, existen diferencias considerables.

POR QUÉ ES TAN DIFÍCIL

Y tan considerables. En el mundo de los almacenes de datos empresariales, el análisis detallado empieza una vez se identifican los requisitos. El modelo estándar en la industria se transforma, primero, en un modelo físico. El modelo físico se transforma, luego, en especificaciones. Las especificaciones se convierten en hojas de cálculo de reglas y asignaciones. Las hojas de cálculo se envían a otros países para convertirlas en código. Cuando el código es recibido de vuelta, se ejecuta con datos reales. Y, a menudo, por primera vez. No debería sorprender si ocurre que el código no coincide con los datos, lo cual obliga a reanudar el trabajo desde cero. Y así repetidamente. Este proceso equivaldría a ponerse a fabricar un avión antes de saber si va a desplazarse a través de aire o de agua. Aunque se disponga de los mejores arquitectos e ingenieros, los errores van a ser recurrentes y costosos.

Para complicar aún más el problema, como hay tantas secuencias de datos saliendo de y entrando en él, el almacén de datos empresariales se descompone en muchos “feeds”. Un nutrido grupo de técnicos trabaja independientemente en cada uno de ellos. Para coordinar a todas esas personas, cada “feed” se descompone en diferentes pasos; con una persona diferente asignada, por lo general, a cada paso. El resultado es un gran número de transferencias de una persona a la siguiente, con muy poca reutilización, puesto que cada “feed” se desarrolla por separado. El proceso hace que se multiplique el tiempo necesario para armar un almacén de datos empresariales. Y, como dice refrán, el tiempo es oro. Cuando se utiliza el enfoque estándar con tecnologías estándar, los almacenes de datos empresariales son muy caros de armar.

CÓMO PUEDE AYUDAR AB INITIO

Pero hay un enfoque mejor.

Ab Initio® ha atacado este problema aplicando un razonamiento de “primeros principios”. Con resultados sorprendentes. En lugar de un “feed” que tarda entre tres y cuatro meses en implementarse, el enfoque de Ab Initio tarda entre dos y tres semanas. Y a veces, solamente toma unos días. Ab Initio llama a este enfoque el armado de un almacén controlado por metadatos (ACM).

Un ACM lo compone una colección de aplicaciones basadas en Ab Initio que son reutilizables y que pueden procesar datos desde el archivo de origen hasta el modelo de almacén de datos empresariales consolidado. Esto incluye toda la complejidad del procesamiento de “feeds” que se suele armar manualmente: “check-in/check-out” de archivos, enriquecimiento de datos, filtrado, validación, limpieza, administración de claves, administración de historiales, agregación, asignación, archivado, recuperación y carga de modelos. Cada una de estas actividades del almacén de datos empresariales se ha abstraído hasta un nivel en el que es posible utilizar la misma aplicación de plantilla en una amplia gama de “feeds”, simplemente cambiando los metadatos asociados.

Por diseño, el ACM permite que un analista especifique y compruebe el procesamiento para un “feed” al comienzo del ciclo; por lo general, sin ninguna participación del equipo de desarrollo. Este enfoque está basado en la utilización de metadatos para controlar el sistema. Estos metadatos son los mismos que el analista normalmente tendría que especificar en un documento, como el modelo de datos de destino, los formatos de archivo, las claves, las reglas de asignación y así sucesivamente. En lugar de escribir un documento y pasarlo a un equipo de desarrollo, el analista, utilizando el ACM, puede introducir los metadatos directamente, para luego ejecutar y comprobar la aplicación resultante inmediatamente con datos reales, con lo que se evitan las prolongadas y costosas iteraciones de desarrollo y comprobación. El tiempo que se ahorra es enorme, y la calidad del sistema resultante es mucho mayor, pues pasa por muchas menos manos.

La tecnología de Ab Initio ha sido diseñada, desde el inicio, para facilitar este enfoque. Desde la perspectiva del usuario, los ahorros comienzan con la construcción del ACM, y las ventajas van en aumento. Por ejemplo, todos los metadatos introducidos se almacenan en un repositorio de metadatos de Ab Initio, llamado el Enterprise Meta>Environment® (EME®), que proporciona las funciones de administración necesarias, como el control de versiones, el linaje de los datos, el análisis de impacto, la calidad de los datos y la seguridad de acceso. El EME proporciona a los administradores una vista integrada de sus sistemas de la cual no dispondrían de otra forma. Así, los administradores pueden realizar consultas acerca de cómo los campos fueron calculados en los informes, rastreándolos de vuelta hasta los sistemas operacionales. También pueden averiguar cómo se propagan los datos a través del sistema (informaciones éstas que son necesarias para los auditores y para predecir las necesidades de mantenimiento). Pueden, además, examinar la calidad de los datos y averiguar cómo esa calidad afecta a los sistemas que siguen en la cadena de procesamiento. En resumen, los administradores pueden comprender los sistemas por cuyo armado han pagado y cuyo funcionamiento era, anteriormente, un misterio.

Ab Initio ha ayudado a muchos clientes a armar ACM. Y mientras que cada ACM creado con Ab Initio satisface necesidades específicas y diversas en función de esos clientes, los resultados son repetibles y predecibles.

English
Français
Idioma:
Español
Deutsch
简体中文
日本語