Oswald Regular
OpenSans Regular
Rapidité de mise en œuvre
Les métadonnées permettent de mettre en œuvre les entrepôts de données d'entreprise plus rapidement qu'on ne le pense.

Les difficultés liées à la création des entrepôts de données d'entreprise sont généralement sous-estimées par les utilisateurs.

Le modèle de construction d'un avion, basé sur la standardisation des pièces et du processus, ne peut pas être appliqué aux entrepôts de données dont la forme finale est unique à chaque entreprise. En effet, pouvant comporter des centaines de milliers de pièces, un avion sortant de la chaîne de montage est similaire à celui qui le précède. Les pièces sont préconçues et fabriquées pour être assemblées. L'architecture de l'avion est bien définie (deux ailes, un fuselage, un train d'atterrissage) et au moment de la conception, l'ingénierie relative aux dimensions, aux formes et aux matériaux utilisés est entièrement connue. Tous les avions volent dans l'air et les propriétés de l'air par rapport à la terre sont bien documentées. Par conséquent, bien que la construction aéronautique soit délicate, elle n'est que le résultat d'une tâche répétitive produisant des résultats prévisibles.

Or ce n'est pas le cas pour les entrepôts de données d'entreprise. En effet, chaque entrepôt de données est unique. Les données d'entrée et de sortie sont propres à chaque entreprise, tout comme les méthodes permettant d'agréger les données en une structure appréhendable. Pourtant, dans un souci de conformité et à des fins de réutilisation ultérieure, les clients se sont orientés vers des « modèles de normes de l'industrie ». Ce concept peut sembler judicieux pour d'autres domaines, mais la grande disparité des entrepôts de données ne s'y prête pas. D'une entreprise à l'autre, le concept « d'entrepôt de données » est le même, mais les détails qui le composent le rendent unique.

DES MODÈLES STANDARD INADAPTÉS

L'intégration des détails propres à chaque entreprise est une tâche complexe. Dans le domaine des entrepôts de données, cette tâche commence par la collecte des spécifications : le modèle conforme aux normes de l'industrie est métamorphosé en un modèle physique. Celui-ci est transformé en spécifications qui sont à leur tour transformées en feuilles de calcul de règles et de mappings. Les feuilles de calcul sont confiées à des équipes externes qui les transforment en code. Le code est renvoyé, puis est exécuté avec les données réelles et ce, en général, pour la première fois. Il arrive souvent que le code ne corresponde pas aux données et que l'équipe doive tout recommencer. Ce processus est ensuite répété de nombreuses fois. La structure adéquate à chaque entrepôt aurait dû être déterminée au préalable pour éviter un processus de réajustement sans fin. Autrement, même avec les meilleurs ingénieurs, les erreurs vont inévitablement être fréquentes et coûteuses.

Pour aggraver le problème, en raison du nombre considérable de flots de données entrant et sortant de l'entrepôt de données, celui-ci est déconstruit en une quantité importante de flux dont s'occupent de nombreux ingénieurs. Pour gérer toute cette main d'œuvre, chaque flux est déconstruit en étapes distinctes qui sont affectées une à une à une personne différente. Il en résulte un grand nombre de transferts de tâches entre les employés et un pourcentage de réutilisation moindre, chaque flux étant traité de façon isolée. Tous ces facteurs multiplient le temps de création d'un entrepôt de données. Ce long processus est inefficace. La construction d'entrepôts de données à l'aide des technologies standard est donc très coûteuse.

L'APPROCHE AB INITIO

Toutefois, il existe une meilleure solution.

Ab Initio aborde ce problème en appliquant la méthode des « principes premiers » et les résultats sont particulièrement satisfaisants. Au lieu d'une durée initiale de 3 à 4 mois, l'implémentation de flux à l'aide de la solution Ab Initio prend 2 à 3 semaines, et parfois quelques jours. Ab Initio appelle cette approche la « création d'un entrepôt orienté métadonnées ».

Un entrepôt orienté métadonnées est constitué d'applications Ab Initio® réutilisables et capables de traiter des données du fichier source au modèle d'entrepôt consolidé. Ce concept sous-entend toute la complexité de traitement des flux habituellement créés manuellement : vérification des fichiers, enrichissement des données, filtrage, validation, nettoyage, gestion des clés, gestion de l'historique, agrégation, mapping, archivage, récupération et chargement des modèles. Toutes ces activités liées aux entrepôts de données ont été extraites vers un niveau auquel le même modèle d'application peut être utilisé pour de nombreux flux simplement en modifiant les métadonnées associées.

De par sa conception, l'entrepôt orienté métadonnées permet à un analyste de spécifier et de tester le traitement d'un flux au début du cycle, généralement sans aucune implication du développement. Cette approche repose sur l'utilisation des métadonnées pour sous-tendre le système. Il s'agit des mêmes métadonnées que l'analyste devrait spécifier dans un document, telles que le modèle de données cible, les formats de fichiers, les clés, les règles de mapping. Au lieu de rédiger un document et de le transmettre à une équipe de développement, l'analyste peut utiliser l'entrepôt orienté métadonnées pour entrer les métadonnées directement, puis exécuter et tester immédiatement l'application obtenue sur des données réelles, lui épargnant ainsi le développement et les itérations de test fastidieux et coûteux. L'économie de temps est considérable et la qualité du système résultant est supérieure car moins d'intermédiaires interviennent dans son développement.

La technologie offerte par Ab Initio a été conçue d'entrée de jeu pour soutenir cette approche. Du point de vue de l'utilisateur, les économies se traduisent tout d'abord par la construction de l'entrepôt orienté métadonnées, puis les bénéfices se prolongent dans le temps. Par exemple, toutes les métadonnées entrées sont stockées dans le référentiel de métadonnées que l'on appelle l'EME® (Enterprise Meta>Environment®) Ab Initio. Ce dernier offre les fonctionnalités de gestion nécessaires, notamment le contrôle de version, le lignage de données, les analyses d'impact, la qualité des donnés et la sécurité d'accès. L'EME offre aux dirigeants d'entreprise une vue intégrée de leurs systèmes totalement inédite. Ils peuvent poser des questions sur le calcul des champs dans les rapports en remontant ainsi jusqu'aux systèmes de production. De même, ils peuvent répondre rapidement aux questions sur la propagation des données dans le système, réponses qui s'avèrent capitales pour les auditeurs et pour la prévision des efforts de maintenance. En outre, ils peuvent mieux maîtriser la qualité de leurs données et l'impact de cette qualité sur les systèmes en aval. La direction peut enfin appréhender les systèmes dans lesquels elle a investi et qui étaient auparavant considérés obscurs.

Ab Initio a aidé un grand nombre de clients à créer leur entrepôt orienté métadonnées. Chaque entrepôt mis au point avec Ab Initio est en mesure de répondre aux besoins particuliers de ces clients, et les résultats sont désormais réutilisables et prévisibles.

English
Langue :
Français
Español
Deutsch
简体中文
日本語