Oswald Regular
OpenSans Regular
データ品質
データ品質にまつわる問題

データ品質にまつわる問題は、あらゆる組織にとって重要な課題です。一部の組織ではこの課題に取り組んでいますが、ほとんどの組織では行われていません。これは、データ品質の定義、評価、監視、および改善が非常に困難だからです。しかし、不正確な情報は誤った業務判断をもたらし、最終的には収益に影響するので、データ品質は重要です。

データ品質への取り組みには企業規模のアプローチが必要です。多くの場合、企業のデータとそのシステムは分散しています。さまざまな形式のデータが存在し、膨大な数のレコードやトランザクションを毎日処理するシステムもあります。バッチ処理やリアルタイム処理を実行するシステムもあります。それらのシステムはAb Initio®で構築されているかもしれませんし、レガシーシステムかもしれません。このような多種多様な状況でデータ品質に対処するには汎用的なアプローチが必要です。

この課題に対するAb Initioのアプローチは広範囲に及びます。データ品質問題の隅々までサポートするために、このアプローチは高機能かつカスタマイズ可能な設計パターンに基づいています。それらの設計パターンは以下のとおりです。

  • 問題の検出と修正 - データ品質問題の検出処理と修正処理は、エンタープライズアプリケーション全体にまたがる処理パイプラインに統合されます。これはCo>Operating Systemを使用すれば容易に実現できます。実質的にどんなプラットフォームにも配備でき、どのようなデータ量やトランザクションレートにも拡張可能で、どのような種類のデータも処理可能です。標準検証ルールのライブラリを備え、複雑なデータ検証およびクレンジングルールをグラフィカルに表現できます。Business Rules Environment(BRE®)を使用すると、ビジネスアナリストはスプレッドシートに似た環境でルールの設定およびテストを実行できます。これらのロジックはすべて、Ab Initioで構築されているかどうかにかかわらず、既存のシステムに直接統合できます。
  • 問題の報告 - データ品質に関する問題の報告は、Ab InitioのEnterprise Meta>Environment®(EME®) によって処理されます。EMEは、データのプロファイル結果およびデータの検証結果から統計を収集し、データ品質の指標を計算します。そして、データレベルの統計と指標をさまざまなデータ品質ダッシュボードと組み合わせることで、データ品質レポートのための客観的な情報を提供します。システム系譜図には、データ品質問題の原因をグラフィカルに認識できるデータ品質指標が示されます。
  • 品質監視 - データ品質の監視はData Profilerが行います。データの値、分布、相互関連性を含むデータセットの中身に関する問題を明らかにします。運用の際にData Profilerを使用すると、データ分布のわずかな変化も検出して調査できます。

これらの設計パターンは、高機能かつ再利用可能な一連の構成ブロックに基づいています。これらの構成ブロックはカスタマイズして、運用環境のあらゆる側面に統合できます。これらの構成ブロックはすべてCo>Operating Systemで実行されるため、エンタープライズシステム全体に配備できます。

Ab Initioテクノロジは個別のデータ品質の問題についての情報収集、整形、格納、原因分析をサポートし、さらにシステム上のデータ品質のシステム的な問題と、まれに発生する独自の問題の両方に対するソリューションの設計パターンを提供します。

Ab Initioのデータ品質に対するアプローチの詳細は、こちらを参照してください。

English
Français
Español
Deutsch
简体中文
言語:
日本語