データ マイニングとデータ ウェアハウジングはどちらも、情報 (またはデータ) を実用的な知識に変えるために使用されるビジネス インテリジェンス ツールです。 2 つのツールの重要な違いは、この目標を達成するためにそれぞれが使用する方法とプロセスです。
データマイニングは統計分析のプロセスです。アナリストは技術ツールを使用して、テラバイト規模のデータをクエリおよび並べ替えてパターンを探します。通常、アナリストは、製品 X を購入する顧客は通常 6 か月以内に製品 Y を購入するなどの仮説を立てます。この理論を証明または反証するために関連データに対してクエリを実行することは、データ マイニングです。企業はこの情報を使用して、顧客とサプライヤーの行動をどのように理解しているかに基づいて、より適切なビジネス上の意思決定を行います。
データ ウェアハウジングとは、レポート作成と分析を改善するためにデータを保存する方法を設計するプロセスを指します。データ ウェアハウスの専門家は、さまざまなデータ ストアが概念的にも物理的にも相互に接続され、関連していると考えています。ビジネスのデータは通常、多数のデータベースに保存されます。ただし、最も広範囲のデータを分析できるようにするには、これらの各データベースを何らかの方法で接続する必要があります。これは、データベース内のデータを他の関連データに関連付ける方法が必要であり、物理データベース自体が接続されているため、レポート目的でデータをまとめて参照できることを意味します。
したがって、データ マイニングとデータ ウェアハウジングの関係の核心は、データが適切にウェアハウス化されていれば、マイニングが容易になるということです。データ マイニング クエリが、異なる物理ネットワーク上にある複数のデータベースにまたがるテラバイト規模のデータを実行する必要がある場合、それは効率的なクエリではなく、結果を取得するまでに長い時間がかかります。ただし、データ ウェアハウスの専門家が、異なるデータベース内の関連データを密接に接続するデータ ストレージ システムを設計した場合、データ マイナーは、より有意義で効率的なクエリを実行してビジネスを改善できるようになります。