ライズのデータマイニング
データマイニングの第一人者である栗林卓也氏が考える未来
データマイニングとは
将来性を見込まれ、各社しのぎを削って開発を進めているものと言えばAI技術ですが、株式会社ライズにおける機械学習機能の開発レベルは目に見張るものがあります。代表栗林卓也氏は、AI技術とデータマイニングには深い関係性があり、それぞれの特性をもって初めて互いの機能の最大化を図れると考え、同時にデータマイニングの技術向上にも努めています。
データマイニングの概念
データマイニングは、機械学習、統計学、データベースシステムの交差点にある方法を含む大規模データからパターンを抽出し発見する技術や手法のことです。この技術は、大量のデータからパターンや知識を抽出することが目的であり、データそのものの抽出(マイニング)をすることではありません。 また「データマイニング」という言葉はバズワードでもあり、大規模データや情報処理(収集、抽出、ウェアハウス、分析、統計)のあらゆる形態や、人工知能やビジネスインテリジェンスを含むコンピュータ意思決定支援システムの応用によく適用されます。一説によると、もともと「実践的な機械学習」という名称であり、データマイニングという用語はマーケティングのために付け加えられたに過ぎないという見解もあります。多くの場合、大規模なデータ解析や分析、実際の手法を指す場合は、人工知能や機械学習(AI)が適切と考えられています。
データマイニングが抽出するもの
データマイニングは、大量のデータを半自動または自動で解析し、
- データレコードのグループ(クラスター分析)
- 異常なレコード(異常検出)
- 依存関係(関連ルールマイニング、逐次パターンマイニング)
など、これまで知られていなかったパターンを抽出する作業です。
これには通常、空間インデックスなどのデータベース技術が使われます。これらのパターンは、入力データの一種の要約とみなすことができ、さらなる分析や、機械学習や予測分析に使用することができます。
データマイニングのステップでは、データ中の複数のグループを特定し、これを用いて、意思決定支援システムでより明確な予測結果を得ることが可能です。
データ分析とデータマイニング
データ分析とデータマイニングの2つには以下の違いが見られます。
データ分析
データ量に関係なくモデルや仮説をデータセットで検証することを指し、主にマーケティングキャンペーンの効果を分析することに使用されます。
データマイニング
機械学習や統計モデルを用いて、大量のデータの中から潜在的パターンを発見することに使用されます。
代表栗林卓也氏が語るように、データマイニングとAIはこのように非常に曖昧な定義や線引きとなっており、とても深いつながりを持つことが伺えます。どちらの技術にも精通していることで、高精度な分析が可能となります。株式会社ライズはこういった最先端の技術を駆使し、顧客の持つ問題点を表面化し、改善に導きだす名企業です。