向いている人とは
データマイニングとは大量の事実情報から役立つ情報を検出し、マーケティングなどに役立てる手法である。ここでは簡単にしか説明しないため、より詳しく知りたい人はデータマイニングについて書かれたサイトを読むなど、自分で調べてほしい。
データマイニングに似ているためよく比較される手法に統計解析がある。こちらは比較的少ないデータ量を基に仮説検証している。データマイニングも仮説検証するが、ビッグデータから情報を拾う面と、目的変数がない中で意味のある法則やパターンなどを発見するという面が違うだろう。
現在よく使われているビッグデータは行動履歴データで、顧客が過去に閲覧したり購入したりした履歴を集計して活用する。それから現段階では活用は不十分だが、今後はコミュニケーションデータも用いられていくことが増えるかもしれない。これは顧客のブログや企業に対する質問、クレームなどを集計する方法だ。
データマイニングの方法は視覚化、操作、モデル化の3段階に分けられる。
視覚化とはデータをグラフなどにまとめることで、数値だけよりもパターンや相関関係が明らかになり分析しやすくなる。操作とはデータ加工のことで、ソートや集計処理などを行う。そしてモデル化とはデータ間を紐付けすることだ。コンピューターが弾き出した測定結果を仮説とし、そこから分析するモデル化の仕事は人間にしかできない。
まずはコンピューターによって混沌としたデータを選別したものを基に、想像力を持ってデータを結びつける。時には突飛な仮説がマーケティングの成功を収めることもあるだろう。このモデル化の作業は難しく大変だが、一番面白いところとされている。コツコツと分析することにやりがいを感じられる人に向いている仕事だ。