2014年5月31日

ビッグデータとは何か

今朝の「ビジネスの森」は、統計学者の西内啓さんにゲストに来ていただき、主にビッグデータについて話を聞いた。彼は『統計学が最強の学問である』の著者である。
http://tatsukimura.blogspot.jp/2013/04/blog-post_14.html


言葉だけが先走りしているように思われてならないビッグデータ。企業の人と話していると、顧客データベースや販売履歴があれば、ビッグデータの分析で何か将来のヒントが自然と解き明かされると勘違いの向きが多い。

たいした仮説も持たず、ただデータを高い金を払って分析させても実際にビジネスの役に立つ結果が得られるわけではない。大量のデータがあるだけで将来の指針が得られるのであれば、めでたいことに経営者は組織に不要になる。

ションベルガー&キクエは『ビッグデータの正体』のなかで、著者たちはビッグデータとは何ぞやという問いに、"from some to all" すなわち、「部分計測から全体計測へ」と言い表している。

この変化が何を意味するのかというと、それは因果関係の追求から相関関係の追求への変化であるといえる。それは、なぜそうなのかという理由が分からないまま、実際はこうだからという現象にだけ着目する方向に進むことを示している。

確かに、蓄積された膨大なデータによって、「オレンジジュースとアスピリンの組み合わせがガンを治す(ガンが治った患者の多くはオレンジジュースとアスピリンを摂取していた)」ことが確実にいえるのであれば、それはなぜかというと問いはまずは置いておいても、その事実の方が重要になる。

これを敷衍していうならば、そこでは「答えさえ分かれば、理由は不要」ということだ。アマゾンが利用者に対して行っているレコメンデーションではその理由などは誰からも問われないからよいだろうが、保険会社がこれまでの診療記録をもとに今後の保険料の算定を行ったりする場合には、納得のいく説明ができないことになる。

いずれにせよ、ビッグデータは打出の小槌などではない。企業であれば、明確なビジネス上の目的を持って分析に望まなければ、労多くして得るものは少ないままに失望の海に沈む。