2013年4月14日

だから、統計学の考え方は大切

散歩の帰途、立ち寄った本屋の店頭に平積みされていた『統計学が最強の学問である』を一冊手に帰ってきた。書き手は西内啓という人なのだが、帰宅してから著者名を竹内啓だと見誤っていたことに気付いた。統計という表題の用語で、勝手にあの著名な数理統計学者の竹内先生と思い込んでしまったのである。竹内先生、ずいぶん思い切ったタイトルの本を出したなあ、などと思っていたわけで・・・。

そういえば、北杜夫さんが若い頃に東北の駅前でギクリとしたことがあったと何かに書いていた。その時、目に飛び込んできたのはトマトソースの看板の文字。どうして自分がギクリとしたのか分からなかった。後で考えてみると、当時彼はトーマス・マンに心酔していたせいで、トマトソースをトーマス・マンと頭の中で読み替えていたのだ。アナグラムというやつだ。僕は竹内啓に心酔しているわけでも何でもないのだけど、勝手に脳が読み替えていたようである。

この本は、統計学の役割を一般読者に概観させるような内容になっている。著者が書いているように「現代統計学の基本の考え方は今世紀の前半には確立していたし、主要な統計解析手法は1960年代頃にはほぼ出揃っていた」。近年変わって来たのは、何といってもITベースを利用した統計学の活用である。それとビッグデータと呼ばれるもの。

IBMやNTTデータなど多くの企業がビッグデータの活用を呼びかけ始めている。あなたの企業に埋もれているデータの山から宝を一緒に探しましょうよ、と。しばらくはビッグデータがビジネスの世界で流行りの言葉になるのだろう。「クラウド」の次は「ビッグデータ」か。

西内は、その狂騒ぶりに注意を促す。SI業者やコンサル会社に多額の金を払う前に、正しいサンプリングと適切な検定作業を行った方がいいと説く。同感である。

以前、データマイニングがまるで魔法の杖のように語られていた時期があった。しかし、それが実際のビジネスを展開するうえでどれだけ思いがけない発見を生み出したかを僕たちはしっかり考えた方が良さそうだ。僕自身、その当時、ある大手通販会社が保有する膨大な販売データを仲間と一緒に解析したことがあった。主にオフィス用品を取り扱う会社だったのだけど、バスケット分析の結果見えたのはコーヒーとコーヒーカップホルダーや、フロッピーディスクとラベルシールなど、いかにもといった取り合わせで脱力したのを覚えている。

溜め込まれた膨大な自社内(あるいはクラウド)データを先進的と思える分析ツールで解析すれば、快刀乱麻を断つごとく消費者心理の奥底までも知ることができると経営者は期待してしまうのだろう。何か次の一手が欲しいのは分かる。しかし、その前にしっかり統計学の基本くらいは知らなくては。

それと、個々の消費者が<いま>何を考えているのかを知ることにも増して、自分たちが製品やサービスで顧客の気持ちを<これから>どう変え、動かしていくかを考えることを忘れてはいけない。