目的が先か、データが先か

データアナリティクスグループの梅田です。



先日、弊社ユーザ会の集大成イベントである「第33回Beaconユーザシンポジウム」が開催されました。
いくつかの研究テーマについて、1年間研究を進めてきたグループがそれぞれ成果発表を実施。会の最後で、優秀な研究を表彰するというものです。
私も、今年度は「企業内データの活用」研究グループを1年間担当させていただきましたが、審査員特別賞を受賞、という結果となりました。
研究グループの方の努力が実り、本当に良かったと思います。


今回の記事では、担当グループの成果発表で、質疑応答の時間にいただいた質問を取り上げてみます。



成果発表では、データ分析を料理の工程になぞらえて考えると、データ分析の工程も理解しやすい、という考え方をベースとして、実際に分析を行った結果などを発表しました。
これは例えば、カレーを作ろうとするときに、必要な材料(ニンジン・じゃがいも・タマネギなど)を買ってから調理を始めることと、データ分析で得たい結果があって、その結果が得られそうなデータを集めてから分析を始める、という部分は似ており、他にも料理と分析には共通点がある。という考え方です。


この発表に対して、以下の質問をいただきました。

  • 日常生活では、冷蔵庫に眠っている食材など、ありものの食材を使って調理し、一品作ることがある。
    今回の研究では、ありもののデータ(改めて収集しなくてもすぐに使えるデータ)を使って分析することは、考えなかったか。
    発表の中で、新しくアンケートを実施して収集したデータを分析していたが、似たようなアンケートは過去にも実施していると思う。

指摘の通り、似たようなアンケートが過去にも実施されており、その結果を差し障りのない範囲で入手することも可能でした。しかし実際にデータを入手してみると、

  • 自分達が掘り下げたい内容が主題ではなく副題になっているアンケートであった。副題部分だけで分析しようとすると、副題に直結する項目が少なく、分析しづらかった。
  • 複数年分のデータを比較して分析できることを期待していたが、年をまたいで分析することを想定していないアンケートであった。年ごとに、設問は似ているが、回答選択肢が微妙に異なり、単純な比較ができない内容だった。

という問題点がありました。
質問者の方に対しては、グループリーダから、このような経緯により、新たにアンケートを実施しデータ収集した旨を返答しました。


しかし、改めて考えてみると、これは自分達がやったことに対する質問の回答にはなっていますが、汎用的な回答にはなっていません。
企業のデータを分析して活用しようとするとき、すぐに入手できるデータで分析を始める、分析で得たい結果=分析目的を決めてデータを集めるところから始める、どちらから始めるのが良いのでしょうか。



すぐに入手できるデータで分析を始める場合、

  • すぐに分析を始められることがメリットとなります。
  • 反面、限られた材料から分析を始めるため、材料を追加しないと作れないものが出てきそうです。
    例えば、野菜がたくさんあっても、スパイスもカレー粉も無い状態でカレーを作ることはできません。
  • どういうものを作ろうか全く決めずに分析を始めることもできなくはないですが、闇鍋を作るようなもので、何ができるかわからず、美味しい結果が得られるかどうかもわかりません。

最初に目的を決めてから動く場合、

  • 狙った結果が得られやすいことがメリットとなります。
  • ただし、目的や、その目的に直結するデータは何なのか、を最初に具体化するところでは、苦労しそうです。

これらのことから、美味しい結果を得たいのであれば、最初に多少苦労するとしても、できるだけ目的を決めてから動くのが良いでしょう。
手法の習得を目指して試しに分析してみる場合など、分析結果を重視しないのであれば、身の回りにあるデータから始める形でも良いと思います。



では、どうやって目的を具体化すればよいのか?
それは前回の記事の結論がヒントになりそうです。
分析結果をどんな行動に結び付けたいのか、言い換えると、どういう行動をサポートする結果を得たいのか?
それを改めて整理することで、見えてくると思います。