データ屋さん

しがないデータ屋さんがデータ仕事について書き残す

データの中に答えはあるか?

データの中に答えはあるか?

みなさんは、どのようなシーンでデータを見る機会があるでしょうか?

  • どうやったら購入されるか?
  • キャンセルする人は、どんな特徴があるか?
  • 口コミを見たら予約してくれるのか?

サービス内容や商品より多少の差異はあっても、データを分析する場合、実現したい目標(購入、予約、応募)に影響を与える要因を探していると思います。

  • 年代により購入額が異なる
  • 前回予約した人は、1ヶ月以内に予約する可能性が高い

このような分析をして、「こんな施策を打てばいいんだ」という答えを求めていると思います。

私の考えでは、「データに答えはない」と考えてます。

答えがない理由

データから見つけられるものは、傾向であり答えではないと考えてます。

例えば、あなたがAmazonのようなECサイト担当者だとしましょう。売上を増やすために、商品をもっと購入してもらおうと考えます。

その際に、どのようなデータを見るでしょうか?

  • 年代ごとの購入率
  • 時期ごとの購入金額
  • リピート購入者

ごく一部ですが、このような軸で売上データを分析するかもしれません。

さて、これらの軸から何がわかりましたか?

  • 20代女性は、他の年代に比べて購入率が高い
  • 12月はクリスマスシーズンなので、購入単価が高い
  • 一度サイトで購入した人は、徐々に購入単価が上がる

ここから言えることは、「リピーターの20代女性に12月ごろ売れるラインナップを拡充する」でしょうか?

確かに、間違ってはいないと思います。ただ、正解とも言い切れません。

なぜなら、これは傾向であり、その条件に合致するから購入してくれる訳ではありません。

どのように答えを探すか

過去の傾向を見ても、あくまで傾向までしかわかりません。では、どうして要因を探せば良いでしょうか?

私は、ABテストをすることで、やっと答えらしいものに辿り着けると考えてます。

ABテストが何かご存じないかは、Wikipediaなどで一度意味を確かめてみてください。

なぜABテストか?

先ほど、答えらしいものに辿り着くにはABテストとお伝えしました。

なぜABテストかというと「同じ状況で、二つの異なる要素を比較できる」ためです。

同じ商品でも、サイトの構造を

  • A:商品画像をたくさん掲載
  • B:口コミを全面に押し出す

この違いを作り出すことで、カスタマーが何に影響を受けて購入しているか比較可能です。

仮に、Bのパターンを閲覧したカスタマーがAよりも購入しているならば、カスタマーは口コミを重視していると言えるでしょう。

答えに近く、答えではない

先ほどの例で、口コミを閲覧した方が、購入してくれるから、カスタマーは口コミを重視しているとお伝えしました。

では、口コミを中心とした画面作成をすれば間違いないでしょうか?

答えは、Noです。

その理由は、

  1. ABテストは、異なるカスタマーで、同一人物ではないため
  2. 商品画像より口コミが重視されそうだが、他の要素もカスタマーの購買に影響を与える

まず、①について説明していきます。

ABテストは、サイトへ訪問したカスタマーにランダムで各パターンの画面を表示します。ただ、ABどちらのパターンも同一人物は触れません。同じ時期・同じ画面を異なる人たちが見ています。

究極のABテストであれば、あるカスタマーを影分身させて、両方のパターンを見せることで、どちらが影響を与えるか比較します。ただ、そんなことは不可能です。

だからこそ、答えには近いが、必ずしも答えになるとは言い切れません。

②は、商品画像と口コミを比較しました。商品画像と比べるとカスタマーは、口コミを重視していそうですが、他の要因と比べていないため、口コミだけが重要な要素と言い切れません。

口コミ以外にも、価格・配送期間・類似商品の数などが考えられます。

今回は、商品画像と口コミを比較しましたが、他の要素と比較した場合の結果は分かりません。

ABテスト以外、意味はないのか?

これまで、データによる探索は傾向がわかるだけで、結局はABテストが必要と記載してきました。では、ABテスト以外の探索的データ分析は不要でしょうか?

ビジネスの世界では、傾向分析も重要な意味があると考えております。

仮に、ABテストをしたい場合、サイトのデザインや動線、実装など様々な変更が発生します。ABテストするたびに、画面を作り替えていては、いくらリソースがあっても不足します。

そのため、おおよその当たりをつけるために、探索的なデータ分析を必要とします。

ただ、それだけでは十分と言えない場合に、ABテストを実施し、確信を得た状態で、サイトへ反映します。

結局どうすればいいの?

これまでの内容で、「ABテストを実施する必要がある。結局傾向分析も重要」とお伝えしてきました。こう見ると、結局すべてやる必要があり、大変になっただけと思われたでしょう。

ただ、要因に迫るとは、本来そのくらい大変なことだと考えております。

それでもなお、伝えなくてはならいないのは、「データの中に答えを探すのではなく、ヒントを探しに行くこと」です。

様々な会社でデータを分析している人がいて、日々何が要因なのか探して、ずっとデータと睨めっこしています。年代でもない、性別でもないと頭を悩ませていると思います。

データの中に答えを探しに行くと、途端に迷路に入り込み、迷って出れなくなります。そのような迷路から抜け出すためには、答えを探しに行くのではなく、ヒントを探しに行ってください。

仮に、「20代女性が購入率が高い」とデータから示唆が得られたら、「機能よりも商品画像を重視してるかもしれない」とヒントが得られます。

そのヒントをベースにABテストを実施してみることで、ヒントからおおよその答えに辿り着けます。

まとめ

データは、掘れば何かが出てきそうな雰囲気があります。ただ、それは底がない沼でもあり、霧がかかった密林でもあります。

懐中電灯(Tableau)とスコップ(SQL)を持って、意気揚々と宝探しに行っても、お宝を見つけて帰れる可能性は低いでしょう。

だからこそ、探索的データ分析で答えを見つけようとせず、ヒントを見つけて、ABテストをしてしまおうくらいの心意気で取り組んでいただければと思います。