データ解析は、先入観や思い込みを正すのに有効な手段
自分も尊敬する棋士、羽生善治九段の著書に『直感力』という書籍があります。羽生さんが長年に渡り、将棋というものに接し、磨き抜かれた「直感」というものを、羽生さん自らの観点で分析、また体感したものを本にしたものになります。
その書籍には、若い時には経験値は低いものの、圧倒的な思考の処理速度であらゆる指し手を考え、最善手を選んでいたと書かれています。
ただ、この思考の処理速度は年齢とともに低下していくようで、その代わりに「直感力」というものが研ぎ澄まされていくとも書かれていました。
この「直感力」とは、数多くの長考が蓄積され、脳内で数多くの多変量解析が行われ、残ったものが蓄積されたものだと思います。
面白いのは、若い時の直感力で出た最善手は、その後考え直すと間違いだったということが何度かあったようですが、年齢を重ねていくとこの間違いが少なくなり、直感力の精度がかなり高くなるとのことでした。
最近、AIやビックデータという言葉を耳にし、人工知能やデータがすべて未来を決めていくかのような錯覚になりますが、AIや自然言語処理のようなものは、数多くの学習や情報を人間が与えることで賢くなっていくようになっています。また、ビッグデータもかなりのデータ量を分析することで精度の高い結果が得ることができます。
とはいえ、闇雲に分析しても効率が悪いので、データサイエンスティストと呼ばれるデータの分析や解析を専門にしている人たちは、ある程度の勘所を頼りに分析を行います。すなわち、「おそらく結果はこうなるだろう」ということを予想しています。
業界的には、優秀なデータサイエンスティストは、この勘所が優れていて、どのようなデータとどのような分析をすれば、どのような結果がでるということを何となく想定して分析を行っています。
DVDやBD(ブルーレイディスク)を販売する際に、最初の初期ロットがどれくらいになるかということを、予測する分析を配給会社はよくしています。そこで、データは、映画での観客動員数がベースになります。(そもそも、この考え方自体が私たち人間が作った定義になるので、人間の主観が入っていますが)
しかし、映画のタイトルや内容がわかれば、それだけで人間は、「この映画はヒットする」と想像できるでしょう。ただ、たまにこの想像が外れることもあると思います。
データ解析には、人間が予想して、こうなるだろうと思って解析しているのに、そうなること、全くそうならないことがあり、時には分析途中で発見できる結果もあります。
大多数は、人間がそうだと思うものは大体がその通りの結果になります。これは揺るぎありませんが、人間の先入観や思い込みという大きな間違いを生み出す場合もあります。勘違いという表現もしますが、先入観や思い込みを正すのにデータ解析は有効な手段でしょう。
我々が普段扱っている、お客様の解約に関するデータでも、思ったとおりの結果がでることもあれば、そうでないこともありますし、時には意外な結果がでることもあります。
「話は短く、会話の速度は合わせる」データの説得力
例えば、チャットボットで解約抑止をしようとした時、どの程度の会話数が一番効果的か?と言われると、正直人間には、検討がつきません。結論からいうと10会話がひとつの山になり、その後20会話あたりがピークになります。
ただ、会話は長くなると防止率は著しく落ちていきます。話が長い人は嫌われると言われますが、チャットボットでもあながち同じような結果となっています(図表1)。
また、データから気付かされたという事案でいうと、実はコールセンターのオペレーターとお客様の話す速度が近いと、コンバージョンや解約抑止の効果が上がるという結果が出ました。
図表2からも分かるように、ある程度の会話速度を超えると、お客様の会話速度と同調することが心地のよい会話として効果があるということが分かりました。
確かに言われてみればその通りのことなのですが、このように解析結果としてでてくると説得力があります。おそらく、信頼関係の構築や恋愛に関する会話でも、この部分に気をつけると、よい結果がでるのではないでしょうか。
人間の価値観を覆しうる「データ」の正しい利用を
一方で、想定と違う結果になった事例もあります。解約の際に再入会の可能性を退会者にヒアリングしており、その割合は、再入会希望者と非希望者の割合は1:3から1:8くらいになります。(数値はサービス提供社やサービス、商品内容によって異なってきます)
ここで再入会希望と、非希望者のその後をトラッキングしました。大方の予想では、それなりに濃淡のある再入会率がでると思っていたのですが、再入会希望者の再入会率は15%、非希望者の再入会率は10%と言う結果になりました。
私としては、5%の差しかなく、落胆した結果となりました。(現在、期間や条件を変えて検証を続けています)
解約するときの感情は、時間の経過とともに和らぐということをデータは示しているという仮説の元、現在は企業とこのデータを共有して、新しい取り組みを始めているところです。
キーワードとの因果関係の分析でも、美容化粧品であれば「アンチエイジング」や「美白」、「しっとり」などの言葉と購入が相関関係にあるようにも思えるが、実際のデータからは、「アンチエイジング」でいうと、「おばあちゃん」「若い」「白髪」などのワードとともに使うことによってより、高い効果がでることがデータを分析した結果明らかになっています。
実はポジティブワードといわれるものでも、その単語をどんな言葉とかけ合わせるかで、その効果が大きく違うことも分かっています。
今後AIやビックデータの分析により、想像も付かない事実や相関関係がいろいろとでてくることでしょう。時には、その結果は今までの既成概念を変えることになるでしょうし、価値観を逆さまにすることもあるかもしれません。
ただ、どの分析も人間が目的を持って分析しているものです。その結果をどのように共有するか、利用するかは人間にあるということです。
自分に都合のいいデータや要素だけで解析、分析してしまうことを確証バイアスと呼び、結果を操作することも可能です。国や企業の都合のいい分析結果だけで世の中が証明されていっては幸せな未来はないのかもしれません。
佐野 敏哉
株式会社Smash