本から学ぶ

統計学が最強の学問である/西内 啓

人は「データ」を見せれると逆らえない傾向があります。

それは「データ」が事実らしいという具体性を持つからです。

その特性を利用し、合法的な詐欺も行われます。

ですから、データの真偽を見通す「統計リテラシー」が必要なのです。

統計学が最強の学問である

統計リテラシーの無い者がカモられる時代

読み書きをする能力のことをリテラシーと呼ぶが、「統計リテラシー」が無ければ確率やデータを知ることも出来ない。

つまり、合法的な詐欺の被害者になっても文句が言えない。

統計学を制する者が世界を制する

統計学は必須スキルであり、最強の武器となる可能性も秘めている。

孫子の時代から、情報の重要性はいくら強調してもしすぎるということはない。

情報を制する者が世界を制する、という言葉を現代において言い換えるならば、統計学を制する者が世界を制するとなる。

統計学は最善最速の正解を出す

統計学が最強のブキになるワケは「どんな分野でも、データを集めて分析することで最速で最善の答えを出すことが出来る」からだ。

「疫学の父」ジョン・スノウの活躍

・コレラで亡くなった人の家を訪れて話を聞き、付近の環境をよく観察する。

・同じような状況下でコレラに罹った人と罹っていない人の違いを比べる。

・仮説が得られたら大規模にデータを集め、コレラの発症・非発症と関連していると考えられる「違い」について、どの程度確からしいか検証する。

→「とりあえず暫く水道会社Aの水を使うのを止める。以上!」

人を集めて話し合っただけでは、強力な解決策というのは出てこないし、むしろ握り潰されることも多い。

代わりに出てくるやり方が、理屈としては一見正しくても、無益もしくは有害であることもしばしばである。

オクト
オクト
コロナ感染はカラオケや飲み屋が多い
カイト
カイト
だから三密回避という対策

全ての学問は統計学の元に

現代医療で最も重要な考え方としてEBM(Evidence-Based Medicine=科学的根拠に基づく医療)というものがある。

この科学的根拠のうち最も重視されるものの一つが妥当な方法によって得られた統計データとその分析結果である。

教育にも活かされるエビデンス

どのような教育がいいかは、本人の特性や能力、環境など様々な要因によって左右されるし、医療と同様に不確実性の大きい分野でもある。

例えば、

教師に生徒の成績に基づき競争をさせて、ボーナスの査定にも反映させればいい

子供は小学校入学前から英才教育を施すことで天才に育つはずだ

数学教育にもっとコンピュータを取り入れて効率化を図るべきだ

など、様々なアイディアが提唱されるが結局のところデータと統計学の力を借りなければ誰にも分からない。

経済学でも長年、幾つかの仮定を元に理論先行で数理モデルが考案されていたが、過去何百年にも亘る各国の経済に関するデータが電子的に収集・整理されるようになると「経済成長が起こるかどうかはどう説明されるのか」といった問いに対する回答が、統計学的な解析を通じて明らかになってきた。

経済成長において重要なのは技術の進歩であり、それに寄与する教育レベルや技術開発を行った場合の利益が適切に配分されるかという社会の制度(例えば特許制度)であり、逆に「天然資源の有無」などが関連しているとは言えない、といったことが明らかにされてきた。

これもデータの整備と統計学的な解析によって可能になったことである。

全ての学問に関わる学者は統計学を使わざるを得ない時代が既に訪れているし、統計リテラシーさえあれば、自分の経験と勘以上の何かを自分の人生に活かすことが簡単になる。

統計リテラシーは、世界トップレベルの学者が長年の研究の結果明らかにした真実に直接アクセスすることを可能にする。

この力があるかどうかで人生が大きく変わることは間違いない。

ナイチンゲール的統計の限界

データをビジネスに使うための「三つの問い」

  • 何かの要因が変化すれば利益は向上するのか?
  • そうした変化を起こすような行動は実際に可能なのか?
  • 変化を起こす行動が可能だとして、そのコストは利益を上回るのか?

この三つの問いに答えられて初めて「行動を起こすことで利益を向上させる」という見通しが立つのであり、そうでなければ統計解析に従って新たなアクションを取ろうとする意味は無い。

ナイチンゲールがあげた最も大きな業績の一つは、戦闘で負った傷自体でなくなる兵士よりも、負傷後に何らかの菌に感染したせいで死亡する兵士の方が圧倒的に多いことを明らかにしたことであり「清潔な病院を戦場に整備しろ」と声を上げた。

だが統計学は、ナイチンゲールの時代から100年ほどで急激に進化した。

ナイチンゲールの集計グラフは、死亡原因の大きさ自体は明らかに出来たかもしれないが、本当に清潔な病院を整備すれば戦死者を減らせるのか、そして整備にどれだけのコストをかければどれだけの命が救われるのか、といった点については何も答えていない。

それには20世紀に発達した現代的な統計学の手法を使わなければならない。

世間にあふれる因果関係を考えない統計解析

「十分なデータ」を元に「適切な比較」を行う、という統計的因果推論の基礎さえ身に付ければ、経験や勘を超えてビジネスを飛躍させる裏技はもっと簡単に見つかるはずなのだ。

「60億円儲かる裏技」のレポート

世の中には、なぜかよく分からないが自社の商品を買ってくれる人とそうでない人がいる。

この「なぜかよくわからないが」という違いが明らかになれば、その差を巧くコントロールすることで買ってくれる人を増やすことも出来るはずだ。

これまで思いもしなかった「その差を巧くコントロールする方法」のことを本書では「裏技」と表現する。

例えば、特定の広告を目にしたかどうか、というだけの差で自社商品の購買率が何十%も違うというのであれば、その広告をより大々的に投下することで大きな売り上げの増加が見込まれるかもしれない。

友人に紹介された経験があるかどうか、という差が大きな影響を与えるのであれば、既存顧客に対して友だち紹介キャンペーンを展開してみればいい。

こうしたことは、ビジネスに関わっているほとんどの人が日常的に考えている。

ただし多くの場合、その着目すべき「差異」はデータや統計解析ではなく「経験と勘」といったものに基づいている。

「あるある」は当てにならない

だが、経験はしばしば間違う。

例えば次のような「マーフィの法則」を聞いて、多くの人は「あるある」と思うかもしれない。

・俄か雨が降っている時に外出先で傘を買うと大抵直後に晴れる

・トーストを落とすと、いつもバターを塗った側が地面につく

・たまたま遅刻しそうな時に限って、いつも電車が遅れる

だが、実はこうした「あるある」の多くが「記憶の偏り」によって左右されているものだということは、心理学者あるいは認知科学者たちによって既に実証されている。

DMの送り方を変えるだけで売上が60億円アップする

「DMを送られることで売り上げが伸びる顧客と伸びない顧客の違い」

「顧客の売り上げを伸ばすDMと伸ばさないDMの違い」

実際のデータを使い、網羅的な比較を行うことで「何となく分かっていたこと」は具体的な利益に繋がる数字とともに裏付けられ「今一番何をすべきだろうか」という戦略が明らかになるのである。

ビジネスにおいて解析すべき指標は、直接的な利益か、あるいはそこに至る因果関係の道筋が明らかな何か、ということになる。

「ミシンを二台買ったら一割引き」で売上は上がるのか?

このキャンペーンを目にした顧客たちは二台のミシンを欲しがっていたわけではなかった。

だが、欲しいミシンが一割引きになるならと、隣人や友人を誘って共同購入を呼びかけた。

会社は思いもよらず、優秀な営業マンを雇い入れることが出来たのだ。

統計学的な裏付けもないのに、それが絶対正しいと決めつけることと同じくらい、統計学的な裏付けもないのにそれが絶対誤りだと決めつけることも愚かである。

「演繹」の計量経済学と「帰納」の統計学

統計学と計量経済学の「本質的」な違い

実は経済学と統計学という学問は、一見同じように「社会に存在している数字を分析する学問」だが、ある意味真逆の哲学を持っている。

計量経済学は、経済学の中ではかなり統計学寄りの考え方に基づく領域だが、それでもこのような考え方の溝が埋まり切るわけではない。

両者が持つ真逆の哲学とは、「帰納」と「演繹」のどちらを中心に組み立てられた学問であるかというものだ。

一般に、科学的推論の形式には大きく分けて帰納と演繹がある。

大まかに言えば、帰納とは個別の事例を集めて一般的な法則を導こうというやり方、演繹とはある事実や仮定に基づいて、論理的推論により結論を導こうという方法である。

フィッシャーの弟子であるC・R・ラオは「統計学の発展によって帰納的推論における不確かさが数量化され、帰納的推論がより正確になり、我々の思考に大きな躍進がもたらされた」と述べている。

データとはすなわち個別の事例を分かりやすくまとめ上げたものであり、統計学の目的は帰納的推論である。

この場合、推定された回帰モデルなどが「事例を集めて導かれた一般的な法則」に該当するだろう。

一方、演繹の代表格としてニュートンの力学が挙げられる。彼は力に関するたった三つの法則を仮定することで、野球の球から太陽系の惑星に至るまで、世界にあるほとんどのものの挙動を上手く説明することに成功した。

  • 全ての物体は外部から力を加えられない限り速度は変わらない。慣性の法則
  • 物体が力を受けると、その力の働く方向に加速度が生じる。加速度は力の大きさに比例し、質量に反比例する。ニュートンの運動方程式
  • 力は相互作用によって生じるものであり、一方が受ける力と他方が受ける力は向きが反対で大きさが等しい。作用反作用の法則

ニュートンが提示した運動の法則は「それほど異論は出ないだろう」という前提だ。

しかしながら、このシンプルな仮定によって得られる数式を使って演繹を広げると、我々が目にする殆どの物の動きは説明できる。

また、理論が組み立てられたことで観察や実験に基づく理論の実証、すなわち帰納的な推論を行うべき方向性の目途も立つのだ。

ニュートンのシンプルな仮定から世界の全てを説明する理論体系を組み上げるという美しい方法は、物理学だけでなくその後の全ての分野の学者たちに影響を与えた。

例えば、共産主義の理論的背景を生み出したカール・マルクスは、「人間社会にも自然と同様客観的な法則が存在しており、人類の歴史は生産力の発展だけで説明できる」という唯物史観を提唱した。

よりよいモデルを求める計量経済学者

物理学以外でニュートン的な研究方法に成功した数少ない学問が経済学である。

経済学者はニュートンが「全ての物体は外部から力を加えられない限り速度は変わらない」と仮定したのと同様に「あらゆる経済活動は物々交換に過ぎない」とか「消費者は期待される効用(満足感)を最大化する行動を選ぶ」といった仮定から、価格や支出、貯蓄といったものの関係性を記述した連立方程式による演繹を繰り返すことで、個人や社会の均衡状態を説明しようとする。

そのためなのか、計量経済学者はしばしば回帰分析の結果を応用して推論を行う。

統計学はそれ自体最強の学問だが、その最強さを更に盤石なものにするためには、ありとあらゆる統計学の考え方に対してオールラウンダーになることが求められる。

巨人の肩に立つ方法

近代物理学を生み出したアイザック・ニュートンは「私が遠くを見ることが出来ているのだとすれば、それは巨人の肩に立っていたからです」という言葉を残している。

巨人とは「先人たちの知恵」という意味だ。先人たちの知恵を学び、その上に立脚すれば遥かに先を見通せる。

統計リテラシーはこうした知恵を迅速かつ正確に活用できるように、ひいてはあなたを巨人の肩に導いてくれるはずだ。

どうすれば最善を尽くすことができるか?

そのヒントは、米国の10万人の命キャンペーンに存在しているかもしれない。

2004-06年にかけて入院死亡率を5%、年間死亡者を12万人も減らした。

行ったことはシンプルで「心停止/呼吸停止のリスクのある患者に緊急対応チームの派遣」「急性心筋梗塞に対するエビデンスに基づいた治療の徹底」「投薬内容の確認の徹底」「手洗いの徹底による院内感染の防止」といった目標を徹底しただけだ。

その背後には「To Err is Human」という米国医学研究所が出版した報告書がある。毎年約10万人が医療ミスで亡くなっている、という衝撃的な推計が公表されており、「だったら、分かり切ったミスを無くせばいい」と立ち上がったのだ。

統計学によって得られる最善の道を使えば、お金を儲けることも、自分の知性を磨くことも、健康になることも随分と楽になる。だが、それはあくまで副産物である。

統計リテラシーによる最も大きな価値は、自分の人生を最善にコントロールできるという幸福や実感なのだ。

COMMENT

メールアドレスが公開されることはありません。