一人ひとりが役割を発見し、
持って生まれた能力に気づいて、楽しく働き、楽しく生きよう

2023.03.21 書棚

統計学が最強の学問である

SHARE

統計学が最強の学問である 西内啓著 2013年1月24日発行

データベースソフトのアクセス開発に携わるようになって、この本に出会いました。現場の方が日々の出来事を入力していると一週間とか、一ヶ月とか、一年とかの単位で、いろいろな表にすることができます。数字には、行動結果が現れます。理念や芯棒など、あり方を持っている人や組織なら、きっと表(現状の数字)から、こうしたいなぁとか、ここはちょっと気になるなぁとか、変えたいことに目がいきます。データベースって、気づきを促してくれるためにあるんだなぁと思うようになりました。著者の西内啓さんは「望ましさ(望ましい数字)」という表現を使って、わたしたちの好奇心を引き出して統計学の魅力を伝えてくれています。分析方法など難しいことはわかりませんが、できごとや、結果、数字には必ず意味があり、その意味を探るのに、ある期間のデータを注意深く見ることがとても重要なことだと思います。私たちはあり方に沿う解釈力を持って観測することができれば、そこから気づきが生まれ、改善への取組み(PDCAなど)がはじまるような気がします。

現代科学を研究されている人たちは、私たち一人ひとりの意識や心の状態が、現実世界にその状態の「再現写真」を映し出しているのではないかと伝えてくれています。その「再現写真」をほんとうの自分(ゼロポイントフィールド、サムシンググレート、真我、根源エネルギーなどさまざまな表現があります)が観測し、感動したり、これは看過できないぞ!などの感情が湧いてきて、憤する心が現れ、衝動的に動き出し、取り組むことで、自らの能力を開花させ、成長、進化し続けることを教えてくれています。感情豊かにデータベースの数字を見て、憤する心(感動&看過できないなどの衝動)をかき立てることが、ほんとうの自分を形づくるのに役立つんだなぁと勝手な解釈をしています。

追記
古代ギリシャの数学者であり哲学者であったピタゴラスは、「万物は数なり」という考えのもと、単純な整数や図形を自然の構成要素としたことで、抽象的で非現実的な世界観にとらわれてしまったらしい。数学によって宇宙像を描写するのではなく、限定してしまったが、その理論は進展を見なかった。
数学が自然を記述する言葉であることは論を俟たない(議論する意味がない、当たり前のことを証明することのないこと)。~中略~ 科学は、すべての数を<宇宙の構成要素ではなく、描写する道具として>受け入れることではじめて成り立つのである。
引用:P.55シンクロニシティ~科学と非科学との間に~ポールハルパーン著2023年1月29日発行

▶数値は、現実世界の「再現写真」のなかの一つ、描写(あるがままの姿をうかび上がらせるように、えがき出すこと)する道具と理解して、データを読み取りたいですね。

引用&備忘メモ

●データをビジネスに使うための「3つの問い」

①何かの要因が変化すれば利益は向上するのか?
②そうした変化を起こすような行動は実際に可能なのか?
③変化を起こす行動が可能だとしてコストは利益を上回るのか?

P.59引用

●ビジネスでの合意

ビジネスにおいて解析すべき指標は、直接的利益か、あるいはそこに至る因果関係に道筋が明らかな何か、ということになる。もちろんこうした因果関係について統計学的な実証ができていればいう事はないが、ビジネスにおいては関係者間で「これは明らかに利益に繫がる指標だろう」という合意がとれていれば、そこも売上などと同様に比較するに値するものだと言えよう。

P.89引用

●科学とは

科学とは白衣を着て怪しげな機械や薬品をいじくることではなく、正しいことを最大限謙虚に、そして大胆に掘り下げようとする姿勢であると私は思っている。
P.117引用

●ランダム

社内とありとあらゆる「正解のない意思決定」について、正解がないのであればとりあえずランダムに決めてしまう、という選択肢の価値はもっと認められるべきであろう。ただ決定をランダムにすることと継続的にデータを採取することさえ心がければ、後で正確に「それがよかったのか」「どれくらいの利益に繫がったのか」が評価できるのだから、少なくともそちらのほうがより確実に「正しい判断」へと近づく道になることもある。

ちなみにランダムというと「デタラメ」「いい加減」と解釈されることもあるが、少し意味は異なる。「無作為」という訳が与えられることもあるが、要するに人間の意思がそこに入り込まないようにすることだ。あるいは「確率的」ということのできるだろう。ここで注意しなければいけないのは、人間が「無作為らしく」あるいは「テキトーに」出した数字は、しばしばそれほどランダムでなかったりするという点だ。
P.122引用

●エビデンス例

J-STAGE

https://www.jstage.jst.go.jp/browse/-char/ja/

●データベースを使った展開まとめ

説明変数のために、データを非正規化、マッピング
分析方針の3つのポイント
・アウトカム:「望ましさ」を具体的に定義(売上、在庫コスト)
・解析単位:「望ましさ」を比べる単位(顧客、従業員、商品・・・)
・説明変数:「望ましさ」を左右しうる特徴(属性、行動、心理特性・・・)

この辺りをみればいいのヒント
統計的に意味のある結果
業務データを分析用に変換(クエリ)
考えるところ(経営課題を指定)
・何ごとにみたいのか?
(顧客ごと、店舗ごと、ヒット商品かorそうでない商品なのか?)
何を最大化したいのか、最小化したいのか
変わった特徴があるデータを提示
これが関係しているんじゃないか?

現場→データ→分析→改善
会社によって、利益の源泉が少しづつ違う
何のデータが利益の源泉と関係しているか

【第1回 なぜあなたの会社ではデータが活か せないのか】
https://www.youtube.com/watch?v=eGcYpNxqd0o

【データを前にしてまず考えるべきこと】
https://www.youtube.com/watch?v=bmk-FRuZ91o

Q.〇〇に関するデータをいっぱい集めたんだけど
何をしたらいいですか?
A.まず、(御社や顧客が)「何がどう変わるとうれしいか」を
考えましょう。

分析方針の3つのポイント
・アウトカム:「望ましさ」を具体的に定義(売上、在庫コスト)

どの数字が、大きくなる、小さくなることが望ましいのか?

ビジネスでの「望ましさ」は、もっと儲かること。
この部分の売上が大事だとか、この部分のコストが大事だとか、
業務のエキスパートが良く知っている。

・解析単位:「望ましさ」を比べる単位(顧客、従業員、商品・・・)

売上100億円を全体像だけみていてもわかりません。
100億円を分解する
分解するのはたくさんあります。
たとえば、お客さんという軸で分解すると、
 ○○を軸(解析単位)で分解→望ましいとそうでない→左右する特徴は?
すごく買ってくれている顧客とあまり買っていない顧客がいる。
従業員でみると1億円売った従業員と1,000万円売った従業員がいる。
違いがわかると嬉しいかもしれない。
違いを上手く使うと利益が上がる方向に変えていけるかもしれない。
アイデアが見つかるかもしれない。
全体像をいろんな軸で分解してみることが、解析単位。

・説明変数:「望ましさ」を左右しうる特徴(属性、行動、心理特性・・・)

例えば、顧客という解析単位が決まりました。
顧客の特徴を整理すると
顧客の特徴が、売上に関係しているとか、
商品のこの特徴が在庫コストに関係しているとか

この辺りがかわると、
アウトカムが、嬉しい状況になるのではないか?(仮説になる)

分析≒比較軸
(望ましい):(望ましくない)
来店頻度が多い人:少ない人
販売金額が高い人:低い人
破棄率の低い商品:高い商品

●望ましい、望ましくない理由がここにある
コントロールすることで、
事業を望ましい状態に変えることができるかもしれない。

「望ましさ」を具体的・定量的に定義 アウトカム

アウトカムの考え方
ゴールから逆算 長期的な利益
現実的に、過去1年間の利益をどうすれば、『最大化』できたのだろう?

利益→売上→利用頻度を上げる?客単価上げる?コスト下げる?

売上の高い顧客:低い顧客
売上額の高い商品:低い商品
売上の上がる広告:そうでもない広告

解析単位の考え方の例

WHO:顧客、授業員、パートナー・・・▶️○○番号
WHAT:商品、サービス、設備、取引・・・▶️○○番号
HOW:広告、キャンペーン・・・▶️○○番号
WHEN:年、シーズン、月、週、日、時・・・▶️○○日 フィールド名
WHERE:地域、営業所、店舗、施設・・・▶️○○番号

何が(解析単位)が
どう(顧客、商品がどうなると)変わるとうれしいかを考えましょう。
『どこから手をつければいいのかが、回避できる』

軸 解析単位 と 変数 解析単位→プラス か、マイナス どちらが嬉しい?

【説明変数と打ち手の関係】
https://www.youtube.com/watch?v=MUJwAUeLimo

仮説ではなく特徴を

「何か良い仮説を立ててください」ではなく、
「解析単位の特徴」を可能な限りデータで定義してください。

①仮で、解析単位を決めてください。
②この解析単位の特徴を今あるデータで、可能な限り定義してください。

アクセスログの解析なら

生アクセスログ

ログの説明変数化
・ユーザID※
・期間中総PV
・滞在時間
・利用ページの嗜好→ページ/機能分類ごと(トップ、商品詳細、検索・・・)、アクセス回数割合
・利用時間帯の傾向→時間帯ごと、訪問頻度割合

紐づき
顧客マスター
・ユーザID※
・性別
・年代
・居住都道府県

紐づき
購買履歴
・ユーザID※
・期間中利用金額▶アウトカム! この金額を上げることが望ましい
・購買ジャンル割合
・割引適用割合

軸は、○○番号 から 

統計解析の2つ使い方

洞察:予測

洞察が重視される状況
どうすれば、この商品の売れ行きが伸びるか
アイデアをくれ
▶原因として、何が、どれくらい効いているか?
▶もしかしたら、このあたりを変える(コントロール)することで、
売上を伸ばすことができるんじゃないか?これが洞察です。
何がどれくらい影響しているのがわかると改善

予測が重視される状況
この商品を何台仕入れればいいのか、
正確に教えてください。

●分析結果から打ち手へ①洞察

動かせないアウトカム(来店)

動かし得る説明変数

①心理的要因
②広告接触
③ブランド力(かっこいい?かわいい?信頼できる?がいいのか)
※①~③を変えることで来店がどう変わるか

動かす
かっこいい!と思ってもらえるために、
スペックを変える、カラーリングを変える、
デザインを変える、パッケージを変える、
内装を変える
※いろんなものを変えられる
試して、来店者がどうなるか?

●分析結果から打ち手へ②洞察

動かせないアウトカム(来店)

動かせない説明変数
①性別
②年齢
③世帯収入

ずらす
女性のほうがかってくれているなら、
女性に合わせていく、狙いを変えていく

●分析結果から打ち手へ③洞察+予測

動かせないアウトカム(来店)

ずらせない説明変数
①季節
②天候

制御下にあるリソース
③接客人数

最適化

●打ち手のインパクト
全社員が前年比コンマ数%程度の業務改善

全社で営業利益数億円の成長性

●まとめ
説明変数を通して、
アウトカムを動かす打ち手を

SHARE