あらすじ
「それ、根拠あるの?」「計画通り行くの?」と突っ込まれて、何も言えなくなってしまった…。そんなプラン・企画に数字的な裏づけをつけたいとき、データ・統計分析が使えます。
本書は、はじめてデータ分析をする新人が、データ収集から、分析、プレゼン資料を作成するまでを、ストーリーを交えて紹介。「リスクはどれだけか」「収益性はどの程度か」「何が一番の成功要因になるのか」などの数字的根拠が、エクセルで簡単に出せるようになります。日産自動車で活躍する著者による、現場で役立つ「実務のコツ」が満載です。
感情タグBEST3
Posted by ブクログ
良書。統計学のビジネスへの落とし込み方をストーリー形式で語られたもの。
プレゼンを依頼されたところから始まり、プレゼンに使うデータの分析や、分析してお終いではなく、分析結果を基に伝えないといけないポイントとかが載っていた。
根拠ある説明の仕方を考える上でのバイブルとして持っておきたい。
Posted by ブクログ
標準偏差 stdev
分散=偏差(平均-各データ)二乗の合計/データ個数
標準偏差=√分散
全データの2/3が収まっている範囲がわかる
相関関数 correl
2範囲の相関性+1〜-1
散布図にすると0.7くらいから方向性が見える
データの前提を見誤ると変なデータになる
単回帰分析 散布図>データ>線形近似
・グラフに数式を表示する
・グラフにR-2乗値を表示する
R-2乗値は相関値の二乗なので、0.49が相関0.7と同じ。R-2乗値が0.5を超えたら相関性を認めて良さそう。
y=ax+b になる
bは切片。例えば費用ゼロでもいける売上。実態からbを引けば試作効果がわかる。
Posted by ブクログ
データ分析超入門も読んで、ダブルの評価です。
分析とは、仮説を検証することである。
良い名言ですねー!
目的を押さえて→仮説を立てて→手段(分析の)
という型を教えてくれました。
目的→仮説→手段が全部ロジカルにつながっているかも大事である。
目的→仮説の段階では、サラッと当たりをつける分析
(フレームワークや上位で並列な軸、よりインパクトがある軸を選ぶ)
仮説→手段の段階では、しっかりとした論理作りのための分析
分析の手段とは、仮説の根拠を集めること。
仮説の根拠を集めるには、データ収集をする。
その手段が沢山ある。
例えば…
・絶対値を比率に加工する
・要素ごとにさらに分解する
・定性情報を定量情報にする
・平均、中央値、外れ値、標準偏差、ヒストグラム、相関分析、単回帰分析が分析の手段。
・e-Statで人工関連の調べものができる。
データ収集のコツは、仮説の一歩外までデータを集める。
(データ切れ対策のために)
データ収集のコツは、データの軸に着目する。
データ収集のコツは、データの範囲を意識する。
Posted by ブクログ
これまで統計分析もどきの数字を使った仕事をいくつかやってきたが、どれもいい加減、虚仮威しな感じが否めない。100%の正解は無いとしても、及第点だったかどうか? 多少の用語には慣れていたものの、ちゃんと理解している訳ではなかった。これまで、なんとか自分で消化して頭の中に入れようとこの手の本に挑戦してきたものの、いずれも撃沈されていた気がする。ほぼ全てが苦手の数学に足を取られてしまい前進出来なくなったり、読み切ったとしても上っ面になっていまうのだった。そして、ようやく出会ったのがこの本。リアル感を出すための商社を舞台にしたストーリーは、逆に絵空事丸出しに思えるが、統計・分析のことを順序立てて理解するには、良いガイド役。とにかく、シンプルな説明、易しい言葉遣い、明確な筋立て、お陰で何の戸惑いもなく頭に入ってくる良書。
Posted by ブクログ
データ分析の仕事をする時に勧められた一冊です。 紹介している技術や分析手法は非常に簡単ながら、注意すべきポイントを端的に示してくれているので、非常に勉強になりました。本当にこれからデータ分析のお仕事をするぞという方向けのようです。 この本を参考に分析を進めていきたいと思います!
Posted by ブクログ
・分析をするための発想とコツ
・分析手法
・結果の伝え方、見せ方
上記3つの観点が分かりやすくて実際に仕事でつかえそうだったのですごく為になった
読書メモ================
【発想とコツ】
■分析とは
・仮説を確認(検証)すること
■仮説が必要な3つの理由
①無駄な分析をさけることができる
何を調べるかが明確だとそのためにどのデータが必要でどの手法を使えばよいかについてのブレが減る
②分析の目的が明確になる
「何をしりたくて調べていたのだっけ?」と本来の目的を忘れ「分析結果を出すこと」だけを追いかけてしまう状態をさけることができる
③大局的な視点でストーリーが作りやすい
仮説は目的を達成するための要素である。
その複数の仮説(要素)に対する分析結果を組合わせることで、目的に対する多面的、大局的な視点を持つことができ、より説得力のある答えを引き出すことに繋がる
■仮説アプローチの罠
①見えない課題を見逃すリスクがある
最初から課題ありきで始まる場合、もし同じデータにより重要な情報が埋まっていた場合それを見逃す可能性がある
・仮説アプローチの対極にある「網羅的アプローチ」
目的や課題を限定せずに片っ端から網羅的に分析にかけること
「大きな仮説がとくにない」というときに使える
労力がかかるが想定しない発見に出会う可能性を秘めている
②バイアスのリスク
「仮説」は、検証前の「思いつき」でしかないため、
その仮説が、個人の主観にある程度頼らざるを得ない限り、その人の思い込みやバイアスに左右されるリスクは避けられない。
いくら分析テクニックを身につけようが仮説作りに失敗してしまうと、集めるべきテータや分析手法が最適でなくなりアウトプットの質が下がる
■仮説を効果的にたてる為のポイント
①モレなくダブりなく(MECE)
仮説を立てる範囲に抜けがあれば大事な視点を見逃す可能性がある
またダブりがあると無駄な分析につながる
最初の段階でこれらのリスクをできるだけつぶしておくことが大事
②現状の制約条件にとらわれない
手元にデータがない、今まで調べたことがない社内に知見を持った人がいないなどの理由から、それらに関わる仮説を最初から排除してはいけない
そこに大事な発見がある可能性があるため
③複数の仮説を立ててみる
問題の原因や、機会の存在は1つとは限らない。
何かしらのストーリーやロジックをもって相手を説得する場合にも1つの根拠だけに頼るよりも、複数の切り口からお互いの仮説を保管し合う主張のほうがより強いメッセージとなる
④最初から100点を狙わない
最初からある程度本質をついた仮説のほうがより効率的に答えにたどり着くことは事実
しかしそれにこだわると発想も広がらず思い込みが入りやすくなる
「仮説は完璧でなくてこも良い」ということを常に念頭において置く
■「仮説構築のための分析」と「仮説検証のための分析」
限られた時間では仮説のあたりを付ける精度を上げて分析をより効率的にすすめる必要がある
そのようなときにも「分析」が活躍する
ラフな分析を短時間で行い、その結果を見て深堀すべきポイント、仮説の優先度を見極めることができれば分析作業全体の効率が上がる
例)お店ページのSEO順位をあげるための問題をみつけたい
・ある都道府県に問題があるのでは
・投稿数が多いと少ないで問題があるのでは
・あるジャンルで問題があるのでは?
・お店名のパターンによって問題があるのでは?
上記のように問題になりそうな仮説を網羅的にだす
それぞれの仮説ごとに傾向をだして、問題がありそうな傾向が見られた仮説に対してさらに深く分析する
「さらっとあたりを付けるための分析」と「しっかりとした論理作りのための分析」をうまく使い分けられるようになれるとよい
【データの集め方と分析の視点】
■データ集積のポイント
①仮説の一歩外までデータを集める
②データの軸ごとに分解する
例えばお店UUの軸として「投稿数」「ジャンル」「都道府県」という軸がある
それらの軸ごとに分解することで軸ごとに違いが見えてくる
・分解しすぎることの問題
ーコストがかかる
ーおおきなばらつきの問題
雑音となり得るデータが含まれている可能性があるため
③データの範囲を意識する
どこまでのデータを採用するかによっても分析結果は変わる
一日、週間、月間、年間によって傾向がかわるため目的に沿った範囲でとること
とくにこれという正解はないので取れれば多く取っておいたほうがいい
④外れ値は理由を考えて処理する
分析する上で最も大事なのが「外れ値が存在していることを認識していること」
もし外れ値が正当な理由なく入っている場合、それを外しておくべき
・散布図にして外れ値を見つける
【平均・中央値】
■平均の罠
・平均は常に真ん中にあるとは限らない
・平均の周りに最も多くのデータがあるとは限らない
■中央値はポジショニングを知るヒントになる
・データの中にある極端な値の影響を回避できる
中央値と平均を比べて極端な「外れ値「など極端な値のデータの有無のフィルターとして機能することもわかる
【相関分析】
■相関の強さを示す「相関係数」
相関の大きさには強い弱いがある
一方のデータがどの程度他方のデータの動きに連動しているかで決まる
相関の強さは「相関係数」という指標で示される
相関係数は+1〜ー1までの範囲
相関係数がプラスだと正の相関「2つのデータの増減方向が同じ」
相関係数がマイナスだとマイナスの相関
ゼロだと全く相関がないということになる
-1 ~ -0.7:強い負の相関
-0.7~-0.5:負の相関
~0.5~0.5:相関なし
0.5~0.7:正の相関
0.7~1.0:強い正の相関
■見せかけの相関と因果関係
①単なるデータの偶然(たまたま傾向が似ていただけ)
例えば株価下落と季節が冬に向かっているときの気温は同じく数値が現象していて相関係数は高くなるが
これにはなんにも理論的なつながりがない
②単に”関連”のあるデータの組み合わせ
身長と体重など
③疑似相関
2種類のデータには全く相関関係がないのに、その他の要因が影響して計算上相関があるようにみえること
例えば「年収」と「起床時間」の関係である
「早起き」→「年収が高い」は計算上では相関関係が高いことが出てしまう
しかし実際は「早起き」→「年寄り」、「年寄り」→「年収が高い」(年功序列がまだあるため)
のように「年寄り」は「早起き」と「年収が高い」ことと相関があるが「早起き」と「年収が高い」には実は相関がない
このような見せかけの相関を「疑似相関」と呼ぶ
従って早起きすれば年収が上がるとは言い切れない
大事なのは疑似相関があるということを常に意識すること
■相関分析で、データ範囲を扱うときに覚えておきたい重要ポイント
・データがあったからそのまま分析に使うのではなく、目的にあった範囲のデータを使うこと
・相関係数の計算だけを鵜呑みにせず、散布図で視覚化することで全体の様子をみること
【見せ方、伝え方】
■分析することと伝えることは違う
分析タスクと結果を伝えるタスクは全く別ものだと考えること
・データ分析の目的
データから特徴を見出す
予測やシュミレーション結果を得る
・プレゼンテーション(伝える)
伝えたいメッセージを理解、共有
同意、承認
■伝え方のポイント
①分析したことを全てみせようとしない
受けてにとって必要なことのみを見せる
②分析結果を文章で言い換えてみる
相手に理解してもらうために文章にしてわかりやすく伝える(メッセージ+図で分かりやすく伝えるほうがいいかも)
③情報源の出所を明記
データソースに信頼がなければ結果の質を下げる
■数値だけではなく視覚に訴える
・伝えたいポイントを吹き出しで入れる
・比較してメッセージを強調する
Posted by ブクログ
著者は日産勤務の現役の方なので、学問としての統計でなく、ビジネスにおける実用的な活用を重視しており、非常に読みやすく、納得しやすい。
事業会社の人でもこのようなスキルを身に着けるわけだから、コンサルティングを提供する立場としても当たり前のように習得していないとね。
Posted by ブクログ
ビジネス統計入門書としては最適な一冊。必要最小限の統計学の内容に抑え、その上でビジネスに使用する際に心がけるべき事が書かれていて良書であった。
Posted by ブクログ
普段実務中にFBされている事がそのまま書かれている本(笑)。そもそも分析って何の為にするの?根拠は?…をある社員の物語に沿って見ていける一冊になっています。初心者はもちろん、経験者にも役立つ良書だと思います。
Posted by ブクログ
まさに仕事で勉強しなければならないことを書いてくれていた本。データサイエンスとまではいかないがデータ分析に携わっているビジネスパーソンが実務で突き当たる問題について基本的なことが学べる。
データ分析に関する書籍を読み始めたばかりのため付箋が大量についてしまった。再度読み返しつつ付箋を減らしたい。
○分析手法よりも思考パターン
⇒仮説思考/ピラミッドストラクチャ
○分析のストラクチャ
・平均と中央値
・標準偏差
・相関分析
・単回帰分析
Posted by ブクログ
データ・統計分析をストーリー形式で説明を進めているため、具体性があり分かり易かった。
統計学的なところだけではなく、筆者の体験を通したデータ収集の実際に多くのページを割いており、参考になった。
Posted by ブクログ
データ分析の基礎的な考え方を学べる。
考え方のプロセスを知れるので、どういったところでこういう内容が必要なんだといったことの把握としてわかりやすかった。
Posted by ブクログ
数式に頼らず、統計学を説明している本。
数式が苦手な方はオススメですね。
私は数式で理解したいタイプなので、少し物足りなかったかなと思います。
Posted by ブクログ
【理由】
分析の質を上げたいと思ったので
【まとめ】
いくつかの分析手法と分析をする上でのデータの見方の注意点がまとめられていた。
【アクション】
・分析の際に見る期間によって見え方が大きく変わるという点に注意して、本当に正しいデータなのかをチェックする。
・分析結果を共有する際は正しいただ結果を見せるのではなく、そのデータから相手に何を知ってほしいのか、相手にどうしてほしいのかを明確にして伝える。
・相関分析と単回帰分析を使う場面が出てきたら改めて読み直す。
Posted by ブクログ
1.ただやみくもに営業するのではなく、データを取って分析し、それを基に営業できれば理想だと思い購入しました。
2.仕事で使われるの大半は単回帰分析と呼ばれるものです。そのため、本書は難しい統計は一切出さないことを前提に、平均・中央値・標準偏差・ヒストグラム・相関分析・単回帰分析だけが章立てしてあります。また、基本となる、データの集めるにあたっての準備や見せ方などといった初心者向けに書かれています。
3.卒論でやったことを思い出した気分でした。大学時代に学んだことが社会人になっても生きるのはすごく嬉しいと思いました。この本にはEXCELではこのように使うなどと書いてありますので読むだけでなく、実践もできるので基礎を身につけるには良い本だと思いました。
Posted by ブクログ
データはあるのに活かせていない現状打破のため購入。
載っているそのままが業務には当てはまらない部分はあるものの、その足がかりにはなりそうだった。
手法としては基本的なものなのだろうが、それすらも今はできていないなぁと思った。
全体的に分かりやすい。同僚にも読ませたい1冊。
Posted by ブクログ
新規市場開拓に向けて分析を重ねプレゼンテーションに臨む、というストーリーで分析のイロハを解説する実務家によるビジネス本。初学者でもわかりやすい文章で、なおかつExcelを使った具体的な手法を紹介しているので理解しやすい。また分析は過程に過ぎず結果をどう伝えるか、という点を重んじ一章を割いていて、それが全体的な説得力を増している。職場に置いておきたい一冊。
Posted by ブクログ
データの集め方やその使い方、データを使った分析方法や効果的なデータの見せ方を紹介している。
具体的行動
・分析と資料作りを分けて行う
└エクセルでの分析がすべて終了してからパワーポイントで資料を作成する
・確証バイアスを防ぐために、仮説を立てたらOJTに「この仮説を元に分析を進めていいか」を相談する
Posted by ブクログ
インプット
目的⇒仮説⇒手段
外れ値を考えて処理をする
└認識していることが重要
平均値(中央値)でバラバラのデータをまとめる
└標準偏差値を利用
全体像を把握するためにヒストグラムでバラつきを可視化する
相関係数をもちいて成功要因を特定する
行動内容
分析することと伝えることは違う
相手に何を知ってほしいのか
自分はこの結果を元に相手にどうしてほしいのか
を基に分析する
Posted by ブクログ
データ分析の進め方、考え方を簡単に書いている本。
Excelで表現出来ることでもやれることはたくさんある
ということを改めて教えてくれます。
とはいえ、分析の進め方については、
ビッグデータ・スモールデータ共に変わらないので、
本書で進め方の概要を理解出来ると思っています。
色々あるけど、結局は難しい内容だと相手に伝わらない
というのがデータ分析あるあるだなあと読んでて思った。
【勉強になったこと】
・何気に仮説作り前も分析が必要なこともある。
そういった意味では何を目的とした分析なのかを
しっかり抑えたうえで分析を進める必要がある。
①効果的、効率的な仮説作りのための分析
②仮説を検証するための分析
どちらの分析をやるかによって、どれくらい精緻な情報や
結果が必要となってくるのかも変わるし、かける時間も
全く異なる。
・標準偏差を使うことで値のバラツキ度合いを理解出来る。
これにより、今回取り扱うデータが安定的なのか、
不安定なのかが把握出来る。
全体を把握するという意味では、平均や中央値だけでなく、
標準偏差についても調査しておくべき。
・標準偏差を比較するときの比較対象となるもの
①同じ規模同士の比較
②時系列による比較(現在と過去)
③ユーザーに依存するならユーザーごとの比較
・ビジネス上標準偏差を使うケース
①平均に隠されたデータのバラツキを見たい・見せたい
②データの統一感、バラバラ感を知りたい
③データの値がバラバラなことを伝えたい
・分析した結果を鵜呑みにするのは危険。
そもそものアプローチが正しかったのか、
データにグルーピング出来る特徴が見れないか、
と常に疑ってかかる姿勢が重要。
・どの要素が影響強く現れているかを把握するには、
相関を見るのが手っ取り早い。
・単回帰分析のほうが相手にとって伝わりやすいが、
現実的には単回帰で表現出来る事象は少ない。
ただ、だからといって重回帰分析を採用すると、
今度は相手に伝わりにくくなってしまう。
結局のところ、伝わらなければその分析は意味がない。
・回帰分析の大前提は「過去と同じことが今後も起きる」
なので、なんらかのイベントが発生して変わった場合は、
その前後で回帰分析をかけて傾向を見るのが正しい。
→そういった意味で、何か傾向が変わったというポイントを
出来るだけ早く見つけることが重要。
・分析したことに満足してしまって、
やったことを全部見せたいと思わないこと。
あくまで相手にとって必要な情報は何なのか、
相手の立ち場を考慮して分析結果を取捨選択すべき。
・分析する行為と分析した結果を伝えることは、
求められるスキルが全く異なる。
その意味でデータ分析者には両方の資質が求められる。
Posted by ブクログ
統計に関する本は何冊か読んできて基礎知識はあるつもりでいたが、この本はわかりやすく説明されていて、いままであいまいだった点もすっきりと理解できた。
「散布図」を利用して「外れ値」に注意して、分析対象とするか否かを判断する、平均は真ん中にあるとは限らない、平均の周りに最も多くのデータが存在するとは限らないなどは、図解されていて非常にわかりやすかった。
標準偏差や相関関数についてもExcelの使い方も説明されており、どのようなケースの分析に役立つかが解説され、実際に自分の仕事でのケースと比較しながら読むことができたので、今後に生かせる内容の本であった。
Posted by ブクログ
実際に則した思考の順に論が展開されていてとてもわかり易い。ただし、意義付をすっ飛ばして都合のいい解析手法でまとめあげている印象。とはいえ、入門書としてはとても良いと思う。
Posted by ブクログ
基本的な分析の知識を身に着けたい人にとっては良書と感じた。ある会社での事例がすべての話を通して書かれているがそこは必要なのかよくわからなかった。
Posted by ブクログ
とても良い本です。
分析の基礎を学びたい方、ポイントをおさえて丁寧に教えてくれます。
エクセルでのグラフの作り方や、関数も書いてあるので、これから分析の仕事をやり始める人にはうってつけ。