データ分析の教科書 最前線のコンサルタントがマクロミルで培った知識と実践方法
著:エイトハンドレッド
著:渋谷 智之
出版社:翔泳社
DATA UTILIZATION
本書は、データ分析を問うのではない、データ分析は手段と冒頭で言う
では、どうするのがいいのか、問いの設定、データの考察から、思考法とその型を身に着けることとある
データ分析とあるが、メタ的な視野で、大きな範囲をみています
コンサルなどの手法が含まれているが、本書を貫くのが、データ分析のための5つのステップである
STEP1 解くべき問いを明確にする
STEP2 問いを分解し、分析ストーリーを描く
STEP3 データ収集、前処理を行う
STEP4 データの比較を通じて解釈する
STEP5 分析結果&結論を分かりやすく伝える
問いの設定も、分析結果をわかりやすく伝えることも、他の書で論じられているのであるからデータの処理を中心に読むのであれば、STEP3,4がキモであり、STEP5については、分析結果をだすまでがデータ分析で、伝える部分は、本書でなくてもいいかと感じました。
ETL,DWH,BIの流れからビッグデータを処理することは、IT書に任せて、データの処理・分析そのものを論じていると感じる
必須なビジネス知識もそうだが、ここで、データを処理するためのコア技術とは、ずばり統計学である
ビッグデータとは、
①データ量が大きい、②データが計測・記録されるスピードが速い、③データの種類が多様
が、その定義である
データへのアプローチ、分析ストーリーを事前に用意する
①報告書:なぜ自社の売上が低下しているのか
②目次
③エグゼクティブサマリ
④第1章 市場規模
⑤市場規模の時系列推移
⑥自社のシェア推移
⑦第2章 顧客から見た要因分析
⑧自社の市場浸透度
⑨自社のイメージ
⑩自社の特徴認知度
⑪第3章 競合との比較分析
⑫各商品購入者の満足度比較 ……
データの種類
①カスタマデータ、②オペレーショナルデータ、③Webサイトデータ、④ソーシャルメディアデータ、
⑤ログデータ、⑥センサーデータ、⑦調査データ
1次データと、2次データ
構造化データと、非構造化データ
データ加工
①データ品質の確認 信頼できるデータかどうか
②複数データの結合
③探索的データ分析(EDA)
④データの前処理(クレンジング)
⑤データ加工
データは加工される前の前処理で80%の工数が使われる
分析 パラメタ1つ 単純集計、パラメタ2つ、クラス集計、パラメタ3つ以上、多変量解析
データを比較するときの5つの視点
①大きさ パレート
②差がある ギャップ、ポートフォリオ、レート・シェア
③変化がある 時系列、トレンド、
④バラツキがある 分布、グループ分け
⑤パターンがある 相関、パターン、外れ値、
目次
第1章 DX時代のデータ利活用
第2章 「データ分析」ステップの全体像
第3章 【STEP1&2】解くべき問いの明確化・分析ストーリー作成
第4章 データ分析に必要なビジネス知識(前半)
第5章 データ分析に必要なビジネス知識(後半)
第6章 【STEP3】データ収集・前処理
第7章 【STEP4】データの比較を通じた解釈・考察
第8章 【STEP4】データ分析の幅を広げる「統計解析」
第9章 【STEP5】レポーティング&プレゼン
第10章 AI・機械学習の基礎理解
ISBN:9784798182162
判型:A5
ページ数:380ページ
定価:2600円(本体)
2024年03月19日初版第1刷発行
2024年11月15日初版第3刷発行