幅広いデータ分析・活用を扱っている。実際にあるようなストーリー仕立てになって現場感を出している。
Pythonについての説明はないので学習スミの人向け。
3部の最適化問題はおもしろかった。
1章 ウェブからの注文数を分析する
データの読み込み。ユニオン、ジョイン、検算、可視化についての説明。丁寧
...続きを読むな説明。
2章 小売店のデータでデータ加工を行う
名寄せ、表記ゆれなどのテクニックについて
3章 顧客の全体像を把握する
データを統計値などで俯瞰する方法
4章 顧客の行動を予測する
線形回帰モデル(教師ありモデル)で退会しそうなユーザーを予測する準備
5章 顧客の退会を予測する
4章で準備したデータで決定木モデルで退会しそうなユーザーを予測する。
6章 物流の最適化ルートをコンサルティングする
物流コストを最小にする輸送ルートを決定する。
輸送ルートの可視化にNexworkxを使用、最適化にはpulpとortoolpyを使用
8章 数値シミュレーションで消費者の行動を予測する
口コミを確率的シミュレーションで予測している。
9章 潜在顧客を把握するための画像認識
店の前の映像を使って時間帯ごとの通行人の数(=潜在顧客?)を自動的にカウントする。
10章 アンケート分析を行うための自然言語処理
MeCabをつかって日本語処理をおこないアンケートの類似度などを抽出する