【感想・ネタバレ】とある弁当屋の統計技師(データサイエンティスト) ―データ分析のはじめかた―のレビュー

あらすじ

“とある弁当屋”を舞台に、いま話題のデータサイエンティストが活躍するユニークな統計の入門書!
本書では、物語風に統計解析の目的と方法を解説します。具体的には、最近注目を浴びている「データサイエンティスト」を主人公にみたて、顧客であるお弁当屋さんの売上向上を目指して活躍するという筋立てです。主人公が、お店の看板娘に解説するという形式で、統計の基礎概念、方法論、また応用について懇切丁寧に解き明かします。通勤通学の電車の中でも通読できるよう、できるだけ単純化した説明を試みました。そこで、机に向かってじっくり本書の内容を復習したいという読者には、サポートサイトを用意する予定です。統計学なんかまるで縁がなかった、習ったかもしれないけどもう忘れたという社会人や大学生、数学Iの「データの分析」がわけ分からんという高校生に贈ります。

...続きを読む
\ レビュー投稿でポイントプレゼント / ※購入済みの作品が対象となります
レビューを書く

感情タグBEST3

Posted by ブクログ

統計の基本概念、方法論が丁寧に解説してあって、面白く読めた。でもわかりやすく、平易にと考えた分だけ、細かい部分があいまいになった感があって、ちょっともどかしい感じだったかな。忘れかけていた統計を勉強し直してみたくなった。

0
2018年10月12日

Posted by ブクログ

統計の話がデータサイエンティストの物語形式になっていて難しい本とは違い優しく読めた。
専門用語がやはり難しいのだが、内容的には初心者にも理解できると思う。こういう本が増えて欲しい。

0
2020年01月05日

Posted by ブクログ

標本平均の平均値、標本平均の標準偏差。
中心極限定理

帰無仮説と対立仮説を建てる。帰無仮説を前提とした場合のt値から確率を求める。0.05未満であれば帰無仮説を棄却する。対立仮説が採択される。

ダミー変数(0か1か)。
自由度=データ数からパラメータを引いた数。

決定木。

対数は、右肩の乗数を求めること。

0
2016年05月27日

Posted by ブクログ

弁当の売上分析、売上予測をテーマに書かれた統計本。
銀座のデータサイエンティストというブログでも紹介されています。
物語ベースでの説明になっているため、初心者でも分かりやすく書かれていた。
仮説検定についても分かりやすく書いていたので、
少し理解が深まったように感じた。

【参考になったこと】
・データ分析でみるべきは、平均からのバラツキ。

・帰無仮説とは「係数を0と考えること」で、
 係数が0でないことを対立仮説と呼ぶ。
 帰無仮説の基で統計量(t値)が計算される確率を求め、
 その確率が0.05より小さい場合は、帰無仮説を棄却し、
 対立仮説を採択する。
 つまり、今回の係数はまずまず信頼出来るという意味。

・回帰分析のときは、予測値と実測値のあてはめの良し悪しを
 見る必要があり、このときに使うのが「決定係数」
 1に近ければあてはめが良い。

・重回帰分析では、説明変数が多くなるとあてはめそのものは
 無条件に改善されてしまうリスクがある。
 これをチェックするために、自由度調整済み決定係数を使う。

・自由度とはデータ数からパラメータ数を引いた値。
 これだけのデータが揃えば残りが特定されてしまうという意味。

・説明変数間は相関が無いデータを選ぶべき。
 例えば、天気と気温は選んではいけない。
 多重共線性という問題が起きてしまう。

・カイ二乗検定では、クロス集計表の行列に相関がないかを
 チェックする。ロジスティック回帰で行う検定。

・箱ひげ図の上下線が四分位範囲の1.5倍と定義したのは、
 正規分布の特徴からである。これで99%近くを網羅するので、
 それより外れたデータは外れ値としての検証が必要。

・母集団全体でバラツキを調査する場合は、
 データ量で割ってもデータ量-1で割っても変わらないが、
 一般的に標本集団でのバラツキを調査することが多く、
 標本集団のバラツキは母集団よりも小さくなる傾向にある。
 それを補正するために、データ量-1で割る。
 これを不偏分散という。

・カイ自乗検定において、クロス集計表に5より小さいデータが含まれるとき、
 検定の結果が不正確となることがある。
 この場合は、フィッシャーの正確確率等を検討すること。

0
2015年01月03日

Posted by ブクログ

ラノベ小説仕立ての統計入門書。

内容は「平均」「分散」「相関」「重回帰分析」「カイ二乗検定」など。

表紙に反し、”統計入門書”として一通り詳しく説明されており、その解説もかなりわかりやすかったように思います。

巻末の「あとがき」で筆者が〈小説は素人〉と告白されています。たしかに物語としてはテンプレ的ですが、純粋に統計入門書として優秀だと思います。

小説の端々に「R(統計ソフト)」が登場しますが、それについての解説はほぼ皆無です。

0
2014年10月31日

Posted by ブクログ

統計の基本がわかりやすいです。
Rも出てきて面白い。
でも、残念なのは、ここにわけのわからない恋愛話を
交えてしまったことでしょうか。

統計に興味がある初心者の方は読んだ方が良い一冊です。

0
2013年10月27日

Posted by ブクログ

4?5?章から後は急に説明が端折られた感じで、
1番知りたいところがわかりにくかった。
また、あとがきに書いてあることは、各章の後ろが良かった気がします。

0
2025年05月30日

Posted by ブクログ

ネタバレ

統計学の超入門として会社の本棚に入っていたので手に取りました。

内容としては、弁当屋の売上に焦点を当てて統計学を用いてどのように分析をするのかを解説しながら展開をしていきました。

ただ、その形式で進めているからか、小説部分の比重が重くなってしまっているようでした。

統計学について概要を掴むよりこんなシーンで利用想定ができるということを考えたり想像できるのに有効だと思いました。

0
2023年08月22日

Posted by ブクログ

表紙は・・・ですが、意外と内容はきちんとしています

昔、統計を少し勉強している方に有意義だと思います(復習という意味で、、、)
統計初心者のかたは、少しハードルがあるかもしれません

0
2014年10月11日

Posted by ブクログ

やっぱりストーリーが余計に思えますが,こういうのが分かりやすいと思う人もいるんでしょう。

中央値、四分位偏差、箱ひげ図、平均値、分散、標準偏差、t検定、標準化、F検定、z検定、回帰分析、重回帰分析、ロジスティック回帰分析、決定木、カイ自乗検定

*****
 重回帰分析では,説明変数を増やすと,実際に役立つ説明変数であろうがなかろうが,あてはめそのものは無条件に改善してしまうんです。
 自由度調整済み決定係数というのは,説明変数が追加されることで無条件にあてはめが改善されてしまうことを差し引いて調整した値です。(pp.142-143)

0
2014年02月13日

Posted by ブクログ

普通とばらつき データの特徴を掴もう
 平均、中央値、箱ひげ図、四分範囲
平均と分散
 正規分布 平均+ー1.96×標準偏差/sqrt(N)
 二項分布
相関と回帰 気温から売上を予測しよう
 相関、偏差、共分散、t検定、p値
重回帰分析 気温と曜日から売上を予測しよう
 調整済み決定係数、F検定
ロジスティック回帰分析 買うか買わないか予測しよう
 ロジット、対数オッズ
決定木 特徴を調べる
χ二乗検定

0
2014年02月11日

Posted by ブクログ

ネタバレ

統計の授業を取っていなかったので、なんとなくだった知識の基礎を確認しておきたかったのと、あとはちょっと某界隈で噂になっていたので購入してみた。

p値についてのイメージや、分析のアプローチ、その妥当性の確認、などを説明していてわかりやすく感じた。

ただ、専門的な統計の入門書というわけではないので、これともう一冊をやらないと実践で使えるという感じではないかもしれない。

とりあえずストーリ仕立てでとても読みやすかった点はポイントが高い。
何のポイントかは自分でもよくわからないけれど。

0
2014年01月19日

Posted by ブクログ

最近良く巷で聞く「データサイエンティスト」って、実は大半が「統計技師」のことじゃないかと思って、ちょっと買ってみた。

0
2017年06月08日

Posted by ブクログ

初心者向けというにはちょっと難しいし、恋愛モノには全然なっていないし、むずかしいところ。でも、真面目に統計を勉強する気持ちになれば、初心者レベルとしては、実例を交えてよく書かれていると思う。

0
2013年12月03日

「ビジネス・経済」ランキング