あらすじ
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
本書では、各種分析手法をただ網羅するだけでなく、データのばらつきやバイアスに関する基礎知識、データにさまざまな偏りを生じさせる行動心理学、,サンプリングの方法と理論、データハンドリングのノウハウ、各種分析の考え方、データの解釈における認知バイアスや数理モデリングのポイント、システム運用時に発生する問題など、非常に幅広い視点でデータ分析者が知っておかなければならない知識を整理し、平易に解説しています。
感情タグBEST3
データサイエンス入門書
自分はデータサイエンスに関して全くの初心者ではありますが、この本は抵抗感なく読めましたので初学者にお勧めできるものだと思います。但し、自分は理系出身者であり数学にはある程度知識があるため統計的知識を難なく読み進められましたが、例えば文系の方で数学に全く疎い方であれば少々抵抗感が増すかもしれません。ですがそのような場合でも数式や専門知識ごりごりの本ではないため調べながら読むことは十分可能なのでご安心ください。
Posted by ブクログ
データを見て、データから情報を読み取るための考え方を学ぶ本。
データ分析を行っている人にとっては既知な内容も多いとは思うが、知っておくべき内容がまとめられている。
データの解釈については、学術的な要素ではなく経験則的な内容であり、体系だった書籍は珍しく、
備忘録的な役割も含め、データ分析者としては誰もが一冊持っておいても良いと言える内容。
Posted by ブクログ
統計学的なデータの解釈の仕方やデータに含まれるバイアスについてなど、データを扱う上で必要な視点や知識が丁寧に記載されてあり良かった。
技術的な内容というよりはデータを扱うための教科書的なもので、一度これに目を通しておくとある程度質の高いデータの扱いができるようになりそうなので、特にデータをよく見る人にはお勧めしたい一冊。
Posted by ブクログ
特に例がわかりやすく、とても勉強になりました。
データ分析において、気を付けなければならない点が上手くまとまっていると感じました。
間違った解釈をしないための本です。
・選択バイアスの例
第二次世界大戦中、帰還した多数の爆撃機の損傷跡の分布について分析した。
米軍は、攻撃を多く受けた個所を補強すべきと結論付けた。
しかし、統計学者は損傷が少ない箇所を補強すべしと主張。
何故かというと、得られたデータは攻撃を受けても帰還できた機体に限定される。
撃墜された機体のデータは含まれない。
損傷がない箇所は、そこに攻撃を受けると致命的だということを示していると。
・マシュマロテストの真実
有名な実験で、4歳児に「机の上のマシュマロはあげる。私が15分後に戻ってくるまでに食べるのを我慢できたら、もう一つマシュマロをあげよう」と言い、15分我慢できるかを調査しました。
分析の結果、我慢できた子は、その後社会的に成功していることもわかりました。
この話には続きがあり、再度人数を増やして行った実験で、実はこどもの家庭の経済力と相関があることが判明。
裕福な家庭の子供にとってはマシュマロに大きな魅力を感じないというだけだったと。
Posted by ブクログ
データ取得から活用までの過程、および、各過程毎に注意すべき点が体系的に整理されている。
これほど体系的にまとめられた書籍には初めて出会った様に思う。
アナリストとして意思決定支援に携わってきた中で、本書記載の内容は経験則的にインプットしてきたことが多く、あまり有用な書籍はなかった。
(分析手法にフォーカスした技術書は豊富だが)
そういった意味でも、初学者にとってはこの上ない入門書ではないだろうか。
個人的には、本書と「AIデータ分析プロジェクトの全て」の2冊を、データ分析初学者への入門書としてオススメしたい。
Posted by ブクログ
データサイエンティスト、またデータを扱うことに関係するすべての人におすすめ。
内容はある程度数学(中学ー高校)がわかっている人向けではあるが、それを除けば本当に誰でも読める。というかその部分を飛ばしてでも、読み進めていくことさえ可能である。本書では、データを解析する前にまずそのデータの収集プロセスが正しいか、またバイアスを回避(認識)できているか に始まり、正しい解析手法、間違いやすい解析プロセスを初学者にもわかりやすいように教えてくれる。
因果関係があるかどうかを判断する基準=Hill's criteria は有効なので論文を書くときとかにうまく引用して使いたい
Posted by ブクログ
江崎貴裕さんの著書2冊目。
こちらは前回の『数理モデル』よりもグッと分かりやすかったです。データを解釈する時に気をつけること、データ分析でできないことを入門書として解説してくれています。
データ分析をする人は全員目を通しておくべきかもしれませんね。
データ分析系の本を読んでいるとまあまあ内容も被っていると思いますが、個人的には「変数データの振る舞い」「多変量データを解釈する」はあまり解説している本も少なかったので、ありがたかったです。(もちろん詳しい解説書はありますが、入門書の位置付けではあまり見ない)
『数理モデル』ももう一度読み直そうと思います。
Posted by ブクログ
『データ解釈学』
網羅性★★★★★
分析方法★★★★★
解釈 ★★★★
【購読動機】
目的に沿うデータを取得、集計し、解釈をするシーンがあります。他社のIR資料を理解するもその一つです。こうした業務を重ねるなかで「解釈」という行為の幅の広さを再認識することになりました。
――――――――
【本書の特徴】
データを集計、分析する領域に関心ある人向けです。目的別にデータ集計、分析手法の紹介があります。また、そのメリット、デメリットの記述もあります。冒頭にあるとおり、網羅性が高い書籍です。
一方で、わたくしのようにデータを分析する手法よりも、解釈のやり方に課題、関心があるひとには少し難易度が高いかもしれません。
――――――――
【学べたこと】
私が観察するデータ群には、大きく2つの種類にわかれます。サンプル点数が比較的多いものと少ないものです。
データ群が多い場合には、分布図を観察することの有益性を認識することができました。
また、異常値がある場合は、含めた場合と除去した場合の2種比較をすることの意義も学べました。
<データ分析。主な目的とデザイン>
1)データ記述・探索
特徴の強さ・特筆性を明るくすること。
2)予測
目的変数を設定→予測モデリングの構築をすること。
3)因果推論
目的変数と説明変数の関係性の強弱を明るくすること。
<因果関係を判定するための基準>
1)頑強性
2)一貫性
3)特異性
4)時間制
5)用量反応関係
6)妥当性
7)整合性
8)実験の有無
9)類似性
<さいごに>
例えば、1つの事象(不具合含む)を観察したときに、それが過去の事象と比較して、3)特異性なのか?9)類似性があることなのか?を区別することで、その後の解決に向けての解釈の展開が合理的になるすことを理解できます。
また、事実を並列にするときに、推理小説のように4)時間別にプロットすることの有効性も理解できます。
学生時代に統計学を避け、別の科目を取得したことを思い出しつつ、書を閉じました。。。
Posted by ブクログ
統計学を学び直したいと思い立ち、入門編として購入。統計学の基礎からデータ分析まで広く浅く、分かり易くまとまっており、大枠の理解を深めることが出来た。次はより専門的な本に着手していきたい。
Posted by ブクログ
統計手法の解説ではなく、統計をとる/読む上での注意点、どのような手法を取るべきか/避けるべきか、が書いてある本。
統計の教科書は山ほどあるが、こういう当たり前と言えば当たり前のことをまとめて書いてある本は無かったと思う。例がわかりやすく、ほぼ数式なしで伝えたいことを伝える。著者頭良い。面白かった。統計の技法を学びたい人は、他の教科書を読むべし。
Posted by ブクログ
データ分析の入門書として良かった。データの準備段階におけるサンプリングの話から一通りの基本的な分析手法の説明、よくある解釈間違いまで丁寧に説明されていて、学び直しとしては良かった。また、データ分析の専門家でなくても教養として知っておくとよい話ばかりだった。
平均や中央値の説明までするのはさすがに入門すぎる気もするが。
ただあくまで入門書レベルではあるので、中級編や実践編がほしいと思った。
あとデータ解釈学というタイトルが適切かは謎。[データ分析者のための統計学とデータ処理入門]という感じ。
Posted by ブクログ
これからデータ分析やデータ利用を漠然と考えていて、かつ分析手法などを学ぶことに抵抗感がない人にオススメの本だと思います
改めて、俯瞰して分析全体を見ることができたので自分が抜けている部分や理解していた部分を整理できたのは良かったです。
ここを入り口に実際の統計分析やプログラミングなどを学ぶと、これからのデータ活用に役立つと思います
Posted by ブクログ
データの収集・分析・解釈において注意すべき事項が初学者向けに分かりやすく説明されていて勉強になった。
分析のところは数学的な用語や考え方が出てきて、分析手法一つ一つをきちんと理解はできていないが、分析手法の種類などについて知ることができた。
Posted by ブクログ
難しい数式は登場せず、高校生や文系の方でも読める本。
数字を見る際に陥りがちなバイアスについて詳しく説明されている。
教科書というより、読み物として読むといいと思う。
Posted by ブクログ
データ分析の良し悪しのほとんどはデータを取る前に決まっています。
「Garbage in, garbage out」
と本書には記されていますが,本書はその前提をおいたうえで,良質なデータから最大の情報を取るための基本的姿勢を伝えてくれます。
データを取っただけで最大の情報が手に入れられるわけもなく,どういう視点で分析すればいいのか,どういう視点で読み解けばいいのか,データ分析における「はじまり」から「おわり」までを丁寧に教えてくれます。
データの解釈は日々行なっているわたしですが,改めて大切なことに気づけたり,「そういう視点で考えることもできるのか」と新たな発見があったり,入門書でありながら(入門書であるがゆえに?)濃い情報を頂きました。
HARKingやp-hackingなどにも触れています。
本書だけを読んで「データ分析」「データ解釈」をすぐはじめられるわけではありませんが,「データ分析をしたことがあるけど,実はその基本を体系的に学んだことはない」場合や,「データ分析において注意すべき点は何か」などデータ分析を始めようとしている場合においては,かなりの味方になってくれる本であると思いました。
関連書として『データ分析のための数理モデル入門』もありますので,そちらも読んでみたいと思います。
Posted by ブクログ
入門書ということでデータを解釈することの重要性や難しさについて、幅広く学べました。詳細は別の参考書に譲るという体裁上、実際にすぐ応用できる知識がたくさん得られたという感じではなかったですが、今後学んでいく際にはバイブル的な本になるかもな一冊でした。時間があったら応用編も読んでみたいと思います。
Posted by ブクログ
モデルのパートなど、入門書にしては難しく感じるところもありましたが、広く浅く、とりあえずデータ分析についてざっと知りたい人に向いていると思います。
データの解釈という点でもう少し踏み込んだ内容を期待していましたが、第3部で基本的なことに軽く触れていた程度でした。
Posted by ブクログ
データ分析の実務の際に気をつけなければいけない点が抑えられており、一通り実務をやったあとに読むとあるあるがよくまとまっているなあと感じさせられます。
他方で(そこが本丸でもないかと思いますが)統計学の教科書的な部分の記載は薄く、教科書は別で読み込んだ上での参考書としての位置づけとして使うのが適切な本かと思います。