あらすじ
世の中には統計が氾濫している。「平均」とか「相関関係」とか言って数字やグラフを示されると、怪しい話も信じたくなる。しかし、統計数字やグラフは、必ずしも示されている通りのものではない。目に見える以上の意味がある場合もあるし、見かけより内容がないかもしれないのだ。統計が読み書きの能力と同じぐらい必要になっている現在、「統計でだまされない」ためには、まず「統計でだます方法」を知ることが必要だ!
...続きを読む感情タグBEST3
Posted by ブクログ
この本の挿絵が本当に好きである。統計的におかしなことを言っている記事をマイルドに皮肉っており、印象深い。統計の罠に騙されないことは、統計的にデータを扱う人間にとっては必須の条件である。おすすめ。
Posted by ブクログ
ずっと昔に読んだんだけど,なぜか,今頃,上位の売り上げらしい。不思議。
というわけで,以前の感想を転載しておくことにする。なんと,1998年の時にサークルに提出したもの。
「グラフ化するときには,よほど注意をしないとウソの情報・極端な情報を伝えてしまうことがある」-ということは,仮説実験授業研究会の仲間でもよく話題になってきました。
そこで,自分なりの方法で「グラフを書き直す」ということは,いろいろな情報を読みとったり,未来を予想したりするときには大切です。実際,自分らで書き直した独特のグラフが,『たのしい授業』紙上でも毎月紹介されていますよね。わかりやすいグラフが書かれていて,いつも感心します。
さて,今回,ご紹介する本は『統計でウソをつく方-数式を使わない統計学入門』(講談社ブルーバックス)という本です。この本は,題名にもあるように「ウソをつく方法」を教えながら,「一方的な統計結果にだまされない方法」を学ぶように論が進められています。
「だまされないために勉強するのだ」というのがボクの持論(板倉さんからの受け売り)ですが,この本は,まさにそれにうってつけの本なのです。
ここでは,永六輔「無名人語録」風に,本のエキスを紹介しようと思います。
■ サンプリングをしたときに,それが元のデータ(全体)のサンプルとして偏りがないかを確認しなければ,そのサンプリングによるデータは,意味がない。
■ アンケートをした場合,回答者が本当のことを言うとは限らない。たとえば,「主に読んでいる本」を調査しようと思ったら,「何を読んでいますか」と質問などするより「訪問して,古雑誌を買いたい」と言った方が,ずっと多くのことがわかるということ。ただし,これでも本当のことはわからない。これでわかるのは,読んでいる本ではなく買った本であるからだ。ナルホド。
■ サンプリング調査の結果が,もとになるサンプリングより正しくないことも事実なのであるが,データが何回も統計的操作で濾過され,小数点のついた平均値に姿を変える頃には,その結果はもとのデータとは似ても似つかないような確信の臭気を身につけ始めるのである。
■ サンプルの基礎は「ランダム」という性質がなければならない。つまり,サンプルは「母集団」からまったく偶然に選ばなければならない。ランダム・サンプルであるかどうかの判定は次のようになされる。「母集団の中のすべての人あるいはものは,等しくサンプルに選ばれるチャンスがあるか?」
■ よっぽどのお人好しか楽天家でもないかぎり,経験から考えても,ある社のねり歯磨きが他社のより断然よいことなどありっこないのである。
■ その最高の切り札は不十分な-時計的に不十分なサンプルである。つまりこれがA会社の目的には都合がよいのだ。小さい活字を読めばわかるが,この場合のテスト・グループはたった12人からなっていたのである。
■ 遅かれ早かれ,偶然のおかげで,大見出しや大がかりなキャンペーンをする値打ちのあるほどよい結果が出てくるに違いない。こんな結果は,A社のを使おうが,ふくらし粉を使おうが,今までのと同じ歯磨き粉を使っていようが起こってくるだろう。
■ さて,少人数のグループを使うことが意味があるのはこうだからだ。つまり,大きなグループを使ったのでは,偶然による差がどうしても小さくなってしまうし,それでは,大見出しが使えるような結果はえられないからである。
■ 試行回数が十分に多い場合に限って,平均の法則は説明や予測の役に立つのだ。
■ 何も知らないことの方が,不正確なことを知っているより健全である場合が多いのであって,少しばかり勉強するというのは,かえって危険なことなのかもしれない。
■ 常識というものは,もっともらしく正確で,厳然としている3.6などという数字の前では,どうも弱いのであって,この場合は,調査から誰にもわかるようなこと,すなわち,多くの家庭は小家族で,大家族はほんのわずかであるという事実も常識にはかなわなかったのである。
■ 誤りが起こるのは,結果が研究者から煽動的あるいは情報不足の記者を通して読者に届くまでの情報の濾過過程にある。そして読者というものは,その過程で姿を消してしまった数字には気がつかないのである。誤解の多くは,「標準」や平均に分布幅についての注があれば避けることができる。
■ プラス・マイナスの誤差ということは,いつも心にとめておかなければならないことで,誤差が書いてないときでも,あるいは書いてなければなおさらのこと,注意しなければいけない。ときには,数学的には実在し,しかも証明できても,現実には意味がないほど小さい差をめぐって,大騒ぎされることがある。-要するに「目くそ鼻くそを笑う」である。
■ グラフの目盛りを拡大してみせるものに対して曰く-これは「国民所得10%の増加」というのを「…10%の飛躍的伸び」とする編集方法と同じようなものである。しかし,それより断然効果的である。なぜならグラフには形容詞や副詞がないので,客観性という幻影がこわされることがないからである。ここには誰からも,突っつかれるようなものは何もないのである。
■ 米海軍の死亡率はニューヨーク市民より低いということについて曰く-この2つの死亡率はそもそも,比較できるようなものではないのである。というのは,海軍は大部分が太鼓判つの健康な青年たちから成っているのに,ニューヨーク市民の中には,赤ん坊もいれば,年寄りや病人もいるのであって,どこにいようと当然死亡率は高いのである。
■ 使用前使用後の写真について曰く-きれいになったのはむしろ写真家の腕による。
■ 50%の賃金引き下げを相殺するためには,100%の賃上げを獲得しなければならないのである。
■ 実際は,もしこの本を出版する費用の項目がどれも,それぞれ10%前後上昇しているとしたら,その総費用もまた,同じ率だけ上がっているのでなければおかしい。(中略)これは,ウサギの肉ダンゴをどうしてこんなに安く売れるんですかとたずねられた例の商人の話によく似ている。その商人の答えは,「そうですねえ。馬肉もいれているんですよ。しかし,五分五分に混ぜているんです。つまり,馬1頭に,ウサギ1匹です。」
■ 1952年に,カリフォルニアのセントラル・バレーで報告された脳炎患者は,最悪といわれたその前年の3倍にも達した。びっくりした住民たちは,子供を別の土地に疎開させた。ところが,実際に患者を数えてみると,その嗜眠性脳炎による死亡はたいしてふえていなかったのであった。そして,ことのおこりというのはこうだったのである。長年の懸案と取り組むために,州と連邦保険局の役人たちが大勢動員された。その努力の結果,以前なら見過ごされ,おそらくその病気と認められないような軽い症状のものまでたくさん記録されたのである。
■ つまり現在までのトレンドは事実であるかもしれないが,将来にわたるトレンドは推測以外の何物でもないのである。そして,そこには「他のすべてのことは変わっていず」,また「現在までのトレンドが継続する」ということが暗黙のうちに認められているのである。しかるに,他のすべてのことはというのは,とかく変わりがちであるし,また,それでなければ人生は退屈至極なものとなってしまうであろう。
▼
いかがですか。おもしろそうな本でしょ。初版が1968年で,ボクのは1998年で,なんと60刷です。今まで,この本がボクのアンテナに引っかからなかったことがすごく不思議です。だって,ブルーバックスも40冊以上も持っていますからねえ。
● 気をつけたいこと
ボクは,原発に関する本もよく読みます。賛成派の本(ほとんどが学校に来る無料の資料)の中にも,反対派の本の中にも様々な統計資料やグラフが提示されています。そのグラフや統計の資料の一つ一つは,ウソなどついていないかも知れません。しかし,要注意です。ボクは賛成派にも反対派にもだまされたくはありません。自分たちの陣営にとって都合のいいような「解釈」やグラフの拡大。あるいは,意識したすり替えなどをしているとも限りません。
今は情報化時代と言われています。なるほどインターネットでも,簡単にいろいろな情報が手に入ります(しかし,これらネット上の情報は,30年前にダレル・ハフが書いたような「ウソ」に(情報発信者にとって,意識的にしろ無意識的にしろ)満ちていることを忘れてはなりません。情報を自分で選ぶ時代だからこそ,なおさら,それにだまされないことが大切になります。このあたりの教育・授業も大切だなあと思います。『社会を見直すメガネ』(国土社)に示されている「量率グラフ」が,まずはその手始めかな?
Posted by ブクログ
大学の研究室で読んだ本。久しぶりに読み返した。
50年近く前の本で、開いて1ページ目に100年前の統計データが出てくる(笑)が、その時を超えても語り継がれる名著。
難しい数式なしに、統計・データに騙されない知識が身につく。特に文系・経済系の人にお勧めしたい。
Posted by ブクログ
統計学に関する古典的名著。
心理学を学びはじめて7年目にしてようやく読んだ。
初版が1968年で、現在まで版を重ねつづけているというのがすごい。
「クリティカルシンキング」についての本を何冊か読んだことがあるので、書かれている内容にそれほど発見はなかったが、刊行当時ダレル・ハフの洞察はさぞ多くの人を驚かせたことだろう。
そのサンプルは全体を代表しているか?
人はウソをいうものである(相手をよろこばせるような答えをしたいという欲求があるから)
どういった種類の平均値か(算術平均、中央値、最頻値、幾何平均など)?
グラフの伸びを何倍にも見せる方法
BがAに続いて起こるなら、AはBの原因であるとする誤謬(相関関係だけでは、どれが原因でどれが結果であるかまではわからない)
あまりにも正確すぎる数字は、常識とは食い違っている
など、何らかの調査の結果を読むときに常に考えておかなければならないことがたくさん書かれている。
古くさい例やイラストも味があってよし。
Posted by ブクログ
古い本である(1968年出版)のと文章が読みづらい(原著の言葉使いに癖があるのと訳が拙いのが原因らしい)のとで、ちょっとてこずった。
この本で語られている統計のウソやごまかしはさすがに今では知られた手法だけれど、かといって今使われていないとはけっしていえない。素人がだまされないようにするのは難しいけれど、疑ってみるぐらいはした方がいいなと思った。
Posted by ブクログ
「科学をあなたのポケットに」でお馴染みの講談社ブルーバックスの本。
本書は古い、原著が1954年に出版され邦訳版が1968年、手元の本で2016年の94刷、どこの書店でもブルーバックスのコーナーの一番左端にあるような気がする。
本のタイトル通り統計に関する基本的な考え方、サンプルの偏りや、「平均」に含まれる作為的な意味、定義の変更、図表の表現方法がもたらす印象など。様々な統計を操縦する方法について、そのよくある手法をわかりやすく説明している。
ただ、例が基本的に古い。第二次世界大戦前後のアメリカの話が主で、それはそれで面白いけども。
それと、挿入されるグラフや絵に味があってそれも良い。
Posted by ブクログ
結局統計って、「なぜそのデータになったか」について人間が後から意味付けしたものでしかなくって、相関関係はあるが因果関係は分かりません、以上のことが言えないのでは…と言う個人的結論に帰結してしまった…
気温が高いとエアコンが売れる、そこに相関関係は確実に「ある」が、エアコンが売れたから気温が高くなったのか?気温が高くなったからエアコンが売れたのか?そこにはデータだけではわからない、人間の恣意的な理解と認知が入り込む余裕(隙)があるように思う。
騙されない方法は分かった!けど、統計をどう使えば「正しい利用方法」なのか?はまた別の本を読んだ方が良さそうである!
Posted by ブクログ
フザケた書名に反して中身はかなり実践的な統計本。しかも正規分布のグラフすら出てこないビギナー仕様。
統計学は「非常にそれっぽいウソの答え」をしれっと提供してくる、狡猾な詐欺師のような学問である。実際データ集計をやったことがある人なら、自分で自分の統計データに騙された経験があるだろう。本書はそんな統計の勘どころを見事に分かりやすく抑えており、数学ワケワカラン層からデータ解析の専門家まで、様々な人が読むべき本になっている。
データを数式に放り込めば、実にそれっぽい数値が出てくる。ただその数値が何を意味するのか判断するのは人間だし、データ自体が自分の意図に沿ってい無いかもしれない。統計と向き合うときは常にその事を頭に入れておかないといけない。
Posted by ブクログ
デジタル化が進み、SNSを中心にデータが錯綜する今だからこそ読むべき一冊。「統計」「数字」という信憑性が高いと思ってしまうものの「ウソ」を突く。
サンプルの偏りだったり、平均の罠だったり、因果と相関の偽りであったり。ファクトチェックや法整備も進み、さすがにここまで顕著の例は公けには減少しているが(しかし60年経った今も見かける事例がチラホラ)、クローズドな場面ではよく見かける話が多く、一旦立ち止まって疑う姿勢は改めて勉強になる。
AIの発展でフェイクニュースが巧妙化し、人間がウソを見抜くことはさらに難しくなっているが、情報化社会の素養として読んでおきたい一冊。
Posted by ブクログ
読みやすかったが、ところどころ文脈が省略されているように見えて行間を読むのが大変だった。おそらく私の頭が悪くて間をつなぐことができなかった。約100年前のアメリカの例が多く、時間も文化も隔てた私には逆によくその例で困惑したところも多かった。しかし、幅広く統計を批判的に読む機会を実例を交えて伝えており異文化理解として面白いとも思った。
Posted by ブクログ
この世の中にはおかしな統計が溢れている。ネット広告でポップアップされる美容商品の満足度の円グラフ。やたらと誇張された予備校の合格実績の棒グラフ。では、そのトラップにいかに騙されないかという視点が大切だと実感した。本書では、70年ほど前の話ではあるが、現代にもよく通ずる騙されないための技術が掲載されており、タメになった。
Posted by ブクログ
人類に統計を使いこなせる日は来るのか?
自身の考えを,あたかも統計を適切使いつつ客観的に見せかけるワザを紹介した本.目盛りを誤魔化したり,縦横比を変えて,グラフの変化の印象を操作したり,割合と絶対的な変動を誤魔化したり,算術平均と中央値を使い分けたり,無作為に生じた値で都合のよいものを選んだり,実は証拠になってないことを示したり,相関を因果と偽ったりとかである.
データ分析を学んだ人なら,そこかしこで毎日のように目にするいつもの手口だなと思うだろう.しかしながら,この原著は1954年に発刊されたもので,その当時に行われていた手口が70年たった現在でも現役で使われていることが驚きである.およそ人は信じたいことを望んで信じてしまうと言われてから数千年もたっているように,自身の信じることをデータに否定されても,それを受け入れるというのはいかに難しいということなのだろう.統計という道具を使いこなせる日は人類に来るのだろうか?
Posted by ブクログ
完全文系人間だけど楽しめた、と書くと語弊があるかもしれない
〇〇入門書系は「文系だけど…理系だけど…」という宣伝文句が付きがちだが、この本はそういったことは何も関係なく、ただ統計学の面白さを知ることができる
何十年も前の本なのに、その中で紹介されている統計を使った小賢しい術は変わっていないことが可笑しい
Posted by ブクログ
統計を学ぶ、扱うなら必読定番とされているが
わかりやすい解説書が多数出回るようになったので、事例も古い本書は役割を終えたか
読む価値はあると思うけど
Posted by ブクログ
統計学的な考え方の入門書。
サンプリングの章がよかったな。
統計データはうそをつくこともある、ではなく、
よほど対策をしないかぎり、うそをついていることが前提
くらいでデータをみた方が良いんだろうな。
調査方法は当然、調査主体が誰かにも
影響を受けるのは案外盲点。
Posted by ブクログ
数式を使わないで統計学の話題を解説。よくその数字の出所を考えないとだまされる。だますつもりがなくても間違えた結果を表す。う〜む、難しいものだ。それがよく分かったけど、統計数字にだまされないようにするのはなかなかタフだな。
Posted by ブクログ
これを読むと、いかに身の回りでデータに騙されている事がわかる。逆にきちんと正確なデータで説明しないといけない事もわかる。
サンプルの片寄、平均の母数の取り方、少なすぎるサンプル、小さな差を大きくとらえる、グラフの書き方、数字のこじつけ、直接関係のない因果関係、などで「ウソをつける」
ウソを見破るには、データの出典、調査方法、足りないデータ、問題のすり替え、おかしさが無いか、をチェックする。
Posted by ブクログ
1968年第1刷発行。
2020年第102刷発行。
50年以上売れ続けていることもスゴイし、102刷もスゴイ。
統計というか数字による制度に大きな疑問符を植え付けられたのは、3.11を契機として放射線量の基準値が変更されたこと。「夏の冷房の設定温度は28度推奨」ほどいい加減なものではないが、国際基準よりもかなり厳しいものだったという言い訳でカンタンにすげ替えることができるものだったと知って衝撃を受けた。国の基準とやらは、さじ加減が可能だということである。
昨今は、主にグラフィカルなメディアがグラフで嘘を吐くことで知られている。TVも新聞も見ないからこそふと目にしてしまったグラフに騙されたりするかもしれない。そういうのは嫌だ。
さて、理系なのに統計を学んだ記憶がない。うろ覚えなのだが、微分・積分と統計が選択だったような記憶があるようなないような。微分・積分は授業を受けた記憶がある。
ともあれ、統計についてゆるく学ぶことにした。
ちょっと学んだ感想は、手法に隙がありすぎるというもので、人文系の騙す気まんまんなアレコレと似すぎているということ。有意水準の5%とか、先に述べた人が決めた基準というやつに直撃する。科学的な感じではない。
土台が危うい。
本書については、終盤、書くのに飽きたという印象がある。あとはよろしくやってくれという著者の投げ気の声が聞こえてきそうな。
妖精を見るには、妖精の目がいる。著者の主張は、騙されないようにするためには、騙す手法を知る必要があるというもの。それに偽りはない。一読の価値はある。
Posted by ブクログ
かなり昔の本(翻訳本が1968年発刊)なので、内容は今ではよく知られた内容かなと思います。いや、まあ、いまだに、相関と因果関係をごっちゃにしていたり、平均値に印象操作されている人はたくさんいるとは思いますが。
この本では、1960年代のアメリカで、いかに誤解を誘う統計の使い方が蔓延していたか、たくさんの例を挙げて紹介してくれていて、当時のアメリカ人はそこも楽しめたんだろうなぁと思います。書きっぷりからすると、かなり有名な企業や新聞が、ウソといっても過言ではない統計データをもとに、好き勝手な事言ってたみたいです…が、今を生きる日本人の私には、あまりピンと来ないのが、ちょっと残念なところです。
Posted by ブクログ
統計のもっともらしさへの注意喚起。
初版が1968年で、未だにこの本が現役であることに驚く。
もっともらしいデータがでてきたら、まず疑おう。
そんなことはたぶんみなわかっているのだろう、ただ人は騙されたいのだ。考えたくないから。
……と思ってしまう。
Posted by ブクログ
世の中に出回る統計やグラフに騙されないようにするための本。この本を読んで、グラフで人を騙そうなどという邪な考えを持ってはならない。正直かなり古い本なので文体も古く事例も分からないものが多く(アメリカの昔話…)なかなか読むのには苦労する。似たようなコンセプトでもっと新しい本にあたってみてもよいかもしれない。
Posted by ブクログ
そもそも提示された数字やグラフに疑問を持てる程度にその分野に精通していないと気づけないようなウソについて書いてあるか、まあそうでしょうなと思う当たり前の例しかなかった。
そういう考え方もあるのか!と感動するような本ではなかったのは残念。
Posted by ブクログ
統計の読み方に関するイロハのイにあたる一冊である。
初版が今から50年前ということもあり、さすがに今の時代にはそぐわない内容の例なんかもあったりするんだけど、基本的な考え方は実はあんまり変わっていないというのが率直な印象だ。
本書で挙げられている事例に関していえば、ニューヨーク州とニューヨーク市の話以外はすぐにツッコミを入れることができたので、まあ私個人としてはそこまで刺激を受ける内容の本ではなかったかなというところはある。
とはいえ、本書に出てきたキーワードの中で普段いちばん目にする機会があるのはたぶん「平均値」だと思うんだけど、例えば「平均値」と「中央値」の違い、使い分け方、注意点等をぱっと説明できる人は案外少ないのではないだろうか。
そういう意味では、特に数字に苦手意識がある人ほど読んでおいたほうがいいように思う。
結局、ニュース等で流れてくる統計情報の解説を全面的に信頼したりはせず、疑いの目を向けること、常日頃からツッコミを入れる訓練をしておくことが大切なのだということを再認識させられた一冊だった。
それにしてもこの2年ほど(※2022年時点)、新型コロナに関する様々な統計情報やグラフをニュース等で目にする機会があったが、本書を読みながらそれらを見返してみるのもある種の訓練になっていいかもしれない。歪められた統計情報がそのまま垂れ流されたケースも相当数あったように思うから。
Posted by ブクログ
以前興味を持ったのだが、今回書店で発見し読んでみた。
出たのがかなり前なので、事例の古さは否めない。それでも、イラストでの表現やグラフの見せ方など今でも十分に通用しそうなテクニックが豊富で、ずっと読まれているのも分かる気がした。
統計は分かれば便利だが、データを見るときなどここに出ているようなところは気をつけないといけないと、感じた。
Posted by ブクログ
1968年の初版から既に100刷を超えようとする名著です。
統計自体に罪はないが、それを意図的に操作する連中には気をつけろといった内容です。それにしても、本書で語られるように統計ほど簡単に人をだませるツールはないし、大手のマスコミや権威ある機関でさえも平気で(気づかず?)嘘をつくので気が抜けません。しかし、そもそも統計が使われる目的を理解できれば、だましの構造がビルトインされている宿命にあるのもうなづけます。その動機とは、物事をよく見せるためにコピーライターが、「薄っぺらで安っぽい」商品を「軽くて経済的」と書くのと同じです。
では、統計のウソを見破るためには?筆者によれば5つのカギがあります。統計の出所、調査方法、隠されたデータの有無、問題のすり替え、意味があるのか?といった点に着目することです。これは、報道のウソを見破る際にも使えそうです。
本書で使われる事例も、当時実際に使われていたものなので、時代を反映していて興味深い。統計の入門書としては一級品です。
本書PR:
だまされないためには、だます方法を知ることだ!
かの有名な英国の政治家ディズレーリは言った――ウソには3種類ある。ウソ、みえすいたウソ、そして統計だ――と。確かに私たちが見たり聞いたり読んだりするものに統計が氾濫しているし、「平均」とか「相関関係」とか「トレンド」とか言って数字を見せられ、グラフを示されると、怪しい話も信じたくなる。しかし、統計数字やグラフは、必ずしも示されている通りのものではない。目に見える以上の意味がある場合もあるし、見かけより内容がないかもしれないのである。私たちにとって、統計が読み書きの能力と同じぐらい必要になっている現在、「統計でだまされない」ためには、まず「統計でだます方法」を本書によって知ることが必要なのである!
Posted by ブクログ
語り口の軽妙な、専門化による入門書。統計数値は人をだましたり、ごまかすために利用されてるよ、と言うことに気づかせてくれます。新型コロナ感染が拡がってから、新聞にも多くの統計数値が掲載されるようになったがいったどれだけに人がその意味を正確に理解しているのか。初歩的なことでも正確に理解しなければならないと思わされる。
原著の出版が1954年というものすごく古い本であることに読んでみてから気づいた。出てくる(アメリカの)例や価格などに古さを感じるけど、その内容には古さを感じない。この本で紹介されるのは平均値だとか中央値だとかかなり初歩的な内容のみで、現代人がタイトルから期待するような内容はあまりなく、教養のあるそこその大人ななら既知であることも多いとは思う。でも、こんな簡単なことで結構騙されてしまいそうだな、という例も多い。平均値と中央値なんてのは正確に理解しておきたいところ。
Posted by ブクログ
1968年発行とのことで、今でも読まれていることに驚き。出てくる例えも今とは感覚が違っていて趣深い。しかしながら、統計と直感のズレを補正するための基礎的な知識が確認できる歴史的良著には違いありません