あらすじ
ビッグデータ、という単語を聞いたことのある人は多いかもしれない。しかし、これによっていったい何ができたり、どんなことがわかったりするのかを知らない人は、まだまだ多いのではないか?私たちが本書で示していくことは、ビッグデータが、これからのビジネスを考えるうえで、また、あなたの生活をより快適なものにするために、こんなにも役に立つのか、という驚きと発見である。今後は、すべての産業が「データ×AI化」していく。ネットとリアルは別個の世界であるどころか、切り離しえないものであり、今後ますますその連関が密接なものとなっていくことは間違いない。このような時代に生きる人々にとって、変革のカギとなるデータについての皮膚感覚的な理解が欠如していることは、致命的と言わざるを得ない。データを正しく理解する力(=データ・リテラシー)は、リアルな現実世界を生きていくうえで、もはや「常識」として身に着けておくべき必須のツールとなる。データを分析し、意思決定に役立てていく「データ・ドリブン」の思考力、分析力、情報科学の基本、データの力を解き放つ力――これらをしっかりと会得し、応用できる人だけが、これからの社会を生き抜いていけるのだ。さあ、私たちが分析した以下の新事実を読んで、データの魅力と無限の可能性を体感してみよう!第1部 ビッグデータは、「深層」を描き出す1―1 新社会人は4月に「モットーとは」、5月に「新入社員 辞めたい」、6月に「恋活」と検索する1―2 ママは、生後102日目にわが子をモデルへ応募したくなる1―3 「頭が痛い日本人」が最も多い時刻は、17時である1―4 矢沢永吉と郷ひろみは、双子レベルの「そっくりさん」1―5 日本は、「東京」と「それ以外」の2つの国からできている幕間劇1―6 音楽CDが売れる時、サバの漁獲量が増える――擬似相関とは何か?第2部 ビッグデータは、こんなに役立つ2―1 これからの「混雑ぶり」がわかり、移動のストレスが消える2―2 救援活動をスムーズに進める、「隠れ避難所」を探せ!2―3 リニアで日本はどれだけ狭くなるのかを、実際に見てみよう2―4 政治への関心が薄い日本人の注目を一挙に集めた、「令和」発表の瞬間2―5 検索量を分析すると、選挙の議席数予測は96%も的中する2―6 今の景気を予測することは、どこまで可能か?膨大なデータは見えてこそ、意味を持つ。明快にわかる、オールカラー図解版!
...続きを読む感情タグBEST3
Posted by ブクログ
これは面白い!データ活用だけでなく、その見せ方が最高です。
歌手の近似度合い、東京からの時間別データはわかりやすいです。さすが、石油の代わりの資源と扱われるデータです。
Posted by ブクログ
ビッグデータとは何か、同活用するものなのかなどについてヤフーの検索(TwitterやFacebookなどSNSのデータももちろん活用)を活用する例を実践の場で紹介したもの。
おもしろい分析例ばかり、実際には高度な学問知識を求められるものだけど、それらを持ち合わせない読者にも十分理解と面白さを提供してくれる内容。
リニア新幹線がどれだけ日本を狭くするかを分析した章はとくに面白く感じた。(選挙の当選分析などについては既に報道で知っている)
Posted by ブクログ
移動時間を利用して読ませていただきました。
ヤフーさんの持つ国内で有数の圧倒的なデータを素材にして紡ぎ出した数々の新たな発見を12本のレポートの形で紹介されています。
新書らしく、その筋の方以外の読者にとっても理解が容易となるようにわかりやすく書かれている印象を受けました。
分析の対象となる素材の一つにSNSのデータがありますが、これらはまさに各個人の思いや気持ちを表現しているものであると言えるでしょう。
まさに、「情報」の「情」の文字に心を意味する りっしんべん が用いられていることを再認識した次第です。
付箋は15枚付きました。
Posted by ブクログ
データを解析し、読み取る事の面白さがヒシヒシと伝わる。ただ、インターネットエンジンの頻出検索ワードの月別分析なんかを見ていると、結局、人間の行動は季節性や社会性、文化圏の中で、似たり寄ったりの関心に基づく事が分かる。データは集団の傾向を示すが、個々のサンプルとなると、実はそう変わらない。自分が必要な事は、他人も必要。自分が感じる事は、他人も感じる。
この画一性や平均的なモデルを再確認する事も面白いなと思うし、あるいはサンプル数が少ないユニークな存在をデータは見落とすという事も興味深い。こうした群衆心理を見抜くのがビッグデータの一機能だとすれば、データに操られる事はなくとも、社会制度や同調圧力に操作された群衆をデータで把握する事はできるのだろう。恐ろしい社会実験の可能性を秘めたもの、という気もする。
形態素解析、スプリアス・コリレーションと呼ばれる擬似相関などの専門用語も勉強になった。まさにサバの漁獲量とCDの流通量が擬似相関と言うのは、笑える。しかし、果たしてこれが擬似と断定できるのか、データを深読みできる力も必要だ。
Posted by ブクログ
取得したデータの解釈と見せ方について、勉強になり、データ分析の面白さを感じられる内容だった。
一方、Yahooにいるからこそできる話で、ここまでのデータを持たない企業で働く身として、実践的に役立つ内容では無かった。
Posted by ブクログ
ビッグデータという言葉のみが先行し、中身を理解していなかった自分としてはとっかかりやすい内容であった。
共起や疑似相関など、専門用語をなんとなく理解できたこともよかったが、何より分析アプローチの引き出しを増やせたことが何より有益であった
Posted by ブクログ
▼データについて
■データを使うことで次が可能に
「主観→客観に
「関心や感情を可視化
■しかし、データは万能ではない
■因果→相関ありだが逆は成り立たない場合も
■データをいかに分析/解釈するかの局面で結局人間が必要
Posted by ブクログ
flierで取り上げられていたのを見て購入。
言葉としてはよく聞くようになったが、実際どのように利用されているのか様々な事例が紹介されており、大変面白くためになった。
一方で疑似相関やデータを鵜呑みにする事への警鐘もあり、やはり専門的に扱っている方は特性をちゃんと認識した上で使っているのだと感じた。
Posted by ブクログ
それなりに面白いネタはある。ただ偽相関であればあるほど、人を面白がらせる効果があるのが気持ち悪い。また、理系であれば、相関係数Rでなく、決定係数R自乗を、数値としては意識するはず。Rだと「結構相関しているね」と「勘違いしやすい」のだ。
Posted by ブクログ
おもしろデータトピックの本。ビッグデータ分析の技術的な難しいことはさておき、どんなアウトプットが得られるかのわかりやすい事例集。紹介されているトピックは
・新入社員は、4月にお作法、5月に辞めたい、6月に恋活を検索する
・日本人が最も疲れているのは17時
・日本を東京と東京以外に分けて、東京駅までの所要時間日本地図をつくる
・一人称表現による分類。あたしあなた系のaikoとか
・乗換検索件数から渋滞混雑予測
・災害時の隠れ避難所
Posted by ブクログ
Yahooで検索ってまだ一般的なのかな…。
マップといい、正直データの集まり方としてはGoogleに負けてるのでは、という気もしてるけど、こういった形で集めたデータをどう使ってるのか見せてくれると親しみが湧きやすいよね。
なんかこう不気味な感じがするビッグデータ収集だから、こういうライトな読み物はありがたい。
コロナ前の本だからコロナ禍での活躍ぶりも読んでみたい。
それにしてもYahooの社員の煌びやかなことよ。
本書いてる人は教授だって!
Posted by ブクログ
可もなく不可もなし。単なる事例集。ある意味、自分も軽い読み物として手にとったのだが、分析方法や結果には関心はなく、むしろどのような入力情報を対象とするのかという興味を持って読んでみた。
だが、案の定、話のほとんどが検索ワードを入力情報としており、読みすすめる度に「またか」と途中から辟易してくる。
しかも、検索ワードありきなので、検索ワードの使用についてもう少し踏み込んだ議論をするべきではないか。そのような議論が薄いまま、分析結果を見せられても、「へぇ」とか「ふーん」ぐらいしか言えない。手持ちのデータで遊んでみた、というレベル。
また、ネットとリアルは切り離せないと言っているが、ネットも偏っているので、過信は禁物でしょう。
Posted by ブクログ
どんなふうに、ビッグデータを料理ができるのか、を一旦いろいろ並べてみました系。乳児育児の時系列データとか、母乳と哺乳瓶の共起関係のワード分析による悩み抽出は面白かった。
Posted by ブクログ
yahoo!はこんなにも壮大なデータを扱えるのか!
ということと、yahoo!で働く優秀な人たちからデータ大好き!が伝わってくる本。
ビッグデータが少し身近に感じられる
Posted by ブクログ
新社会人の検索ワードがわかりやすくて面白かった。音楽CDとサバの漁獲量、、擬似相関。
リニアによる移動時間の色分けも興味深かった。
こんな風に我々のデータが収集され、いろんな仮説をもとに誘導広告やニュースが並べられてるという前提で、ネットに接しないといけないと再認識。
タダほど高いものはない。