あらすじ
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
ビッグデータ時代のSQL活用術・レシピ集
本書は、著者が普段の業務で実際に作成しているレポートやSQLのコードをより汎用化し、レシピ集としてまとめたものです。
「データの加工」「売上の把握」「ユーザーの把握」「Webサイト内のユーザー行動の把握」「異常値の検出」「検索機能の評価」「レコメンド」など、具体的なシーン別に、実践的な手法とノウハウを解説しています。
●読者対象
本書では、アクセス解析等を担当する社内の分析担当者と、実装を行うエンジニアの双方を対象として、下記の情報を提示します。
・データ加工の手法
・分析に使用するSQL
・レポーティング・分析の手法
分析担当者であれば、アクセス解析ツールが提供する指標やフィルタがなくても、それ以上のことを自らで実践できるようになること、エンジニアであれば、分析業務を十分に理解して、分析担当者や経営層に対して、適切な情報提供やレポート提出、そして助言できるようになることを、目指しています。
●構成
1 ビッグデータ時代に求められる分析力とは
2 本書で扱うツールとデータ群
3 データ加工のためのSQL
4 売上を把握するためのデータ抽出
5 ユーザーを把握するためのデータ抽出
6 Webサイトでの行動を把握するためのデータ抽出
7 データ活用の精度を高めるための分析術
8 データを武器にするための分析術
9 知識に留めず行動を起こす
Chapter1~2は導入部で、Chapter1は基本を解説し、Chapter2で本書で扱うデータやミドルウェアについて説明しています。
Chapter3~8では、具体的なSQLを用いたコード例とともに、ビッグデータ活用の手法について紹介します。
Chapter3では基礎的なSQLの記述やデータ加工の手法について解説し、続くChapter4~8でデータ活用における具体的なシーン別に実践的な「分析手法」と「SQL」を解説しています。
Chapter9ではまとめとして、本書の提供する内容が知識で留まらないよう、データの活用の事例やヒントを紹介します。
●本書で扱うミドルウェア
PostgreSQL、Apache Hive、Amazon Redshift、Google BigQuery、SparkSQLで動作確認を行っています。
感情タグBEST3
素晴らしい
基礎及び応用が効く素晴らしい作品だと思う。
実務にもしっかり使えて非常に実用的で
満遍なく覚えればSQLマスターになれると思う。
Posted by ブクログ
Chap1 ビックデータ時代に求められる分析力とは
Chap2 本書で扱うツールとデータ群
ほぼ有名どころのDBはすべて押さえてある。
PostgreSQLとSparkSQLがあるのがありがたい。
Chap3 データ加工のためのSQL
この辺は基本的なデータ処理でよくまとまっていて業務に生かせそうな感じでした。3-2-6 IPアドレスを扱うでPostgreSQLにはこんな機能まであるのは驚きでした。
Chap4 売上を把握するためのデータ抽出
時系列データの扱いは頻発するので助かる。
Chap5 ユーザーを把握するためのデータ抽出
Chap6 Webサイトでの行動を把握するためのデータ抽出
Chap7 データ活用の精度を高めるための分析術
コードの長さが大変であるがDBでここまでできるとは思わなかった。処理するデータ量が多すぎて他のストレージに移動させることも1時間以上かかることもあるのでDB内で全てできるのは非常にありがたい。
Posted by ブクログ
SQLでここまでできるんだなという感想。
普段ほとんどMySQLを使っているので、ウィンドウ関数には縁がなかった。
集計はSQLの結果を何らかのプログラム言語で処理するものだと考えていたけど、SQLをもっと活用するのも面白いかもしれない。
Posted by ブクログ
webサイトのアクセスログ解析やマーケティングの分析手法を取り上げてながら実際のSQLまで落とし込む方法が書かれていたり、レコメンドなどのプロダクト開発に関連するSQLもあり幅広い事例とセットでSQLが書かれているのが良かった。
一方でSQLは自分で考えて自分で書かないと本当の意味で理解できないと思うので、この本を読んだだけで実践で使えるスキルが身につくというよりはこの本で知識をインプットして、実際に自分でSQLを書いて手を動かしなが学んでいくのが理想的かなと感じた。