感情タグBEST3
わかりやすい辞書
タイトル通り前処理について網羅的に解説されてる参考書です。しかしプロがさらにその技術を高めるためというよりは初心者が基礎事項を固めるための本という感じなので、気軽に、ただし分量は多いのでそれだけは覚悟しつつ読めるって感じです。私は初心者ですが結構分かりやすかったです。
Posted by ブクログ
類書がぽろぽろ出てきたけど
安心の「ホクソエム」ブランド!
流行におもねらず本当に必要なことを正しい裏付けで明かしてくれる
ドヤ顔もせずに
早速1つ実務で使った
なんかさー1つの言語でゴリゴリ無理書きしようとするヒト多いよね
言語はそれぞれ得手不得手があるんだからさ
本書はこれはSQLでこれはRでPythonでって明示しているのも好感
Posted by ブクログ
知ってることも多かったけど、「実務ではこういうことがあるからこういう処理をしたほうがいい」的な実践的な話がちょいちょいあり、そういうところは役立った。
pythonの良い書き方とかも教えてくれているので役に立つ。
Posted by ブクログ
表紙からして、めっちゃ堅い本かと思ってたのに、ユーモアもあって読みやすかった。
SQLの行間が気になった。行間ない方が読み易いんじゃないかな?
Rについてはほぼ読んでない、、、SQLとPythonで十分だろ?と勝手に思ったので。
この場合はこうやった方がいいよ、でもここは注意してねっていう書き方がとてもよかった。
Awesomeって普段使いしてる人には会ったことないけれど、Awesome!って言いたくなった(笑)
通勤電車で読んでたけど、本が重かったなぁ
Posted by ブクログ
実用書である。
なにかと派手な話題が多いデータサイエンスの中で、地味だが大切な前処理を取り上げている。
しかもSQL,R,Pythonの主要なツールについて併記してあり大変助かった。
今までSQLについてまったく知らなかったがなかなか奥深い分野と思われる。
第1章 前処理とは
第2章 抽出
第3章 集約
SQLのWindow関数は大変役に立つ関数が多い
第4章 結合
JOIN句の説明がわかりやすかった
4-3過去データの結合、4-4全結合はとても役に立ちそう。
第5章 分割
第6章 生成
第7章 展開
長いこと縦持ち、横持ちのことがわからなかったがpythonのpivot_tableでわかるようになった
第8章 数値型
数値のカテゴリ化など使えそう
数値の補完にこんな手法があったのは知らなかった(多重代入法)
第9章 カテゴリ型
カテゴリ型は結構大切
第10章 日時型
SQLの実行にPostgreSQLを使っていたがこの章ではエラーがでてほとんど実行できなかった
データベースによっては方言が存在するのかな?
10-7 平日/休日への変換は役立ちそう
第11章 文字型
高度な内容だったので手がです
第12章 位置情報型
今回はデータとして緯度、経度が準備されていてそれを使うだけだったが
その位置情報そのものを集めてくるのが大変そう
まとめ
データはデータベースに置きSQLでデータを前さばきしながらPython/Rでデータ加工するのが
最強のセットかな?SQLのWindow関数をもっと知りたい。
Posted by ブクログ
前処理について体系的に書かれているが、SQL、R、Pythonと3種類の言語を取り上げて書かれているためか、広く浅いという印象。参考になった点も多くあったが個人的にはPythonに限定してあるとよいと思った。欠損処理、カテゴリ変数の数値化については理論的なところをもう少し深堀りしてもらうとよいと思う。