あらすじ
2013年に刊行した「データサイエンティスト養成読本」の改訂版です。データサイエンティストを取り巻くソフトウェアや分析ツールは大きく変化していますが,必要とされる基本的なスキルに大きな変化はありません。本書は「データサイエンティスト」という職種について考察し,これから「データサイエンティスト」になるために必要なスキルセットを最新の内容にアップデートして解説します。
...続きを読む感情タグBEST3
Posted by ブクログ
極めて良書だった。特に「巻頭企画」部分の2章と3章は目から鱗だった。それ以外の箇所も内容が濃く読む価値のある本だと思った。もっと早く読むべきだったと後悔している。
RやPythonやSQLなどの初歩について書いてある章については、ひょっとしたら他の入門書と一緒に合わせて読んだほうがいいかもしれないが、こちらも価値ある情報が濃縮されていて素晴らしかった。
Posted by ブクログ
この本だけで何かができるようになる、というものではないが、データサイエンスの世界をツールベースで俯瞰できるのは良き。
この本から興味のある分野を見つけて深掘りするきっかけができれば万々歳かな。
個人的には、スキル的に中途半端なものが多かったので耳が痛い。。
Posted by ブクログ
理論寄りではなく実用寄り、詳細からではなく上辺から入って行きたい人にとって良書だと思う。
・回帰モデルや回帰分析は、性能評価の際に複数のパラメーターと結果の因果関係を突き止めるのに有用かもしれない。
・Rは散布図 (geom_point) に回帰直線 (geom_smooth) を引くことができる。
・RStudioとknitrを使うと、Jupyter Notebookと同等のことができる。以前作ったグラフをどのソースコードでコンパイルしたかを忘れてしまうという事態を防げる。
・Fluentd のBufferプラグインのfileプラグインは、ファイルシステム上にバッファを保存する。よって、データ損失の可能性が下がる。
・webスクレイピングの入門には、Pythonのurllib2が良さそう。
Posted by ブクログ
データサイエンスに必要なスキルをざっと確認できたのは良かったが、一つ一つの話題については浅くしか取り上げられていないので、個別に学ぶ必要がありそう