あらすじ
シリーズの第2弾は、初学者向けのKaggle入門書の決定版!
★「Kaggleで勝つ」準備をしよう!★
初学者が「Kaggleに何となく興味ある」状態から「実際のコンペに参加できる」状態になれるような内容を目指しました。
・サンプルコードの詳細な解説があるから、しっかり身につく!
・優勝チームと専業Kagglerのコンビによる、安定のわかりやすさ!
・充実の本音対談で、やさしくサポート!
・初学者や手探りでやっているが体系的な知識を得たい人に最適。
【本書のサポートページ】
https://github.com/upura/python-kaggle-start-book
【実践Data Scienceシリーズ】
https://www.kspub.co.jp/book/series/S069.html
【主な内容】
第1章 Kaggleを知る
1.1 Kaggleとは
1.2 Kaggleで用いる機械学習
1.3 Kaggleのアカウントの作成
1.4 Competitionsページの概要
1.5 環境構築不要な「Notebooks」の使い方
第2章 Titanicに取り組む
2.1 まずはsubmit! 順位表に載ってみよう
2.2 全体像を把握! submitまでの処理の流れを見てみよう
2.3 次の一手を見い出す! 探索的データ分析をしてみよう
2.4 ここで差がつく! 仮説に基づいて新しい特徴量を作ってみよう
2.5 勾配ブースティングが最強?! いろいろな機械学習アルゴリズムを使ってみよう
2.6 機械学習アルゴリズムのお気持ち?! ハイパーパラメータを調整してみよう
2.7 submitのその前に! 「Cross Validation」の大切さを知ろう
2.8 三人寄れば文殊の知恵! アンサンブルを体験しよう.
第3章 Titanicの先に行く
3.1 複数テーブルを扱う
3.2 画像データを扱う
3.3 テキストデータを扱う
第4章 さらなる学びのために
4.1 参加するコンペの選び方
4.2 初学者にお勧めの戦い方
4.3 分析環境の選択肢
4.4 お勧めの資料・文献・リンク
付録A サンプルコード詳細解説
A.1 第2章 Titanicに取り組む
A.2 第3章 Titanicの先に行く
感情タグBEST3
Posted by ブクログ
kaggleの取っ掛かりには最適な本だと思った。
kaggleとは何か、コンペ、discussion等kaggleにおける基礎知識が詰まっている。
実際に手を動かしてハンズオン形式で学べるのも魅力的。
概要の説明が終わると実際にいくつかのモデルを用いてKaggleのチュートリアル的存在のタイタニックの生死予測に取り組める。これもまたハンズオン形式なのでインプットしやすい。
scikit-learnやlightGBMのような Kaggleでしょっちゅう扱うライブラリを使って実装するので、今後コンペに参加する際に役立って行きそう。
Posted by ブクログ
Kaggle初挑戦の取っ掛かりにうってつけの本。
Titanicのソースコードが掲載されてるのでcontributerにはなれた。
次は推奨されていた「kaggleで勝つデータ分析の技術」を読むこととする。
ブロンズは程遠い。
Posted by ブクログ
Kaggle初心者の自分にはとても参考になった。サンプルコードも良かったが、引用されている資料や論文などがとても多くてどこから手をつけて良いのか分かってなかった自分にはとてもありがたかった。
Posted by ブクログ
取り急ぎさっと斜め読みした。最近kaggleを始めた自分にとってはとても参考になる内容。特に付録のコードを丁寧に確認したい。
今からKaggleを始める人はとりあえず買って手元に置いておくと良い本。
Posted by ブクログ
これからKaggleを始めようと思っている人必携の書!サンプルコードを詳細に解説されていて、進む毎に改善されていくのを実感でき、実際のコンペティションの流れをざっくり掴むことができます。
Posted by ブクログ
題名と内容が異なる本が多いけど本書は本当にKaggle入門に徹していて適切かつ分かりやすい本だった
ただ、もうちょっと刺激が欲しいなってことで1点減点