【感想・ネタバレ】実践Data Scienceシリーズ PythonではじめるKaggleスタートブックのレビュー

あらすじ

シリーズの第2弾は、初学者向けのKaggle入門書の決定版!

★「Kaggleで勝つ」準備をしよう!★
初学者が「Kaggleに何となく興味ある」状態から「実際のコンペに参加できる」状態になれるような内容を目指しました。

・サンプルコードの詳細な解説があるから、しっかり身につく!
・優勝チームと専業Kagglerのコンビによる、安定のわかりやすさ!
・充実の本音対談で、やさしくサポート!
・初学者や手探りでやっているが体系的な知識を得たい人に最適。

【本書のサポートページ】
https://github.com/upura/python-kaggle-start-book

【実践Data Scienceシリーズ】
https://www.kspub.co.jp/book/series/S069.html

【主な内容】
第1章 Kaggleを知る
1.1 Kaggleとは
1.2 Kaggleで用いる機械学習
1.3 Kaggleのアカウントの作成
1.4 Competitionsページの概要
1.5 環境構築不要な「Notebooks」の使い方

第2章 Titanicに取り組む
2.1 まずはsubmit! 順位表に載ってみよう
2.2 全体像を把握! submitまでの処理の流れを見てみよう
2.3 次の一手を見い出す! 探索的データ分析をしてみよう
2.4 ここで差がつく! 仮説に基づいて新しい特徴量を作ってみよう
2.5 勾配ブースティングが最強?! いろいろな機械学習アルゴリズムを使ってみよう
2.6 機械学習アルゴリズムのお気持ち?! ハイパーパラメータを調整してみよう
2.7 submitのその前に! 「Cross Validation」の大切さを知ろう
2.8 三人寄れば文殊の知恵! アンサンブルを体験しよう.

第3章 Titanicの先に行く
3.1 複数テーブルを扱う
3.2 画像データを扱う
3.3 テキストデータを扱う

第4章 さらなる学びのために
4.1 参加するコンペの選び方
4.2 初学者にお勧めの戦い方
4.3 分析環境の選択肢
4.4 お勧めの資料・文献・リンク

付録A サンプルコード詳細解説
A.1 第2章 Titanicに取り組む
A.2 第3章 Titanicの先に行く

...続きを読む
\ レビュー投稿でポイントプレゼント / ※購入済みの作品が対象となります
レビューを書く

感情タグBEST3

Posted by ブクログ


kaggleの取っ掛かりには最適な本だと思った。
kaggleとは何か、コンペ、discussion等kaggleにおける基礎知識が詰まっている。

実際に手を動かしてハンズオン形式で学べるのも魅力的。
概要の説明が終わると実際にいくつかのモデルを用いてKaggleのチュートリアル的存在のタイタニックの生死予測に取り組める。これもまたハンズオン形式なのでインプットしやすい。

scikit-learnやlightGBMのような Kaggleでしょっちゅう扱うライブラリを使って実装するので、今後コンペに参加する際に役立って行きそう。

0
2021年12月15日

Posted by ブクログ

Kaggle初挑戦の取っ掛かりにうってつけの本。
Titanicのソースコードが掲載されてるのでcontributerにはなれた。
次は推奨されていた「kaggleで勝つデータ分析の技術」を読むこととする。
ブロンズは程遠い。

0
2020年05月09日

Posted by ブクログ

Kaggle初心者の自分にはとても参考になった。サンプルコードも良かったが、引用されている資料や論文などがとても多くてどこから手をつけて良いのか分かってなかった自分にはとてもありがたかった。

0
2020年03月29日

Posted by ブクログ

取り急ぎさっと斜め読みした。最近kaggleを始めた自分にとってはとても参考になる内容。特に付録のコードを丁寧に確認したい。
今からKaggleを始める人はとりあえず買って手元に置いておくと良い本。

0
2020年03月19日

Posted by ブクログ

これからKaggleを始めようと思っている人必携の書!サンプルコードを詳細に解説されていて、進む毎に改善されていくのを実感でき、実際のコンペティションの流れをざっくり掴むことができます。

0
2024年01月02日

Posted by ブクログ

題名と内容が異なる本が多いけど本書は本当にKaggle入門に徹していて適切かつ分かりやすい本だった

ただ、もうちょっと刺激が欲しいなってことで1点減点

0
2020年05月02日

Posted by ブクログ

kaggleは機械学習モデルの性能を競い合うオンラインコミュニティ
コンペがあり、スコア上位はメダル
Notebooksという開発環境がある
タイタニックの生存確率のモデルが事例
特徴量エンジニアリング

読みやすい

0
2022年03月13日

「IT・コンピュータ」ランキング