作品一覧
-
4.8データサイエンスの認知の高まりとともに,データ分析に関するコンペティションが多数開催されるようになってきました。最も有名なコンペティションプラットフォームであるKaggleにおけるプレイヤー数は10万人を超え,多くのエンジニアが自分の腕を試すためにコンペティションに参加しています。分析コンペでは,実際のデータを扱うため,機械学習の解説書にはあまり載っていないような手法やテクニックが数多く活用されています。これらを理解し自身で使えるようにしておくことはコンペだけでなく,実務でのモデル構築において非常に役に立ちます。 そこでこれらのテクニックや事例を多くの人に知っていただくために,現時点で最新のものを整理して本書にまとめました。特徴量の作り方,バリデーション,パラメータチューニングなどについて,一般的な書籍ではあまり言及されない暗黙知やポイントについて記述しています。分析コンペにこれから参加してみたい方,あるいはもっと上を目指したい方だけでなく,実務で予測モデルの精度を上げたいという方にも参考になる情報が多いでしょう。
ユーザーレビュー
-
Posted by ブクログ
Target EncordingにおけるLeakageやValidationの切り方などややこしいが抑えるべきポイントが分かりやすくまとめられている。
Kaggleだけでなく実案件でも活かせる実践的なTipも数多く掲載されている。
海外でもこの類の書籍はまだ出てないはずで、日本語でアクセスできることで英語圏を始めとした海外Kagglerに優位に立てる。
銀メダル以上を目指すのであればこのレベルの技術と知識は必須。
本格的にKaggleのテーブルコンペに取り組もうとするのであれば必読だろう。
想定読者は中級者向け。
分かりやすく書かれているものの内容は高度なので、初心者の始めの一冊ではない。