あらすじ
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
東大 松尾研究室が提供するあの人気講座が待望の書籍化!
本書は、2017年と2018年に東京大学で実施された講座で使われた教材がベースになっています。約400名ほどの受講枠(2年間)に、のべ1,800人以上の応募があった人気の講義です。この本のベースとなるコンテンツをさらに精査、ブラッシュアップし、読みやすく整えたものが本書になります。
本書には、データサイエンティストになるための基礎をつめこんでいます。データサイエンティストは、Pythonや確率・統計、機械学習など、幅広くさまざまな分野の知識を必要とします。
この本は主にPython 3を使って、基本的なプログラムの書き方、データの取得、読み込み、そのデータ操作からはじまり、さまざまなPythonのライブラリの使い方、確率統計の手法、機械学習(教師あり学習、教師なし学習とチューニング)の使い方についても学びます。取り扱っているデータは、マーケティングに関するデータやログデータ、金融時系列データなどさまざまで、モデリングの前にそれらを加工する手法も紹介しています。データサイエンティストになるには、どれも必要なスキルです。
本書には、さらに以下の3つの特徴があります。
・実際のデータを使って手を動かしながら、データサイエンスのスキルを身に付けることができる
・データ分析の現場で使える実践的な内容(データ前処理など)が含まれている
・練習問題や総合問題演習など実際に頭を使って考える内容がたくさんある
◆目次
Chapter 1 本書の概要とPythonの基礎
Chapter 2 科学計算、データ加工、グラフ描画ライブラリの使い方の基礎
Chapter 3 記述統計と単回帰分析
Chapter 4 確率と統計の基礎
Chapter 5 Pythonによる科学計算(NumpyとScipy)
Chapter 6 Pandasを使ったデータ加工処理
Chapter 7 Matplotlibを使ったデータ可視化
Chapter 8 機械学習の基礎(教師あり学習)
Chapter 9 機械学習の基礎(教師なし学習)
Chapter 10 モデルの検証方法とチューニング方法
Chapter 11 総合演習問題
Appendix 本書の環境構築について/練習問題解答/参考文献・参考URL
感情タグBEST3
Posted by ブクログ
pythonの文法や、数多いライブラリの使い方を齧るよりも前に、線形代数、微積分・最適化、数理統計をある程度トレーニングしておくこと、さらに、それ以前に、全体と細部を同時に「思い、感じる」という科学的なものの見方について、いわゆる教養が必要だとは思う。それでも、コンピュータという道具は、習うより慣れろという面があるのも、また真実であり、そういう点で、項目の立て方や見易さ、さりげないヒントの書き込み方など、とても良いテキストだと感じた。
Posted by ブクログ
Pythonを少し勉強して、さらに成長したい方にオススメです!
ベースはデータサイエンスなので数値解析がほとんどです。
最後の方になると機械学習の実際のプログラミングができるようになってきます。
これ1冊をやればデータサイエンティストとしての実力が身に付くと断言出来る1冊です。
Posted by ブクログ
一冊通せばデータアナリシスに使うpythonの手法を一通り学ぶことができる。
オライリーの「Pythonによるデータ分析入門」の後でこなしたので、numpy, pandasやmatplotlibにはまることなく目的であるscipyやscikit-learnの章にたどり着くことができた。
高校生から大学教養課程の数学・統計しか使わずに解説してくれるので、scipyとscikit-learnの専門書に取り組む前の導入としては素晴らしい内容である。
加えて、Appendix3に掲載されている各分野の専門書のリストは大変役に立つ。
自分が在学中にこんなにも実践的な講座は用意されていたとは、いくら思い起こしても記憶にないので、本書が実際に東京大学で実施された講座内容を書き起こしたものであることにいい意味で驚かされる。
Posted by ブクログ
データ活用、機械学習で使うであろう数学知識とPythonでのやり方を広く浅くまとめてる。
実際にコードも書かれてるので自分で書くとより理解できそう。
Posted by ブクログ
データサイエンティストとはどのような知識が必要なものなのかという観点で最初の1冊として購入しました。
結論から言うと、よく整理されていている点は良いのですが、深く学ぼうとすると、この本だけでは難しいと思います。
おすすめはこの本をベースにつまずく部分があれば別の本かネットで調べて進めていくのが良いと思います。
私の場合は、手を動かしならが進めていくうちに、統計学で詰まりました。ただプログラムを写して進めていくこともできますが、納得しながら進めないと意味がないと思い、その後、統計学を別の本で勉強、機械学習についても別の本で学習しました。再度、この本に戻って再勉強すると、よく整理させていて理解することができました。