あらすじ
「データサイエンス」という言葉だけ聞くと、複雑な数式や高度で高価なソフトウェアパッケージが必要と考えるかもしれません。ところが近年では、「R」や本書で紹介する「Python」など、データ分析に適した様々なオープンソースのソフトウェアやプログラミング言語が公開されており、必要な知識さえあれば誰でも簡単に高度な分析を行う環境が整ってきています。
本書はIT エンジニアの読者を対象とし、データサイエンスの入門としてPython を使用してデータ集計や機械学習などのデータ分析手法を習得することを目的としています。
効率的なデータ分析を実践し、自らのサービスにフィードハックを加えたいエンジニアにとって、必読の一冊になっています。
Numpy(ナムパイ)、Pandas(パンダス)といったPython独自の便利なライブラリを短時間で習得できます。
・著者プロフィール
東京工業大学 大学院 生命理工学研究科を卒業し、バイオ・インフォマティクスを学ぶ。現在は機械学習を用いたサービスのシステム設計や様々なサービスのデータ分析に従事している。趣味は家庭菜園であり、自宅のベランダは様々な植物で占拠されている(別な意味でもサイエンティスト)。
感情タグBEST3
Posted by ブクログ
今まで読んだpythonのデータ分析の本の中で、最も易しい本。
pythonの言語体系とかは説明せず、
データを読み込むにはpandasで、
グラフを作成するにはmatplotlibで、
モデルを構築するにはscikit-learnで、
というように、
分析作業はライブラリのこの関数を使うとできるよ、ということを易しく説明している感じの内容。
また、サンプルコードも数行単位で書かれており、このコマンドで何がアウトプットされるかが、プログラムを読むのに慣れていない人でも把握しやすくなっている。
プログラミングの経験が無く、pythonのデータ分析ってどうやって始めればよいかわからない、という人に対して一番最初にお勧めできる本。