本橋智光作品一覧

  • 改訂新版 前処理大全~SQL/pandas/Polars実践テクニック
    NEW
    -
    【データ加工の技とモダンなコードで織りなすAwesomeな実践知識を厳選!】  BigQuery、Pandas、Polarsを使った実用的なモダン前処理を学びましょう!  データ分析において前処理が重要かつ多くの時間をとられる業務であることは広く知られてきました。同時に前処理を実現するためのライブラリは大きく改善されてきています。また、機械学習モデルの進化によって、求められる前処理の内容も変わってきています。本書は、初めて学ぶ方にも昔学んでから知識をアップデートしていない方にも、悪いサンプルコードと良いサンプルコードを紹介しながら丁寧にデータ分析の前処理を学べる技術書です。  本書は、第一版の前処理大全から大きく構成や内容を変更しています。SQLはBigQuery準拠に変更し、Pandasは最新バージョンの思想に沿い新機能を使ったコードに変更しました。Rの代わりにR同様にパイプラインで書きやすくかつ処理エンジンがRustベースで書かれているため高速なPolarsに変更しました。また、前処理内容も大きく変更し、より現在よく使われる処理を実用ケースとともに解説しています。また、新たな試みとしてコラムとして少しマニアックだけど役立つプログラムの裏側の解説や分析テクニックを紹介しており、中級者の方にとっても有用な知識をお届けしています。 ■こんな方におすすめ データ処理業務に従事するエンジニア、データ分析者 ■目次 ●Part1 前処理の基礎知識   第1章 前処理とは   第2章 SQL   第3章 pandas   第4章 Polars ●Part2 データの構造を対象とした前処理   第5章 抽出   第6章 集約   第7章 結合   第8章 分割   第9章 整形 ●Part3 データの内容を対象とした前処理   第10章 数値   第11章 カテゴリ   第12章 日時   第13章 文字列   第14章 ウィンドウ関数 ●Part4 実践前処理   第15章 演習問題 ■著者プロフィール 本橋智光(モトハシトモミツ):SIerの研究員、Web系企業の分析者を経て、SUSMEDのCTO。株式会社ホクソエムのメンバーでもある。基盤・Webアプリ・機械学習・数理最適化等幅広くこなす。最近の好きなプログラミング言語はRust。 橋本秀太郎(ハシモトシュウタロウ):北海道大学 大学院情報科学研究科 博士後期課程修了。博士(情報科学)。大学院修了後はSIerでデータ分析関連の研究開発やコンサルティングに従事。現在は国内でも有数の膨大なデータを持つインターネット企業に勤め、データサイエンスチームのリードとして、日々サービスグロースのためのデータ分析を行う。
  • 前処理大全[データ分析のためのSQL/R/Python実践テクニック]
    4.3
    データサイエンスの現場において,その業務は「前処理」と呼ばれるデータの整形に多くの時間を費やすと言われています。「前処理」を効率よくこなすことで,予測モデルの構築やデータモデリングといった本来のデータサイエンス業務に時間を割くことができるわけです。本書はデータサイエンスに取り組む上で欠かせない「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。ほとんどの問題についてR,Python,SQLを用いた実装方法を紹介しますので,複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。

最近チェックした本