特徴量作品一覧

  • Kaggleで勝つデータ分析の技術
    4.8
    データサイエンスの認知の高まりとともに,データ分析に関するコンペティションが多数開催されるようになってきました。最も有名なコンペティションプラットフォームであるKaggleにおけるプレイヤー数は10万人を超え,多くのエンジニアが自分の腕を試すためにコンペティションに参加しています。分析コンペでは,実際のデータを扱うため,機械学習の解説書にはあまり載っていないような手法やテクニックが数多く活用されています。これらを理解し自身で使えるようにしておくことはコンペだけでなく,実務でのモデル構築において非常に役に立ちます。 そこでこれらのテクニックや事例を多くの人に知っていただくために,現時点で最新のものを整理して本書にまとめました。特徴量の作り方,バリデーション,パラメータチューニングなどについて,一般的な書籍ではあまり言及されない暗黙知やポイントについて記述しています。分析コンペにこれから参加してみたい方,あるいはもっと上を目指したい方だけでなく,実務で予測モデルの精度を上げたいという方にも参考になる情報が多いでしょう。
  • 指標・特徴量の設計から始めるデータ可視化学入門
    3.5
    1巻2,599円 (税込)
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 典型的なデータの可視化を行なう際には一般的な方法を利用すれば良いですが、新しいタイプのデータに対してどういった指標や特徴量に着目して分析を進めるかは、分析者の腕が大きく問われるところです。 本書ではこうした部分までカバーし、対象のメカニズムを「視える」ようにするには「変換」をどう施すべきかに焦点を当てます。これが本書のタイトルにもなっている「可視化学」です。 本書は、データ解釈に紐づいた新しい可視化の解説書です。 分析の幅を広げ、データの解釈に厚みを出す新境地をぜひ体感してください!
  • Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析
    4.0
    ★ 実験を効率化する強い味方 ★ もう実験で疲弊しない。次に試す実験条件は、データと統計学が教えてくれる! ベイズ最適化とPythonを駆使して、効率よく研究・開発を進めよう! 《すぐに試せるサンプルデータセット・サンプルコード付き》 ■ データ解析の初歩から、モデルの設計、実践的な応用事例までを導く。 ■ 実験時間や人数が限られる今、絶対に役立つスキルが身につく! ■ 入門書であり、実践書。フルカラー! 【目次】 第1章 データ解析や機械学習を活用した分子設計・材料設計・プロセス設計・プロセス管理 ・ケモ・マテリアルズ・プロセスインフォマティクス ・分子設計 ・材料設計 ・なぜベイズ最適化が必要か ・プロセス設計 ・プロセス管理 ・データ解析・人工知能(モデル)の本質 第2章 実験計画法 ・なぜ実験計画法か ・実験計画法とは ・適応的実験計画法 ・必要となる手法・技術 第3章 データ解析や回帰分析の手法 ・データセットの表現 ・ヒストグラム・散布図の確認 ・統計量の確認 ・特徴量の標準化 ・最小二乗法による線形重回帰分析 ・回帰モデルの推定性能の評価 ・非線形重回帰分析 ・決定木 ・ランダムフォレスト ・サポートベクター回帰 ・ガウス過程回帰 第4章 モデルの適用範囲 ・モデルの適用範囲とは ・データ密度 ・アンサンブル学習 第5章 実験計画法・適応的実験計画法の実践 ・実験候補の生成 ・実験候補の選択 ・次の実験候補の選択 ・ベイズ最適化 ・化学構造を扱うときはどうするか 第6章 応用事例 ・複雑な非線形関数を用いた実験計画法・適応的実験計画法の実践 ・分子設計 ・材料設計 ・プロセス設計 第7章 さらなる深みを目指すために ・Gaussian Mixture Regression(GMR) ・GMR-Based Optimization(GMRBO)(GMRに基づく適応的実験計画法) ・複雑な非線形関数を用いたGMRBOの検証 第8章 数学の基礎・Anaconda・Spyder ・行列やベクトルの表現・転置行列・逆行列・固有値分解 ・最尤推定法・正規分布 ・確率・同時確率・条件付き確率・確率の乗法定理 ・AnacondaとRDKitのインストール・Spyderの使い方
  • 機械学習を解釈する技術~予測力と説明力を両立する実践テクニック
    4.8
    機械学習の研究開発が急速な勢いで進んでいます。理論研究はもちろん,機械学習手法が実装されたオープンソースのパッケージ開発も進み,それらを実務で利用するためのノウハウも蓄積されてきています。結果として,機械学習をはじめたばかりの入門者でも比較的高い精度の予測モデルを構築できるようになりました。 Deep Learning, Gradient Boosting Decision Tree, Random Forestなどの機械学習モデルは高い予測精度を誇りますが,モデルの解釈性が低いという欠点があります。これらの複雑なブラックボックスモデルにおいて,モデルがなぜそのような予測を行っているのかを知ることは困難ですが,データ分析者自身がモデルの振る舞いを把握し,説明責任を果たすことを実務においては頻繁に求められます。 本書では,このような予測精度と解釈性のトレードオフを克服するための手法について,実務において特に有用と考えるものを厳選して紹介します。本書の構成は以下になります。 1章: 機械学習の解釈性とは 2章: 線形回帰モデルを通して「解釈性」を理解する 3章: 特徴量の重要度を知る~Permutation Feature Importance~ 4章: 特徴量と予測値の関係を知る~Partial Dependence~ 5章: インスタンスごとの異質性を捉える~Individual Conditional Expectation~ 6章: 予測の理由を考える~SHapley Additive exPlanations~ 付録A: R による分析例~ tidymodelsとDALEXで機械学習モデルを解釈する~ 付録B: 機械学習の解釈手法で線形回帰モデルを解釈する 2章では極めて高い解釈性を誇る線形回帰モデルを通して,予測モデルに求められる解釈性について説明します。以降の4つの章では,それらの解釈性をブラックボックスモデルに与えるPFI, PD, ICE, SHAPと呼ばれる手法について解説します。 本書は機械学習の解釈手法を実用して頂くことを目的としています。Pythonでゼロから手法を実装することを通じて解釈手法のアルゴリズムを理解し,実データの分析を通じて解釈手法の勘所を押さえて頂きます。機械学習の解釈手法は強力な反面,使い方を誤ると間違った結論を導いてしまう危険もあります。本書では解釈手法を実用する際の注意点についても丁寧に触れています。
  • 評価指標入門~データサイエンスとビジネスをつなぐ架け橋
    -
    「評価指標でXXXという最高のスコアが出た!」と喜び勇んで,機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。 ところが,ビジネス上のKPIと相関が高い評価指標を選んでいなかったために,KPIの推移を見てみると大した変化がありませんでした。 あるいは「毎日夜遅くまで残業をして,特徴量生成とクロスバリデーションによって評価指標を改善しました!」というデータサイエンティストがいたとします。ところが,KPIの改善のためには そこまで高い評価指標の値を達成する必要ありませんでした。このようなケースでは,データサイエンティストが費やした工数がすべて水の泡となってしまいます。----------(はじめにより)---------- このような状況が起きてしまう背景にはさまざまな原因が考えられますが,あえて一言で言うと「データサイエンスの問題が解くべきビジネスの問題と乖離していた」ためです。 機械学習モデルの”良し悪し”を決めるときには,評価指標(Evaluation Metrics)を必要とします。本質的に評価指標の設計方法は自由であり,ビジネス上の価値を考慮して自ら作成することも可能です。RMSEやAUCといったスタンダードなものから,ドメインに特化した数値まで,あらゆる指標が評価指標になりえます。では評価指標はどのように決めるのが良いのでしょうか。また,どのように決めれば冒頭のような悲しい状況を生まずに済むのでしょうか。 本書はこれらの疑問に答えるため,機械学習の良し悪しを決める評価指標を軸に,解くべきビジネスの問題をどうやってデータサイエンスの問題に落とし込むのか,その原理を解説していきます。この原理が普遍的なものであれば,ビジネスがどんなものであっても応用できると考えることができます。 回帰,分類で使用するスタンダードな評価指標についても,基本から丁寧に解説します。本書を読むことで,どのようなケースでどの評価指標を選ぶべきかがわかり,評価指標の読み間違いを避けることができます。
  • IT Text 自然言語処理の基礎
    5.0
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 深層学習をベースとした自然言語処理の基礎が体系的に身につく! 本書は、深層学習に基づく自然言語処理の基礎となる知識や考え方を、丁寧に展開し解説するものです。自然言語処理技術の概観から始め、機械学習の基本的枠組み、言語モデル・系列変換モデルとして非常に有用なTransformerとそれを活用した事前学習モデルの詳解、さらに自然言語処理の基本的なタスクである系列ラベリング、構文解析、意味解析と、自然言語処理を学ぶうえで必須の基礎知識や背景となる仕組みを幅広くカバーし、体系的に身につけることができる構成としました。 大学の学部上級から大学院の学生、さらには自然言語処理を学び始めた若手技術者にお薦めの教科書です。 第1章 自然言語処理の概要  1.1 自然言語処理の応用  1.2 コーパスと自然言語処理  1.3 自然言語処理の難しさ  演習問題 第2章 自然言語処理のための機械学習の基礎  2.1 機械学習とは  2.2 教師あり学習  2.3 特徴量表現  2.4 パーセプトロン  2.5 ロジスティック回帰  2.6 ソフトマックス回帰モデル  2.7 機械学習モデルの評価  2.8 正則化  2.9 ニューラルネットワーク  2.10 計算グラフと自動微分  2.11 ニューラルネットワークに関するその他の話題  演習問題 第3章 単語ベクトル表現  3.1 記号からベクトルへ  3.2 素性関数による単語のベクトル表現  3.3 分布仮説と単語文脈行列  3.4 特異値分解による次元削減  3.5 Word2Vec:ニューラルネットワークによる学習  3.6 単語ベクトルの応用  3.7 FastText:単語よりも小さな単位の利用  3.8 単語ベクトル表現の課題と限界  演習問題 第4章 系列に対するニューラルネットワーク  4.1 単語ベクトルの合成  4.2 再帰型ニューラルネットワーク(RNN)  4.3 勾配消失問題と勾配爆発問題  4.4 長期短期記憶(LSTM)  4.5 ゲート付き再帰ユニット(GRU)  4.6 畳込みニューラルネットワーク(CNN)  演習問題 第5章 言語モデル・系列変換モデル  5.1 言語モデル・系列変換モデルの導入  5.2 言語モデルの定式化  5.3 言語モデルの利用例  5.4 言語モデルの具体例1:nグラム言語モデル  5.5 言語モデルの具体例2:ニューラル言語モデル  5.6 系列変換モデル  5.7 言語モデルの評価:パープレキシティ  5.8 未知語問題への対応  演習問題 第6章 Transformer  6.1 Transformerの歴史的背景  6.2 自己注意機構(セルフアテンション)  6.3 Transformerの構成要素  6.4 学習時の工夫  演習問題 第7章 事前学習済みモデルと転移学習  7.1 事前学習済みモデルの背景  7.2 デコーダの事前学習:GPT  7.4 エンコーダ・デコーダの事前学習:BART  7.5 事前学習済みモデルと知識蒸留  7.6 事前学習済みモデル利用上の注意点  演習問題 第8章 系列ラベリング  8.1 系列ラベリングとは  8.2 系列ラベリングの定式化  8.3 点予測による系列ラベリング  8.4 線形連鎖に基づく条件付き確率場  演習問題 第9章 構文解析  9.1 構文解析とは  9.2 句構造解析  9.3 依存構造解析  9.4 さまざまな構文解析手法  演習問題 第10章 意味解析  10.1 意味解析とは  10.2 テキスト間含意関係認識  10.3 ニューラルネットワークによる意味解析  10.4 述語項構造解析  10.5 論理表現  10.6 セマンティックパージング  10.7 意味解析のその他の話題  演習問題 第11章 応用タスク・まとめ  11.1 機械翻訳  11.2 質問応答  11.3 対話  11.4 自然言語処理の過去・現在 演習問題略解 参考文献
  • IT Text  深層学習
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 深層学習(ディープラーニング)の全体像が理解できる一冊。 日々進化し続ける深層学習技術の基礎をなす知識や考え方を体系的に,応用を俯瞰的にまとめた教科書。  本書は、人工知能(AI)技術の一つである深層学習(ディープラーニング)の全体像を体系的にまとめた教科書です。  SNS、スマートスピーカー、画像診断、自動運転、……などなど、身のまわりには深層学習の技術や手法が広く応用されています。このことからもわかるように、深層学習は今日に至るまでさまざまな場面で成功を収めていますが、その技術や手法は、今現在も、非常に速いスピードで進歩し続けています。「以前は当たり前のように利用されていた技術が、ある日突然、それを上回る別の技術に置き換えられた」ということも十分にあり得ます。しかし、そのような深層学習技術の基礎には、普遍的かつ不変的な知識や考え方があります。  本書は、現代の深層学習の技術や手法を理解するうえで基礎となる知識や考え方を、必要に応じて数式を用い、詳細に解説しています。また、代表的な応用例として、画像、音声、自然言語の処理を俯瞰的に解説し、深層学習の全体像が理解できるように構成しました。論文や国際会議等で深層学習技術の最新動向を追うためのベースは、本書で十分に学ぶことができます。 第1章 序論:深層学習登場の前と後 1.1 パターン認識とは 1.2 パターン認識の困難さと深層学習による成功 1.3 深層学習と従来のパターン認識手法の違い 第2章 深層学習以前のパターン認識手法 2.1 深層学習以前のパターン認識の概略 2.2 特徴抽出 2.3 機械学習・パターン認識手法 2.4 クラスタリング 2.5 評価指標 演習問題 第3章 深層学習ネットワーク 3.1 深層学習のアイディア 3.2 パーセプトロン 3.3 多層パーセプトロン 3.4 深層学習ネットワークにおける基本レイヤ群 3.5 基本ネットワーク構造 演習問題 第4章 ネットワークの学習 4.1 深層学習ネットワークの学習の基本的アイディア 4.2 誤差関数 4.3 確率的勾配降下法 4.4 誤差逆伝播法 4.5 畳込み層の学習 4.6 学習の実際 4.7 学習した畳込みフィルタの例 演習問題 第5章 学習のための技術 5.1 学習パラメータの初期値 5.2 学習率の設定 5.3 データ拡張 5.4 ドロップアウト 5.5 入力データの正規化 5.6 モデルアンサンブル 5.7 事前学習とファインチューニング 5.8 中間信号の画像特徴量としての利用 5.9 距離学習 5.10 マルチタスク学習 5.11 自己教師学習 5.12 ネットワークを小さくする工夫 演習問題 第6章 系列データへの対応 6.1 再帰型ネットワーク 6.2 1次元畳込み 6.3 Transformer 演習問題 第7章 画像認識への適用 7.1 主な画像認識ネットワーク 7.2 画像認識ネットワーク内部の可視化 7.3 物体検出 7.4 領域分割 7.5 人物姿勢推定 7.6 動画認識 演習問題 第8章 画像生成・変換への適用 8.1 エンコーダ・デコーダ型ネットワーク 8.2 オートエンコーダ 8.3 深層生成モデル 8.4 画像変換 8.5 画像最適化による画像変換 演習問題 第9章 音声処理への適用 9.1 音声認識ネットワーク 9.2 音声合成ネットワーク 演習問題 第10章 自然言語処理への適用 10.1 単語ベクトル 10.2 系列変換モデル 10.3 事前学習モデル 演習問題 第11章 マルチモーダル学習 11.1 マルチモーダル・クロスモーダル 11.2 画像と言語ル 11.3 画像・映像と音声 演習問題 演習問題略解 参考文献
  • IT Text 音声認識システム(改訂2版)
    3.0
    1巻3,850円 (税込)
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 音声認識の基礎理論から実用的なシステム構成までわかる 本書は音声認識手法の最新技術について基礎から丁寧に解説するとともに、実際の音声認識ソフトによって実践的に学ぶことができることを目的としたものです。改訂版では、DNNをはじめとした音声認識手法のこの間の発展を補うとともに、最新の音声認識ソフトに対応しています。 1章 音声認識の概要 2章 音声特徴量の抽出 3章 HMMによる音響モデル 4章 ディープニューラルネットワーク(DNN)によるモデル 5章 単語音声認識と記述文法に基づく音声認識 6章 統計的言語モデル 7章 大語彙連続音声認識アルゴリズム 8章 音声データベース 9章 音声認識システムの実現例 付録 大語彙連続音声認識エンジン Julius
  • 解釈可能なAI 機械学習モデルの解釈手法を実践的に理解する
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 AIシステムを動かすモデルの解釈可能性を高め、説明可能なAIへの道を開く 本書では、線形回帰や決定木などのシンプルなホワイトボックスモデルから、深層ニューラルネットワークなどのようなブラックボックスモデルまで、その解釈手法とPythonによる実装を解説。「どのように動作し、予測に至ったのか」に答え、モデルを「解釈可能」にするためのアプローチを網羅的に扱い、そして更に「なぜ、この予測をしたのか」に答え「説明可能なAI」に至るための道を示しています。 第1部 解釈可能性の基礎 第1章 はじめに  1.1 Diagnostics+のAI―AIシステムの一例  1.2 機械学習システムの種類  1.3 Diagnostics+のAIを構築する  1.4 Diagnostics+のAIの問題点  1.5 Diagnostics+のAIシステムを堅牢にする  1.6 解釈可能性と説明可能性  1.7 本書で何を学ぶのか?  1.8 まとめ 第2章 ホワイトボックスモデル  2.1 ホワイトボックスモデル  2.2 Diagnostics+―糖尿病の進行度  2.3 線形回帰  2.4 決定木  2.5 一般化加法モデル(GAM)  2.6 ブラックボックスモデルとは  2.7 まとめ 第2部 モデルの処理の解釈 第3章 モデルに依存しない方法:大域的な解釈可能性  3.1 高校生の成績予測器  3.2 アンサンブルツリー  3.3 ランダムフォレストを解釈する  3.4 モデルに依存しない方法:大域的な解釈可能性  3.5 まとめ 第4章 モデルに依存しない方法:局所的な解釈可能性  4.1 Diagnostics+のAI:乳がん診断  4.2 探索的データ分析  4.3 深層ニューラルネットワーク  4.4 DNNを解釈する  4.5 LIME  4.6 SHAP  4.7 アンカー  4.8 まとめ 第5章 顕著性マップ  5.1 Diagnostics+のAI:浸潤性乳管がんの検出  5.2 探索的データ分析  5.3 畳み込みニューラルネットワーク  5.4 CNNを解釈する  5.5 バニラバックプロパゲーション  5.6 ガイド付きバックプロパゲーション  5.7 その他の勾配ベースの手法  5.8 Grad-CAMとガイド付きGrad-CAM  5.9 どの寄与度推定法を使えばいいのか?  5.1 まとめ 第3部 モデルの表現の解釈 第6章 層とユニットを理解する189  6.1 視覚的な理解  6.2 畳み込みニューラルネットワーク:復習  6.3 ネットワーク分析フレームワーク  6.4 層とユニットを解釈する  6.5 まとめ 第7章 意味的な類似性を理解する  7.1 感情分析  7.2 探索的データ分析  7.3 ニューラル単語埋め込み  7.4 意味的類似性を解釈する  7.5 まとめ 第4部 公平性とバイアス 第8章 公平性とバイアスの軽減  8.1 収入予測  8.2 公平性の概念  8.3 解釈可能性と公平性  8.4 バイアスを軽減する  8.5 データセットのためのデータシート  8.6 まとめ 第9章 説明可能なAIへの道  9.1 説明可能なAI  9.2 反実仮想的な説明  9.3 まとめ Appendix 付録A セットアップを行う  A.1 Python  A.2 Gitコードリポジトリ  A.3 Conda環境  A.4 JupyterNotebook  A.5 Docker 付録B PyTorch  B.1 PyTorchとは?  B.2 PyTorchをインストールする  B.3 テンソル  B.4 データセットとDataLoader  B.5 モデリング 付録C 日本語版付録日本語を扱う  C.1 単語に分割する  C.2 ワードクラウドを作成する  C.3 日本語を単語埋め込み化する Ajay Thampi(著者) 信号処理と機械学習をテーマに博士号を取得し、強化学習、凸最適化、5Gセルラーネットワークに適用される古典的な機械学習技術をテーマに主要なカンファレンスやジャーナルで論文を発表している。現在は大手テック企業にて「責任あるAI」と公平性を専門に機械学習エンジニアとして活躍。マイクロソフトのリードデータサイエンティストとして、製造業、小売業、金融業など様々な業界の顧客に対して、複雑なAIソリューションをデプロイする仕事を担当した経験を持つ。 松田晃一(翻訳者) 博士(工学、東京大学)。石川県羽咋市生まれ。『宇宙船ビーグル号の冒険』を読み、絵描きではなく、コンピュータの道へ。海(海水浴)と温泉を好む。HCI/AR/VR/UX、画像処理・認識、機械学習、エッセーの執筆、技術書、SF、一般書の翻訳などに興味を持つ。最近立ち上げたPython の講義が(自分では)結構良く構成でき、再構成し書籍化を考えている。PAW^2(メタバース)の開発に携わり、オープンソースのm3py ライブラリの開発を行っている。著書に『Python ライブラリの使い方~ GUI から機械学習プログラミングまで』、『p5.js プログラミングガイド改訂版』(カットシステム)、『学生のためのPython』(東京電機大学出版局)、『WebGL Programming Guide』(Addison-Welsley Professional)など、訳書に『Web API デザイン・パターン』、『機械学習エンジニアリング』、『プログラミングのための数学』、『データサイエンティストのための特徴量エンジニアリング』(マイナビ出版)、『生成Deep Learning』、『詳解OpenCV3』、『コンピュータビジョンのための実践機械学習』(オライリー・ジャパン)、『デザインのためのデザイン』(ピアソン桐原)などがある。 ※この商品は固定レイアウト型の電子書籍です。 ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。 ※お使いの端末で無料サンプルをお試しいただいた上でのご購入をお願いいたします。
  • Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ
    5.0
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 本書は世界各国で出版・公開された書籍 “Approaching (Almost) Any Machine Learning Problem” の翻訳書です。豊富なコード例と機械学習にまつわる基礎的な内容を取り上げていきます。 交差検証や特徴量エンジニアリングなどモデル作成以前の重要な要素にも紙面が割かれ、コードの再現性やモデルのデプロイといった話題にも踏み込みます。 モデル作成では、表形式のデータセットだけでなく、画像認識や自然言語処理に関する内容が具体的な実装と共に示されます。 本書の節々から、性能を追求するだけではなく実運用にも重きを置いた著者の姿勢が垣間見えるでしょう。 ”KaggleのGrandmasterが書いた本”と聞くと高尚な話題が展開される印象を受ける方もいるかもしれませんが、実態は実践的なプログラミング解説書です。Kaggleコミュニティに限らず機械学習に興味を持つ多くの方に手に取っていただきたいと考えています。 この本ではコードが非常に重要です。何が起こっているのかを理解したければ、コードを注意深く見て、“自分で” 実装しなければなりません。  If you didn't code you didn't learn.(コードを書かねば、何も学べない。) ぜひ自らの手でコードを実装し、学びを深めてください。 第0章 実行環境の準備 第1章 教師あり学習と教師なし学習 第2章 交差検証 第3章 評価指標 第4章 機械学習プロジェクトの構築 第5章 質的変数へのアプローチ 第6章 特徴量エンジニアリング 第7章 特徴量選択 第8章 ハイパーパラメータの最適化 第9章 画像分類・セグメンテーションへのアプローチ 第10章 テキストの分類・回帰へのアプローチ 第11章 アンサンブルとスタッキングへのアプローチ 第12章 コードの再現性やモデルのデプロイへのアプローチ
  • Kaggleコンペティション チャレンジブック
    3.5
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 Kaggleのコンペティションによって機械学習を学ぼうとしている読者のためのKaggle入門書です。Pythonと機械学習についての基礎的な知識を有している読者が、Kaggleから機械学習を学べるようサポートすることを目標としています。 過去のKaggleのコンペティションから、機械学習モデルの正確度を高める実質的な方法について重点的に扱っていきます。多様なデータに接しモデリングを経験できるよう、表形式データを扱うコンペティションを2つ、音声データ/イメージデータを扱うコンペティションを1つずつ、計4つのKaggleコンペティションを選択しました。 表形式データ(テーブルデータ)を扱うコンペティションでは、データの前処理、特徴量エンジニアリングの内容に重点をおき、学習モデルはXGBoost、LightGBMのようなツリーを基盤としたモデルを使用しました。 音声データとイメージデータを扱うコンペティションでは、ディープラーニングモデルの学習に重点を置き、CNNのディープラーニングモデルが使われます。 それぞれの章でコンペティション別に、大会の紹介、主催側の動機、評価の基準、主要なアプローチ、データを準備する方法、データ分析、勝者の智恵に至るまで具体的に検討します。そして過去のコンペティションで使用されたPythonコードを実行することで、探索的データ分析を進め、機械学習モデルを学び、最終的にKaggleに結果をアップロードして性能が向上したことを体験できます。 筆者は本書を通して、読者が機械学習の問題を解くために悩んでほしいと思っています。「次の段階では何をしなければならないのか?」「機械学習モデルの性能を高めるためには何をすればよいのか?」「現在の機械学習パイプラインのどこに問題があるのか?」などの質問を自分自身に投げかけ、悩むことをおすすめします。たっぷりと悩みながらこの本を読みコンペティションに参加したならば、非常に多くのことを得るはずです。 筆者がKaggleを通して多くのことを学んだように、読者の皆さんもぜひKaggleを通して機械学習に没頭してほしいと思います。
  • Kaggleに挑む深層学習プログラミングの極意
    4.5
    ★最強最短の近道は、これだ!★ ・画像・自然言語処理の機械学習コンテストに取り組みながら、深層学習の具体的な知識をいち早く身につけよう! ・レジェンドたちの豊富な経験に基づくスキルアップのノウハウも満載! 【主な内容】 第1章 機械学習コンテストの基礎知識 1.1 機械学習コンテストのおおまかな流れ 1.2 機械学習コンテストの歴史 1.3 機械学習コンテストの例 1.4 計算資源 第2章 探索的データ分析とモデルの作成・検証・性能向上 2.1 探索的データ分析 2.2 モデルの作成 2.3 モデルの検証 2.4 性能の向上 第3章 画像分類入門 3.1 畳み込みニューラルネットワークの基礎 3.2 コンテスト「Dogs vs. Cats Redux」の紹介 3.3 最初の学習:CNNアーキテクチャ 3.4 最初の学習:データセットの準備と学習ループ 3.5 最適化アルゴリズムと学習率スケジューリング 3.6 データ拡張 3.7 アンサンブル 3.8 さらにスコアを伸ばすために 第4章 画像検索入門 4.1 画像検索タスク 4.2 学習済みモデルを使ったベースライン手法 4.3 ベースラインを実装する 4.4 距離学習を学ぶ 4.5 画像マッチングによる検証 4.6 クエリ拡張を学ぶ 4.7 Kaggleコンテストでの実践 第5章 テキスト分類入門 5.1 Quora Question Pairs 5.2 特徴量ベースのモデル 5.3 ニューラルネットワークベースのモデル
  • 機械学習エンジニアリング
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 機械学習は人工知能の同義語となり多くの人に広く知れ渡っていますが、その可能性を十分に活かしている企業は世界でも一握りにすぎません。最新のオープンソースライブラリ、パッケージが提供され、コミュニティは充実していますが、実用的なビジネス上の課題解決に機械学習をどう適用させるかで、多くの企業が四苦八苦しています。 人材不足もその要因の一つではありますが、優秀な機械学習エンジニアやデータアナリストを確保したとしても、1つのモデルを導入するまでにそれなりの期間が必要になってしまうことも起きています。 機械学習モデルのバージョン管理、再現性、スケーリングなど、企業が機械学習の機能を開発する際に直面する主な課題は、サイエンス的な面よりもむしろエンジニアリング的なものですが、一般的なデータサイエンス系の教科書では、機械学習プロジェクトを実施する際のエンジニアリング的な面についてあまり触れていません。 本書はデータの収集、保存、前処理、特徴量エンジニアリング、モデルのテストとデバッグ、本番環境へのデプロイと撤退、ランタイムと本番環境へのデプロイ後のメンテナンスなどに光をあて、解説していきます。 機械学習の応用、ビジネス上の課題を機械学習を使用して解決したい場合に適切なアドバイスを得ることができます。 対象読者として、機械学習の基本を理解し自身でモデルを構築することができるレベルを想定しています。 ・機械学習エンジニアリングの仕事に取り組むデータアナリスト ・仕事をもっと構造化したいと考えている機械学習エンジニア ・機械学習エンジニアが提供するモデルを扱うことになるソフトウェアアーキテクト 第1章 はじめに 第2章 プロジェクトを始める前に 第3章 データの収集と準備 第4章 特徴量エンジニアリング 第5章 教師ありモデルの訓練 (第1部) 第6章 教師ありモデルの訓練(第2部) 第7章 モデルの評価 第8章 モデルの導入 第9章 モデルの推論、監視、メンテナンス 第10章 まとめ
  • 機械学習・深層学習による自然言語処理入門
    4.3
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 本書は、自然言語処理について初歩から学べる書籍です。プログラミングについては、なんらかのプログラミング言語を使ったことのある開発者を対象に書いています。 自然言語とは、私たち人間が日常的に読み書きしたり、話したりするのに使っている言語のことです。そして、自然言語で書かれたテキストデータをコンピュータで処理するための技術を自然言語処理と呼びます。自然言語処理によって実行できるタスクの代表的な例としては、自動翻訳や質問応答、対話などがあります。 本書では、この自然言語処理について、今まで学習したことがない人でも学べるように、基礎から解説しています。自然言語をコンピュータで処理するために、事前にどのような処理をしておくのか、どのように単語や文章を解析するのか、自動翻訳などのタスクを実行させるためにどのような処理を行うのか、などについて、やさしく説明していきます。 基礎からはじめて、単語分散表現やテキスト分類、系列ラベリング、系列変換、アテンションといった、自然言語処理では欠かせない技術について、理論を解説した上で、Pythonを使って実装し、手を動かしながら理解できるようにしています。 また、現在の自然言語処理は、機械学習や深層学習とも切り離せません。ですので本書では、これらの技術についても基礎から説明し、Pythonを使って処理を実装していきます。基礎的な実装のみではなく、RNN、LSTM、CNNさまざまなモデルを使っての実装、特徴量エンジニアリングや正則化、ハイパーパラメータチューニングなど、実際の処理で必要になるところまで、詳しく解説しています。
  • 機械学習のための「前処理」入門
    4.0
    1巻3,080円 (税込)
    きれいに整形されたデータを使った分析の経験はあっても、「実務で扱う生データをどのように前処理すればよいのか」と、お悩みではないでしょうか。前処理は課題ごとに、都度オーダーメイドで設計・実装していくものです。本書では4種類のデータを対象とし、機械学習で予測を行う場合の前処理の基本ノウハウを学び、Pythonによる実装を体験します。本書で扱った技術は、そのまま実務にも活かせます。  機械学習における分析モデルの作成は自動化されつつありますが、その時に投入する特徴量は、人の手で前処理して作成する状況が続くでしょう。これからデータ分析に携わる方々にとって、前処理の力を高めることは、きっと大きな助けとなるでしょう。 (本書「あとがき」から抜粋・編集) ■著者プロフィール 足立 悠(あだち はるか) BULB株式会社所属のデータサイエンティスト。 過去にメーカーのSE やデータサイエンティスト、IT ベンダーのデータアナリスト等を経て現職。数々のデータ分析プロジェクトのほか、実務者教育にも従事。個人的な活動として、記事や書籍の執筆、セミナー講師なども行っている。著書に『初めてのTensorFlow』と『ソニー開発のNeural Network Console 入門』がある。 多感な時期に高専で5年間を過ごしてしまったせいか、周囲から変人や外れ値と評されている。趣味はお地蔵さんが密集している場所に佇むこと。近いうちに、日本を北から南へ移動しながら仕事し、パフォーマンスを測定してみたい。

    試し読み

    フォロー
  • The Kaggle Workbook 著名コンテストに学ぶ!競技トップレベルの思考と技術
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 名高いコンペの解き方をたどる! ケーススタディと練習問題で実践力を養おう 世界中の何百万人もの人々がKaggleに参加し、 さまざまなコンペティションで、より良い結果を得るためにしのぎを削っています。 本書は、そのためのスキルをより素早く身につけるのに役立つ ワークブックとして構成されています。 過去の代表的なコンペを取り上げ、どのように段階を踏んで ソリューションを構築していくのかを解説します。 たとえば、ディスカッションを読み、ノートブックを再利用し、 特徴量エンジニアリングやさまざまなモデルの訓練を見ていきます。 テーマによっては、基本的なソリューションから高度なものへと発展させていきます。 各種トピックについて理解を深めるための練習問題も掲載されています。 どのような情報や知見、理論をもとにして、 どのようなソリューションが導き出されたのか。 さまざまな手を尽くしながら競い合っていることもわかるでしょう。 ※本書は『The Kaggle Workbook: Self-learning exercises and valuable insights for Kaggle data science competitions』の翻訳書です。 ※本書の姉妹書『The Kaggle Book』の内容を参照する箇所があります。 ※『The Kaggle Book』で説明しているKaggleプラットフォームやデータサイエンスの 基本的な理解を前提にしています。
  • 詳解 3次元点群処理 Pythonによる基礎アルゴリズムの実装
    5.0
    基礎的な点群処理から、ICPアルゴリズム、物体認識、PointNetまでをPythonで学ぼう!★章末問題付き★ ・Open3Dを使用し、Pythonプログミングとともに平易に解説。 ・サンプルコードをサポートページから提供したので、すぐに実践できる! ・最終章では、RGBD画像、ボクセルデータ、メッシュデータ、多視点画像の3次元データ処理も解説。 【主な内容】 第1章 はじめに 第2章 点群処理の基礎 第3章 特徴点・特徴量の抽出 第4章 点群レジストレーション(位置合わせ) 第5章 点群からの物体認識 第6章 深層学習による3次元点群処理 第7章 点群以外の3次元データ処理
  • 実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
    4.4
    シリーズの第2弾は、初学者向けのKaggle入門書の決定版! ★「Kaggleで勝つ」準備をしよう!★ 初学者が「Kaggleに何となく興味ある」状態から「実際のコンペに参加できる」状態になれるような内容を目指しました。 ・サンプルコードの詳細な解説があるから、しっかり身につく! ・優勝チームと専業Kagglerのコンビによる、安定のわかりやすさ! ・充実の本音対談で、やさしくサポート! ・初学者や手探りでやっているが体系的な知識を得たい人に最適。 【本書のサポートページ】 https://github.com/upura/python-kaggle-start-book 【実践Data Scienceシリーズ】 https://www.kspub.co.jp/book/series/S069.html 【主な内容】 第1章 Kaggleを知る 1.1 Kaggleとは 1.2 Kaggleで用いる機械学習 1.3 Kaggleのアカウントの作成 1.4 Competitionsページの概要 1.5 環境構築不要な「Notebooks」の使い方 第2章 Titanicに取り組む 2.1 まずはsubmit! 順位表に載ってみよう 2.2 全体像を把握! submitまでの処理の流れを見てみよう 2.3 次の一手を見い出す! 探索的データ分析をしてみよう 2.4 ここで差がつく! 仮説に基づいて新しい特徴量を作ってみよう 2.5 勾配ブースティングが最強?! いろいろな機械学習アルゴリズムを使ってみよう 2.6 機械学習アルゴリズムのお気持ち?! ハイパーパラメータを調整してみよう 2.7 submitのその前に! 「Cross Validation」の大切さを知ろう 2.8 三人寄れば文殊の知恵! アンサンブルを体験しよう. 第3章 Titanicの先に行く 3.1 複数テーブルを扱う 3.2 画像データを扱う 3.3 テキストデータを扱う 第4章 さらなる学びのために 4.1 参加するコンペの選び方 4.2 初学者にお勧めの戦い方 4.3 分析環境の選択肢 4.4 お勧めの資料・文献・リンク 付録A サンプルコード詳細解説 A.1 第2章 Titanicに取り組む A.2 第3章 Titanicの先に行く
  • 実務で役立つPython機械学習入門 課題解決のためのデータ分析の基礎
    -
    身近な課題を解決しながら機械学習を基礎からしっかり理解できる! ■商品紹介 本書はPythonを利用して、実際の課題を機械学習で解決する手法を解説する書籍です。手を動かしながら、データ分析やアルゴリズムについて学ぶことができます。本書では「1.課題分析」「2.データ分析」「3.予測」の3ステップで課題解決を行っていきます。 ■本書の特徴 1.現実的な場面を想定した解説 本書では、現実的な場面を想定して「課題」を設定し、それを機械学習で解決する方法を解説します。課題からアルゴリズムを選定し、プロジェクトをどのように動かしていくのかを学べます。 2.機械学習に最適なアルゴリズムを学べる 本書は、機械学習に用いるアルゴリズムを実例を通じて学べます。身近なビジネス課題を解決するために、どういったアルゴリズムを用いれば良いか、体系的に理解できます。 ■こんな方のための本です ・Pythonの学習をある程度終えて、これから機械学習に対する勉強をしてみたい、一歩を踏み出してみたい方 ・業務や個人のプロジェクトで機械学習を使ってみたい方 ・教科書的な勉強だけでなく、実際に手を動かしながら学びたい方 ■目次 Chapter1 機械学習をはじめる前に Chapter2 まずは基本を押さえよう 2-1 Chapter2について 2-2 回帰アルゴリズム:不動産価格を予測しよう 2-3 分類アルゴリズム:社員の退職を予測しよう Chapter3 さまざまなアルゴリズムを体験しよう 3-1 Chapter3について 3-2 時系列予測アルゴリズム:商品の売上を予測しよう 3-3 レコメンドアルゴリズム:個人の趣向に沿った商品をオススメしてみよう 3-4 異常検知アルゴリズム:ポンプの故障を検知しよう Chapter4 さまざまなデータを取り扱ってみよう 4-1 Chapter4について 4-2 テキストデータ:商品の口コミを分析してみよう 4-3 画像データ:画像を識別してみよう Chapter5 一つひとつのプロセスを深堀りしてみよう 5.1 Chapter5について 5.2 データ観察 5.3 特徴量生成・学習 5.4 機械学習アルゴリズムと評価指標の選定 5.5 機械学習モデルの学習と選択 Chapter6 モデルを運用してみよう 6-1 機械学習モデルを運用してみよう 6-2 バッチ予測をしよう 6-3 リアルタイム予測をしよう ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。 ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。 ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。 ※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。
  • Splunkユーザーのためのデータ分析実践バイブル SPLとMLTKを駆使した前処理から機械学習の手続きまで
    -
    あらゆるデータの収集・検索・分析・可視化ができる データ分析プラットフォーム×機械学習を目的別に徹底解説 本書は、Splunkを使ったデータ分析の解説書です。 効率的な前処理から機械学習までを扱い、 Splunk上で機械学習を実現するMLTKを丁寧に解説しています。 各章は機械学習の概念に始まり、データ分析をする上で必要な基礎知識、 Splunkを用いたデータの可視化、データ加工方法の紹介から 実際にサンプルケースを用いた分析とその解説で構成されています。 Splunkを用いてデータ分析・機械学習に取り組みたい人には必読の1冊です。 【こんな方にお勧めします】 ・Splunkを使っているが、SPLの書き方に困っている方 ・Splunkでの効果的なデータの可視化の方法を知りたい方 ・Splunkでの機械学習の方法を知りたい方 【目次】 第1章 Splunkについて 第2章 機械学習の流れ 第3章 Splunk・MLTKによる機械学習 第4章 Splunkへデータ登録するまでの基本的な手続き 第5章 特徴量を生成するための前処理と手法 第6章 Splunkによる特徴量評価 第7章 機械学習の実演 ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。 ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。 ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。 ※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

    試し読み

    フォロー
  • [増補改訂]ビッグデータを支える技術——ラップトップ1台で学ぶデータ基盤のしくみ
    5.0
    「ビッグデータ」をテーマに,データ分析基盤技術をまとめた解説書。 AIの発展,コンテナ技術の進歩をはじめ,ビッグデータを取り巻く技術が大きく変わり始めました。ビッグデータの技術には,元々大きく分けて2つのバックグラウンドがありました。一つは業務系システムで,RDB(Relational Database)から取り出したデータをバッチ処理して役立つ情報を提供する。もう一つはWeb/IoT系システムで,RDBでは扱いきれない大量のログを分散システムを使い,データ処理をする。この2つの流れが融合し,膨大なデータを収集/変換し,分析/可視化するための一連の基盤システムの重要度は格段に上がりました。さらに昨今のAI/機械学習の台頭で,新たな潮流が生まれています。 本書では,ビッグデータを支える基盤技術の「今」に焦点を当て,前半ではデータ量や分散処理など基本概念の整理と,代表的なテクノロジーを徹底解説。合わせて,各技術登場の歴史的な背景も丁寧に追います。後半は実践編としてオープンソースや無償版が利用できるソフトウェアを中心にラップトップ1台でビッグデータを体験しながら学べるよう解説を進めます。今回の改訂では,ビッグデータの技術を活用した応用分野のうち注目度の高い機械学習や特徴量ストア,MLOpsの話題も新たに盛り込み,充実の内容でお届けします。
  • テキスト・画像・音声データ分析
    -
    基礎をしっかりと理解し、Pythonですぐに実践! 社会で求められるデータサイエンスの応用3分野を、各分野の専門家が平易な文章と多彩な図で説く。 ・初歩の動機づけから基本原理、さらには社会実装までを見すえる ・学んだことが、すぐに試せる。豊富なPythonコードを収録 ・練習問題を多数掲載し、講義テキストに最適。初学者の自学自習にも役立つ 【主な内容】 第I部 テキスト分析(西川仁) 第1章 テキスト分析概論 第2章 言語資源と言語モデル 第3章 基礎技術 第4章 応用技術 第II部 画像分析(佐藤智和) 第1章 画像解析の概要 第2章 画像のデータ表現 第3章 二次元画像解析 第4章 三次元画像解析 第5章 三次元構造の推定アルゴリズム 第III部 音声データ分析(市川治) 第1章 音声認識の全体像 第2章 音声データの特徴量 第3章 音響モデル 第4章 言語モデル 第5章 デコーダ 第6章 音声認識技術の発展 【「巻頭言」より抜粋】 文部科学省は「数理及びデータサイエンスに係る教育強化拠点」6大学(北海道大学、東京大学、滋賀大学、京都大学、大阪大学、九州大学)を選定し、拠点校は「数理・データサイエンス教育強化拠点コンソーシアム」を設立して、全国の大学に向けたデータサイエンス教育の指針や教育コンテンツの作成をおこなっています。 本シリーズは、コンソーシアムのカリキュラム分科会が作成したデータサイエンスに関するスキルセットに準拠した標準的な教科書シリーズを目指して編集されました。またコンソーシアムの教材分科会委員の先生方には各巻の原稿を読んでいただき、貴重なコメントをいただきました。 データサイエンスは、従来からの統計学とデータサイエンスに必要な情報学の二つの分野を基礎としますが、データサイエンスの教育のためには、データという共通点からこれらの二つの分野を融合的に扱うことが必要です。この点で本シリーズは、これまでの統計学やコンピュータ科学の個々の教科書とは性格を異にしており、ビッグデータの時代にふさわしい内容を提供します。本シリーズが全国の大学で活用されることを期待いたします。 ――編集委員長 竹村彰通(滋賀大学データサイエンス学部学部長、教授)
  • データサイエンティストのための特徴量エンジニアリング
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 Pythonによる機械学習モデル構築のための特徴量 抽出・作成実践レシピ Pythonを活用した70以上の実践的な"レシピ"により表形式データに対する特徴量エンジニアリングのほぼすべてのトピックをカバー。テキストからの特徴量の抽出の付録として日本語モデルでの実例も取り上げます。 Packt Publishing: Python Feature Engineering Cookbook, Second Edition の翻訳書。 1章 欠損値を補完する 2章 カテゴリ変数をエンコーディングする 3章 数値変数を変換する 4章 変数を離散化する 5章 外れ値を扱う 6章 日付と時刻の変数から特徴量を抽出する 7章 特徴量をスケーリングする 8章 新しい特徴量を作成する 9章 Featuretoolsを用いてリレーショナルデータから特徴量を抽出する 10章 tsfreshを使って時系列データから特徴量を作成する 11章 テキスト変数から特徴量を抽出する 付録 日本語を扱う Soledad Galli : 世界的な学術機関や有名な企業で10年以上の経験を持つデータサイエンティスト、インストラクター、ソフトウェア開発者。保険金請求や信用リスクの評価、詐欺の防止を目的とした機械学習モデルを開発し実運用に成功している。複数のオンラインコースで機械学習を教えており、オープンソースのPythonライブラリFeature-engineを開発・保守している。2018年にData Science Leaders Awardを受賞、2019年にデータサイエンスと分析におけるLinkedIn Voices (LinkedInインフルエンサー) の1人に認定されている。 松田晃一 : 博士(工学、東京大学)。石川県羽咋市生まれ。『宇宙船ビーグル号の冒険』を読み、絵描きではなく、コンピュータの道へ。海(海水浴)と温泉を好む。著書に『Python ライブラリの使い方~ GUI から機械学習プログラミングまで』、『p5.js プログラミングガイド改訂版』(カットシステム)、『学生のためのPython』(東京電機大学出版局)、『WebGL Programming Guide』(Addison-Welsley Professional)など、訳書に『APIデザイン・パターン』、『プログラミングのための数学』(マイナビ出版)、『生成 Deep Learning』、『詳解OpenCV3』(オライリー・ジャパン)、『デザインのためのデザイン』(ピアソン桐原)などがある。 ※この商品は固定レイアウト型の電子書籍です。 ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。 ※お使いの端末で無料サンプルをお試しいただいた上でのご購入をお願いいたします。
  • 統計学のやさしい授業 ―みみたとサブローの学習ノート―
    -
    1巻2,090円 (税込)
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 どっちの武器が有利?なぜガチャがはずれる?統計でわかる! 身近な例題とゆる~いイラストで、無理なく統計学が学べる!  本書は、統計ソフトを使ったデータ分析の前に知っておくべき統計の基礎を無理なく学べる初学者向けの入門書です。  割れたお菓子、渋いガチャ、レア指輪の効果などの日常的な疑問を会話形式とイラストで解決しながら、統計学の実用的な手法と基本的な概念を練習問題によって「習うより慣れる」ことを目指します。正規分布や中心極限定理など、統計学の基本をカバーしているのはもちろん、誤解しやすい仮説検定を深く掘り下げることで、更に深く統計学を学ぶためのガイドとしても役立ちます。みみたとサブローとともに統計学の最初の一歩を踏み出してみませんか。 はじめに プロローグ~不思議な洋館~ 人物紹介 オリエンテーション 統計はデータから情報を引き出す道具だ11  Lesson 1 統計のしくみ  Lesson 2 統計と確率  Lesson 3 統計の役目 第1時限 データの分布は代表値で把握する  Lesson 1 データのレイアウト  Lesson 2 度数分布表とヒストグラム  Lesson 3 データの代表値 第2時限 データのばらつきは標準偏差で比較する  Lesson 1 範囲と四分位数  Lesson 2 標準偏差  Lesson 3 データの特徴量と形状 第3時限 確率変数の振る舞いは確率分布に従う  Lesson 1 確率とは  Lesson 2 確率変数と確率分布  Lesson 3 期待値と分散 第4時限 ガチャの背後に二項分布あり  Lesson 1 二項分布75  Lesson 2 二項分布の期待値と分散  Lesson 3 ポアソン分布 あとがき 巻末付録 練習問題の解答 索引
  • Pythonによる機械学習入門
    3.0
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。検索やハイライト等の機能が使用できません。 初心者でもPythonを用いて機械学習が実装できる!   本書は、今後ますますの発展が予想される人工知能の技術のうち機械学習について、入門的知識から実践まで、できるだけ平易に解説する書籍です。「解説だけ読んでもいまひとつピンとこない」人に向け、プログラミングが容易なPythonにより実際に自分でシステムを作成することで、そのエッセンスを実践的に身につけていきます。 また、読者が段階的に理解できるよう、「導入編」「基礎編」「実践編」の三部構成となっており、特に「実践編」ではシステム計画研究所が展示会「Deep Learning実践」で実際に展示した「手形状判別」を実装します。 詳細目次 第1部 導入編  第1章 はじめに  1.1 機械学習とは  1.2 Python と機械学習  1.3 インストール&セットアップ  1.4 Python 早分かり ― NumPy とmatplotlib  1.5 クイックツアー   小話 深層学習って何だ?  第2 章 機械学習の様々な側面 33  2.1 機械学習をとりまく環境.. 33  2.2 関連分野. 34  2.3 学習法による分類. 35  2.4 手法や課題設定による分類. 36  2.5 応用例. 37 第2部 基礎編  第3章 分類問題  3.1 分類問題とは  3.2 最初の分類器  3.3 学習データとテストデータ   ミニ知識 色々な用語 ―学習・訓練・教師 vs テスト・評価・バリデート・検証   ミニ知識 k- 分割交差検証  3.4 分類器の性能を評価しよう   ミニ知識 正答率(Accuracy)と適合率(Precision)   ミニ知識 色々な平均.調和平均・算術平均・幾何平均  3.5 色々な分類器  3.6 まとめ  第4章 回帰問題  4.1 回帰問題とその分類  4.2 最初の回帰 ― 最小二乗法と評価方法  4.3 機械学習における鬼門 ― 過学習  4.4 過学習への対応 ― 罰則付き回帰  4.5 様々な回帰モデル  4.6 まとめ  第5章 クラスタリング  5.1 iris データセット   ミニ知識 フィッシャーのあやめ  5.2 代表的なクラスタリング手法 ― k-means  5.3 その他のクラスタリング手法  5.4 まとめ 第3部 実戦編  第6章 画像による手形状分類  6.1 課題の設定  6.2 最初の学習  6.3 汎化性能を求めて ― 人を増やしてみる  6.4 さらに人数を増やしてみる   ミニ知識 学習データに含める人数について  6.5 データの精査と洗浄 ― データクレンジング  6.6 特徴量の導入  6.7 パラメータチューニング  6.8 まとめ  第7章 センサデータによる回帰問題  7.1 はじめに  7.2 準備  7.3 センサデータの概要  7.4 データの読み込み  7.5 高松の気温データと四国電力の消費量  7.6 もっと色々、そしてまとめ  7.7 終わりに 第4部 付録  付録A Python で作る機械学習  A.1 この付録の目的  A.2 最小二乗法  A.3 行列計算による解析解の導出  A.4 反復法  A.5 コードを書く前に  A.6 実装例  付録B 線形代数のおさらいと代表的な非線形モデル  B.1 この付録の目的  B.2 そもそも「線形」とは  B.3 線形変換とアフィン変換  B.4 ノルムと罰則項  B.5 線形回帰の最小二乗解を考える  B.6 機械学習における「非線形」
  • Pythonによる時系列分析 ―予測モデル構築と企業事例―
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 時系列データを上手く活用し、ビジネス成果を生み出す!!  時系列データを上手く調理することは、これらの問に何かしら解を与えることができます。特に予測モデルを上手く活用すると、過去を振り返り、未来を予測し、現在すべきことを導きだし、成果へと繋げることができます。いくら高精度な予測モデルを手にしても、どう活用すべきかわからないと成果は生まれません。そこで本書ではどのように扱うかを、実際のデータを用いて、使い方を重点的に解説していきます。時系列分析の多くの書籍は数式等を用いて解説していますが、実務的な運用には理論よりもPython等コードで実践していくことが重要です。 なお、事例として以下を取り上げます。 ・モニタリング指標の異常検知によるキャンペーン評価(自動車ディーラー) ・モニタリング指標の異常検知と要因探索(小売りチェーン) ・売上予測モデルを活用したデータドリブン販促(小売りチェーン) ・離反予測モデルによる離反対策ルールの策定(食品・法人向けビジネス) ・チャーンマネジメントのための離反時期予測(携帯電話サービス) ・LTVマネジメントのためのLTV予測(ECサイト) ・広告・販促効果を見える化し最適化するマーケティング・ミックス・モデリング(スポーツジム) 第1章 ビジネスにおける時系列データ活用 1.1 ビジネス現場は時系列データで溢れている 1.2 ビジネス時系列データでよくある7つの活用事例 1.3 2種類の時系列データ 1 1.4 よく目にする7つの時系列特徴量 1.5 時系列特徴量付きテーブルデータ 第2章 Pythonのデータ分析環境の設定(JupyterLab) 2.1 Pythonのインストール 2.2 Python以外のインストール 2.3 利用するライブラリー(パッケージ)のインストール 第3章 時系列予測モデル構築・超入門 3.1 時系列データを使った予測モデル構築の流れ 3.2 時系列データの特徴把握と前処理 3.3 時系列の予測モデルを構築してみよう 3.4 季節成分が複数ある場合の予測モデル 3.5 多変量時系列データの特徴把握と因果探索 第4章 時系列データを使ったビジネス成果の上げ方 4.1 データでビジネス成果を上げる「データ活用ストーリー」 4.2 時系列データの異常検知 4.3 時系列データの要因探索 4.4 時系列データの将来予測 第5章 時系列データを活用したビジネス事例 5.1 モニタリング指標の異常検知によるキャンペーン評価(自動車ディーラー) 5.2 モニタリング指標の異常検知と要因探索(小売りチェーン) 5.3 売上予測モデルを活用したデータドリブン販促(小売りチェーン) 5.4 離反予測モデルによる離反対策ルールの策定(食品・法人向けビジネス) 5.5 チャーンマネジメントのための離反時期予測(携帯電話サービス) 5.6 LTVマネジメントのためのLTV予測(ECサイト) 5.7 広告と販促効果を見える化し最適化するマーケティングミックスモデリング(スポーツジム)
  • 理工系のための数学入門  確率・統計
    -
    1巻2,750円 (税込)
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。 理工系の学生にとって基礎となる内容がしっかり身に付く良問を数多く掲載した確率、統計の演習書 本書は理工系の学生にとって基礎となる内容がしっかり身に付く良問を数多く掲載した確率、統計の演習書です。 高校数学で学んだ内容を起点に、丁寧にわかりやすく解説したうえ、読者が自ら手を動かして確かなスキルが身に付けられるよう、数多くの例題、問題を掲載しています。 第1章 データ取り扱いの心得 第2章 場合の数と確率 第3章 データの特徴量 第4章 データどうしを比べる 第5章 回帰分析 第6章 正規分布 第7章 推定と検定 第8章 t分布 第9章 カイ二乗分布 第10章 指数分布 第11章 二項分布とポアソン分布 第12章 その他の分布や推定手法

最近チェックした本