検索結果

  • 統計的因果推論の理論と実装 潜在的結果変数と欠測データ
    5.0
    本書は,統計的因果推論の理論(数理的メカニズム)と実装(Rによる数値解析)の両方を統一的にカバーしたものである。具体的には,ハーバード大学統計学科のDonald B. Rubinの提唱した潜在的結果変数の枠組みによる統計的因果推論を扱う。また,データの一部が観測されない場合の因果推論も扱っており,これは類書にはほとんどみられない本書の特徴である。本書の数理的な理論解説は,できるだけ高校数学の範囲内で理解できるように工夫した。微積分や線形代数も,ほぼ登場しない。さらに,必要な数学的知識は,登場する箇所で解説を加えた。また,Rを使った数値計算により,数学が苦手な人にも統計的因果推論のメカニズムを理解してもらえるように工夫している。そして,数式とRコードとの対応関係をRの初心者も理解できるように,できるだけ1行ごとに完結するコードを書くよう心がけた。さらに,Rを使って統計的因果推論の実証研究を行うための実践的な内容も盛り込んでいる。本書の解析結果は,シミュレーション結果を除いて,すべて,本書の中に記載されているRコードを使って再現できるようにした。そして,本書で使用したデータはすべて,本書のサポートページからダウンロードして使用できるので,本書記載のRコードと一緒に活用することで,統計的因果推論を実践的に学ぶことができる。

    試し読み

    フォロー
  • Rで楽しむベイズ統計入門[しくみから理解するベイズ推定の基礎]
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ベイズ統計が注目されています。MCMCという柔軟なアルゴリズムによって,あまり考えなくてもいろいろな問題が簡単に解けてしまうように宣伝されていることが一因かもしれません。しかし,その計算の背後にある原理は忘れ去られがちです。また,簡単な問題なら,誤差の大きいMCMCを使わなくても,Rの一般的な関数だけで計算できます。そのような簡単な問題を簡単なRの命令を使っていくつも解きながら,ベイズ統計の考え方の基本と,従来の方法との結果の違いを,詳しく解説しています。最後の章でMCMCを扱いますが,ここでもブラックボックスとしてではなくRの簡単なコードで実際に計算して仕組みを理解できるようにしています。
  • Rによるスクレイピング入門
    4.0
    本書では、統計解析ツール「R」を使って、膨大なウェブサイトから情報収集を行う方法(スクレイピングの手法)をわかりやすく解説しています。 HTMLやXMLの解析、APIを活用したデータ収集、データを取得した後の整形など、実践を交えながら、そのテクニックを紹介しています。

    試し読み

    フォロー
  • 改訂3版 R言語逆引きハンドブック
    -
    本書は大変ご好評いただいているR言語の逆引きリファレンスの改訂3版です。本書では、最新バージョンのR 3.3.0に対応し、R言語の機能を目的から探すことができます。統計が注目を集めるなか、Rを利用するユーザーも増えています。初心者でも使えるように、導入から丁寧に解説しています。

    試し読み

    フォロー
  • 基礎からわかる時系列分析―Rで実践するカルマンフィルタ・MCMC・粒子フィルタ―
    5.0
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 時系列データとは気温や株価のように時間順に得られる系列データを指します。時系列データの分析方法にはさまざまありますが、本書では確定的な方法と確率的な方法を解説します。確定的な方法については移動平均法に基づく方法、確率的な方法については、状態空間モデルに基づく方法を取り上げ、これらの解説と合わせてどのようにコードに落とし込むかについても丁寧に解説します。初めて時系列分析を試みる方はもちろん、応用的な手法についても取り上げているのですでに時系列分析に携わっている方にも興味を持っていただける内容になっています。
  • 欠測データ処理 Rによる単一代入法と多重代入法(統計学One Point 5)
    4.5
    ※この電子書籍は固定レイアウト型で配信されております。固定レイアウト型は文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 一般的に調査・観測データには欠測が生じることが多く、適切な欠測データの処理をしなければ、解析結果に偏りが生じることがある。多重代入法は、尤度解析法と並んで最も汎用的な欠測データ解析法であるが、これまでの書籍では理論的な解説が主で、実際の応用事例や具体的な手順の記述が少なかった。そのため、実証分析を行う社会科学者や実務者が多重代入法を実際に活用することにはハードルがあった。 本書は、ワンポイントとして代入法を中心に解説している。平均値のt検定、重回帰分析、ロジスティック回帰分析、時系列分析、パネルデータ分析といった社会科学において頻繁に使用される分析手法に関して、データに欠測が生じている場合に、多重代入法を用いてどのように欠測データを処理していけばよいかを具体的に示している。 事例で扱ったデータとRコードが掲載されているので、読者は本書に示された手順を再現しながら、欠測データの解析法を学んでいくことができる。主に、ウェブ上で入手可能な実データで解説しているので、実践的な技能が身につく。本書は、座学として単に読むだけでなく、ぜひコンピュータ上で実際に処理を体験して欲しい。それが、欠測データの解析法を理解し、修得する近道である。
  • 新米探偵、データ分析に挑む
    4.0
    ※この電子書籍は固定レイアウト型で配信されております。固定レイアウト型は文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 楽しくわかる、統計学。 平均値のシミュレーションやヒストグラムでの可視化、売上予測に役立つ回帰分析、ロジスティック回帰分析、Webの口コミ情報をテキストマイニング、など……。 統計ツールを駆使して、難事件を見事解決! データ分析にまったく縁のなかった≪僕≫が、探偵事務所に就職し、職場で出会う事件(トラブル?)のなかで、データ分析の基本から高度な手法までを身につけていきます。数理的な知識は不要。商店街の住人たちからのさまざまな無理難題を、社長の天羽さんや助手のいっ子さんとともに、データ分析を駆使して解決していきます。とりわけ、頼りになるのは、フリーソフトのRStudio。統計学もRも初心者レベルの≪僕≫だけど、扱い方からていねいに解説してもらって、なんとかなったぞー! やっと就職が決まった僕の勤め先は「商店街の顧問探偵」をやっているというおかしな興信所。 おまけに仕事に必要なのは、勘や経験ではなく、≪データ分析?!≫ 美人社長・天羽さんには怒鳴られて、かわいい助手のいっ子さんにはやさしくフォローしてもらいつつも、僕のデータ分析修業が、ともかく始まった!
  • 情報科学入門~統計・データサイエンス・AI
    -
    本書は文系理系を問わず、高校卒業レベルの読者が、情報科学とデータ分析の基礎を学ぶための入門書です。とくに「データサイエンス」を理解するための基礎知識と、その関連技術の紹介に重点を置いています。 また、本書は数理・データサイエンス教育強化拠点コンソーシアムが公開しているリテラシーレベルのモデルカリキュラムを参考に構成しています。たとえば、第1章は標準カリキュラムの「1.導入、社会におけるデータ・AI 利活用」に、第2章は「2.基礎、データリテラシー」、第3章は「3. 心得、データ・AI 利活用における留意事項」、第4章は「4.選択、オプション」に相当します。数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル)に 対応させると、第1章が「項目1」と「項目2」、「項目3」に、第2章が「項目5」に、そして第3章が「項目4」に対応しています。
  • StanとRでベイズ統計モデリング Wonderful R 2
    4.8
    近年,確率分布を使った数理モデルをデータにあてはめることで現象の理解と予測を促す「統計モデリング」が注目されている。既存の手法と比べた時の利点は解釈のしやすさと予測のよさの両立である。解釈がしやすいので,モデルに含まれる値を推定した後で次のアクションにつなげやすい。このため現実のデータ解析に極めて有効な手法と評価されている。 背景には,コンピュータの計算速度の向上,大規模のデータが入手しやすくなったこと,モデリングの試行錯誤を極めて簡単にする確率的プログラミング言語の進歩がある。こうした言語の中から,本書ではフリーソフトであるStanを紹介する。Stanは優れたアルゴリズムを搭載し開発も急速に進んでいるパッケージであるが,R用のパッケージであるRStanが並行して公開されているためRから手軽に利用することができる。Stanの記述力は高く,階層モデルや状態空間モデルをわずか30行ほどで書くことができ,推定計算も自動で行なわれる。さらに解析者の問題にあわせたオーダーメイドの拡張が簡単に可能だ。 一般にベイズ統計を扱う書籍は初歩的な内容にとどまるものか,難解な数式が多く実際の問題への応用が難しいものが多い。しかし,本書はこれらの書籍とは一線を画し,現実のデータ解析を念頭に置いて非常に実践的な内容に仕上げた。本書でStanとRを介して身につけた統計モデリングの考え方は,Stanの文法が変化しても,他の統計モデリングツールを扱う場合にも,大いに役に立つと確信している。
  • それはあくまで偶然です 運と迷信の統計学
    4.0
    科学視点で「運/不運」を見れば、運命的な出逢いもランダム性が生みだした偶然に過ぎない? 統計学者がユーモアたっぷりに語る
  • [第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践
    5.0
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 本書は、機械学習コンセプト全般をカバーし、理論的背景とPythonコーディングの実際を解説しています。初歩的な線形回帰から始め、ディープラーニング(CNN/RNN)、敵対的生成ネットワーク、強化学習などを取り上げ、scikit-learnやTensorFlowなどPythonライブラリの新版を使ってプログラミング。第3版では13~16章の内容をほとんど刷新したほか、敵対的生成ネットワークと強化学習の章を新たに追加。機械学習プログラミングの本格的な理解と実践に向けて大きく飛躍できる一冊です。◎本書は『Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow 2, 3rd Edition』の翻訳書です。◎微積分/線形代数、Python の文法、データ分析用ライブラリについてある程度理解している必要があります。[原著の第1版]●ドイツ語、韓国語、中国語、日本語、ロシア語、ポーランド語、イタリア語に翻訳。●ACM(米国計算機学会)の「21st Annual list of Notable Books and Articles(2016)」にランクイン。[日本語の第1版]●「ITエンジニア本大賞2017」ベスト10にランクイン。
  • [第2版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践
    5.0
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 機械学習本ベストセラーの第2版! 著者陣の経験に基づく洞察とより専門的な知識を学べる 機械学習の各コンセプトについて、理論や数学的背景、Pythonコーディングの実際を網羅的に解説。初期の機械学習アルゴリズムから、ニューラルネットワーク(CNN/RNN)までの手法を取り上げます。Python関連ライブラリとしてはscikit-learnやTensorFlowなどを使用。第2版では、第1版への読者のフィードバックを随所に反映し、ライブラリの更新に対応。13章以降はほとんど新規の書き下ろしです。本書は、機械学習を本格的に理解・実践するのに不可欠な一冊となっています。 ◎本書は『Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow, 2nd Edition』の翻訳書です。 ◎微積分/線形代数、Pythonの文法、データ分析用ライブラリについてある程度理解している必要があります。 ■「はじめに」より抜粋 機械学習の実践的なサンプルコードを調べて試してみるのは、この分野に飛び込むのにうってつけの方法である。幅広い概念が明確になるからだ。本書では、Python言語と機械学習ライブラリを使って機械学習の実装を体験してみるほか、アルゴリズムの背後にある数学的な概念を紹介する。それらの概念は、機械学習をうまく利用するために欠かせないものである。したがって、本書は単なる実用書ではない。本書では、機械学習の概念を必要に応じて詳しく説明する。
  • データサイエンティスト養成読本 機械学習入門編
    3.3
    ビッグデータ分析をきっかけとして「機械学習」に注目が集まり,ビジネス利用への検討がはじまっています。しかし,実際に「機械学習」を理解しているエンジニアや分析担当者は少なく,うまく活用できていないのが現実です。「機械学習」を利用するにはアルゴリズムの理解,プログラミング技術,ビジネス知識などが必要になってきます。本書では,第1部で機械学習のアルゴリズムやビジネスへの応用方法,流行の深層学習などに触れ,第2部ではPythonを用いた機械学習,画像認識,推薦エンジンなど,サンプルコードをもとに手を動かして試すことができます。機械学習分野で先頭を走る著者陣が,面白く,わかりやすい解説でお届けします。
  • とある弁当屋の統計技師(データサイエンティスト) ―データ分析のはじめかた―
    3.5
    “とある弁当屋”を舞台に、いま話題のデータサイエンティストが活躍するユニークな統計の入門書! 本書では、物語風に統計解析の目的と方法を解説します。具体的には、最近注目を浴びている「データサイエンティスト」を主人公にみたて、顧客であるお弁当屋さんの売上向上を目指して活躍するという筋立てです。主人公が、お店の看板娘に解説するという形式で、統計の基礎概念、方法論、また応用について懇切丁寧に解き明かします。通勤通学の電車の中でも通読できるよう、できるだけ単純化した説明を試みました。そこで、机に向かってじっくり本書の内容を復習したいという読者には、サポートサイトを用意する予定です。統計学なんかまるで縁がなかった、習ったかもしれないけどもう忘れたという社会人や大学生、数学Iの「データの分析」がわけ分からんという高校生に贈ります。
  • Python機械学習プログラミング PyTorch&scikit-learn編
    5.0
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 第3版まで続くロングセラーのPyTorch版! 機械学習の基本から先進的な手法まで本格解説 『機械学習を実践的に学ぶための優れたテキスト』 『多くのトピックを網羅した深い一冊。強力にお勧め』 ―原著への読者の声 本書の前半は、基本的な機械学習ライブラリのscikit-learnを使った手法を解説。 分類の基本モデルに始まり、単層ニューラルネットまでを実装するほか、データ前処理、次元削減、 ハイパーパラメーターのチューニング、アンサンブル学習、回帰分析などを取り上げます。 後半では、PyTorchによるさまざまなディープラーニングの手法を説明。 PyTorchの仕組みを示したあと、CNN/RNN/Transformerといったモデルの実装を解説。 敵対的生成ネットワーク、グラフニューラルネットワーク、強化学習もカバー。 ◎本書は『Machine Learning with PyTorch and Scikit-Learn: Develop machine learning and deep learning models with Python』の翻訳書です。 ◎微積分/線形代数、Pythonの文法、データ分析用ライブラリについてある程度理解している必要があります。
  • Pythonで学ぶ テキストマイニング入門
    4.0
    本書はPythonによる自然言語処理、あるいはテキストマイニングの初歩について解説したものです。 テキストマイニングとは、テキストをコンピュータで探索(マイニング)する技術の総称です。ここで「テキスト」とは、小説や論文、あるいは新聞や雑誌の記事にとどまらず、インターネット上のブログ、あるいはSNSに投稿された文章など、およそ人間の言葉で書かれたものを指します。 Pythonの基本からテキスト分析の手順、形態素解析器の導入、さまざまな分析手法についてわかりやすく解説しています。また、本書の最後に、ディープラーニングを使ったテキストマイニング事例についても紹介します。 なお、本書の一部については解説動画が用意されています。

    試し読み

    フォロー
  • Pythonによるあたらしいデータ分析の教科書
    3.2
    データ分析エンジニアに求められる技術の基礎が最短で身に付く ビッグデータの時代といわれ始めて数年が経過しました。 デバイスの進化により多くの情報がデジタル化され、 それらのデータを活用しようとデータ分析エンジニアに注目が集まっています。 この書籍では、データ分析において、 デファクトスタンダードになりつつあるプログラミング言語Pythonを活用し、 データ分析エンジニアになるための基礎を身に付けることができます。 書籍ではデータ分析エンジニアになるために必須となる技術を身につけていきます。 ・データの入手や加工などのハンドリング ・データの可視化 ・プログラミング ・基礎的な数学の知識 ・機械学習の流れや実行方法 本書で学べること ・Pythonの基本的な文法 ・データフォーマットについて ・データの前処理技術 ・データの可視化技術 ・既存アルゴリズムでの機械学習の実装 対象読者 データ分析エンジニアを目指す方 目次(抜粋) 第1章 データ分析とは 第2章 Pythonと環境 第3章 数学の基礎 第4章 ツールの基礎 第5章 応用:データ収集と加工 ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。 ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。 ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。 ※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。
  • Pythonによるあたらしいデータ分析の教科書 第2版
    -
    読者の声に応えて第2版の登場! データ分析エンジニアに必要な 基本技術をしっかり習得できる 【本書の概要】 本書はデータ分析エンジニアに必要な 以下の基礎技術を丁寧に解説しています。 ・データの取得・加工 ・データの可視化 ・プログラミング ・基礎的な数学の知識 ・機械学習の流れや実行方法 【第2版のポイント】 ・Python 3.10対応 ・よりわかりやすい解説 ・Pythonデータ分析試験の主教材に指定 【本書で学べること】 ・Pythonの基本的な文法 ・データフォーマットについて ・データの前処理技術 ・データの可視化技術 ・既存アルゴリズムでの機械学習の実装方法 【対象読者】 データ分析エンジニアを目指す方 【目次】 第1章 データ分析エンジニアの役割 第2章 Pythonと環境 第3章 数学の基礎 第4章 ライブラリによる分析の実践 第5章 応用:データ収集と加工 ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。 ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。 ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。 ※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。
  • pandasライブラリ活用入門[第2版] データクリーニング/前処理など一連の分析プロセスをマスター!
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 <データサイエンス/データ分析の基本技術を体系的に網羅!> <pandasの威力を実感! 効率的なデータ操作と可視化を実践できる> データ分析や機械学習を利用する現場では、データを取り込み、変換/整備する必要があります。 そうしたデータの取り込みや前処理から始め、データ解析をスムーズに進めるための Pythonライブラリとして、pandasが用意されています。 本書では、pandasなどを使ったデータ分析全体の基本手法を体系的・網羅的にカバー。 巻末の付録では、Python環境のインストールや文法などPythonの基本事項も確認できます。 初中級レベルの方がコードを試しながら理解を深めたり、おぼろげな知識について 確認したりすることで、基礎技術の定着やスキルアップが図れる一冊になっています。 「データクリーニング/前処理に慣れてから、モデリングを解説! 解釈しやすい形にデータセットを変更できる」 ※本書は『Pandas for Everyone, 2nd Edition』の翻訳書です。 ■本書の「序文」から抜粋 pandasを使うと、Pythonによるデータ分析が理解しやすくなり、 組織的で保守が可能なデータセットを作ることができ、 しかも(最も重要なことですが)整然としたデータセットが得られます。
  • 評価指標入門~データサイエンスとビジネスをつなぐ架け橋
    -
    「評価指標でXXXという最高のスコアが出た!」と喜び勇んで,機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。 ところが,ビジネス上のKPIと相関が高い評価指標を選んでいなかったために,KPIの推移を見てみると大した変化がありませんでした。 あるいは「毎日夜遅くまで残業をして,特徴量生成とクロスバリデーションによって評価指標を改善しました!」というデータサイエンティストがいたとします。ところが,KPIの改善のためには そこまで高い評価指標の値を達成する必要ありませんでした。このようなケースでは,データサイエンティストが費やした工数がすべて水の泡となってしまいます。----------(はじめにより)---------- このような状況が起きてしまう背景にはさまざまな原因が考えられますが,あえて一言で言うと「データサイエンスの問題が解くべきビジネスの問題と乖離していた」ためです。 機械学習モデルの”良し悪し”を決めるときには,評価指標(Evaluation Metrics)を必要とします。本質的に評価指標の設計方法は自由であり,ビジネス上の価値を考慮して自ら作成することも可能です。RMSEやAUCといったスタンダードなものから,ドメインに特化した数値まで,あらゆる指標が評価指標になりえます。では評価指標はどのように決めるのが良いのでしょうか。また,どのように決めれば冒頭のような悲しい状況を生まずに済むのでしょうか。 本書はこれらの疑問に答えるため,機械学習の良し悪しを決める評価指標を軸に,解くべきビジネスの問題をどうやってデータサイエンスの問題に落とし込むのか,その原理を解説していきます。この原理が普遍的なものであれば,ビジネスがどんなものであっても応用できると考えることができます。 回帰,分類で使用するスタンダードな評価指標についても,基本から丁寧に解説します。本書を読むことで,どのようなケースでどの評価指標を選ぶべきかがわかり,評価指標の読み間違いを避けることができます。
  • やってみよう! 機械学習
    -
    月刊誌『Software Design』の特集や単発企画で評判の良い、機械学習とPython関連の記事を再編纂。機械学習・深層学習に取り組んでいる開発現場のITエンジニアが自身で試して学んだことが記事のベースになっており、いま押さえておくべき技術を習得する足がかりとして最適です。

最近チェックした本