検索結果
-
3.2データ分析エンジニアに求められる技術の基礎が最短で身に付く ビッグデータの時代といわれ始めて数年が経過しました。 デバイスの進化により多くの情報がデジタル化され、 それらのデータを活用しようとデータ分析エンジニアに注目が集まっています。 この書籍では、データ分析において、 デファクトスタンダードになりつつあるプログラミング言語Pythonを活用し、 データ分析エンジニアになるための基礎を身に付けることができます。 書籍ではデータ分析エンジニアになるために必須となる技術を身につけていきます。 ・データの入手や加工などのハンドリング ・データの可視化 ・プログラミング ・基礎的な数学の知識 ・機械学習の流れや実行方法 本書で学べること ・Pythonの基本的な文法 ・データフォーマットについて ・データの前処理技術 ・データの可視化技術 ・既存アルゴリズムでの機械学習の実装 対象読者 データ分析エンジニアを目指す方 目次(抜粋) 第1章 データ分析とは 第2章 Pythonと環境 第3章 数学の基礎 第4章 ツールの基礎 第5章 応用:データ収集と加工 ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。 ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。 ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。 ※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。
-
-※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ベイズ統計が注目されています。MCMCという柔軟なアルゴリズムによって,あまり考えなくてもいろいろな問題が簡単に解けてしまうように宣伝されていることが一因かもしれません。しかし,その計算の背後にある原理は忘れ去られがちです。また,簡単な問題なら,誤差の大きいMCMCを使わなくても,Rの一般的な関数だけで計算できます。そのような簡単な問題を簡単なRの命令を使っていくつも解きながら,ベイズ統計の考え方の基本と,従来の方法との結果の違いを,詳しく解説しています。最後の章でMCMCを扱いますが,ここでもブラックボックスとしてではなくRの簡単なコードで実際に計算して仕組みを理解できるようにしています。
-
4.0
-
-本書は大変ご好評いただいているR言語の逆引きリファレンスの改訂3版です。本書では、最新バージョンのR 3.3.0に対応し、R言語の機能を目的から探すことができます。統計が注目を集めるなか、Rを利用するユーザーも増えています。初心者でも使えるように、導入から丁寧に解説しています。
-
-※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ◆「データサイエンス」の基礎を徹底解説◆ データサイエンスに重点を置いた情報科学とデータ分析の入門書です。 基礎知識から、関連する技術をわかりやすく解説します。本書の構成は、それぞれ標準カリキュラムの以下に相当します。 第1章「1. 導入、社会におけるデータ・AI利活用」 第2章「2. 基礎、データリテラシー」 第3章「3. 心得、データ・AI利活用における留意事項」 第4章「4. 選択、オプション」 数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル)に対応させると、第1章が「項目1」と「項目2」「項目3」に、第2章が「項目5」に、そして第3章が「項目4」に対応します。また、本書を改訂するにあたり、新たに生成AIに関するトピックを第6章として、さらにオープンデータの活用を第7章に追加しています。第6章は応用基礎レベルの「3. AI基礎」に該当します。第7章は応用基礎レベル「2.データエンジニアリング基礎」に相当します。 データサイエンスの基礎を学びたい方、AI技術に興味がある方、データ分析の実践力を身につけたい方など、幅広い読者におすすめです。 ■こんな方におすすめ ・情報科学およびデータ分析の基礎を学びたい方 ■目次 第1章 社会におけるデータ・AI活用 ・1-1 社会で起きている変化 ・1-2 社会で活用されているデータ ・1-3 データサイエンス・AIの活用領域 ・1-4 データサイエンス・AIの利活用のための技術 ・1-5 データサイエンス・AIの利活用の最新動向 第2章 データの要約と可視化 ・2-1 データの要約 ・2-2 要約統計量 ・2-3 関係をとらえる ・2-4 データの可視化 ・2-5 まとめ ・2-6 参考文献 第3章 データの法規と倫理 ・3-1 データ解析のインパクトと倫理 ・3-2 データの健全な取り扱い ・3-3 個人情報 ・3-4 結果の説明可能性 ・3-5 データと情報に関する権利と法律 ・3-6 参考文献 第4章 データ活用の手法と実践 ・4-1 はじめに ・4-2 代表的な確率分布 ・4-3 確率論とベイズの定理 ・4-4 推測統計学の基礎 ・4-5 統計的検定の基礎 ・4-6 ROC解析と推論の評価 ・4-7 モデリング ・4-8 回帰分析 ・4-9 単回帰分析 ・4-10 クラスタ分析 ・4-11 参考文献 第5章 データ構造、アルゴリズム、プログラミング ・5-1 プログラミングの話題に入る前に ・5-2 データ構造 ・5-3 アルゴリズム ・5-4 プログラミングの基礎 ・5-5 参考文献 第6章 深層学習、生成AI ・6-1 深層学習 ・6-2 生成AI ・6-3 参考文献 第7章 オープンデータの活用 ・7-1 オープンデータ ・7-2 クリエイティブ・コモンズ ・7-3 機械判読に適したデータ ・7-4 さらなるデータの活用と課題 ・7-5 機械学習によるデータの活用と限界 付録A RStudioによるRの実行 付録B Google ColabによるPythonの実行 ■著者プロフィール ●石田基広(いしだ もとひろ):徳島大学デザイン型AI教育研究センター教授。1991年東京都立大学大学院博士後課程中退。著書『Rによるテキストマイニング入門 第二版』(森北出版, 2017)、『新米探偵、データ分析に挑む』(SB Creative, 2015)、監修Wonderful Rシリーズ(共立出版)、Data Science Library(技術評論社)。本書の監修、前書き、付録Bの執筆を担当。 ●大薮進喜(おおやぶ しんき):徳島大学教養教育院/デザイン型AI教育研究センター教授。博士(理学)。2003年東京大学大学院理学系研究科博士後期課程修了。専門は宇宙物理学。本書の監修、第1章の執筆を担当。
-
5.0※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 時系列データとは気温や株価のように時間順に得られる系列データを指します。時系列データの分析方法にはさまざまありますが、本書では確定的な方法と確率的な方法を解説します。確定的な方法については移動平均法に基づく方法、確率的な方法については、状態空間モデルに基づく方法を取り上げ、これらの解説と合わせてどのようにコードに落とし込むかについても丁寧に解説します。初めて時系列分析を試みる方はもちろん、応用的な手法についても取り上げているのですでに時系列分析に携わっている方にも興味を持っていただける内容になっています。
-
4.7※この電子書籍は固定レイアウト型で配信されております。固定レイアウト型は文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 一般的に調査・観測データには欠測が生じることが多く、適切な欠測データの処理をしなければ、解析結果に偏りが生じることがある。多重代入法は、尤度解析法と並んで最も汎用的な欠測データ解析法であるが、これまでの書籍では理論的な解説が主で、実際の応用事例や具体的な手順の記述が少なかった。そのため、実証分析を行う社会科学者や実務者が多重代入法を実際に活用することにはハードルがあった。 本書は、ワンポイントとして代入法を中心に解説している。平均値のt検定、重回帰分析、ロジスティック回帰分析、時系列分析、パネルデータ分析といった社会科学において頻繁に使用される分析手法に関して、データに欠測が生じている場合に、多重代入法を用いてどのように欠測データを処理していけばよいかを具体的に示している。 事例で扱ったデータとRコードが掲載されているので、読者は本書に示された手順を再現しながら、欠測データの解析法を学んでいくことができる。主に、ウェブ上で入手可能な実データで解説しているので、実践的な技能が身につく。本書は、座学として単に読むだけでなく、ぜひコンピュータ上で実際に処理を体験して欲しい。それが、欠測データの解析法を理解し、修得する近道である。
-
4.0※この電子書籍は固定レイアウト型で配信されております。固定レイアウト型は文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 楽しくわかる、統計学。 平均値のシミュレーションやヒストグラムでの可視化、売上予測に役立つ回帰分析、ロジスティック回帰分析、Webの口コミ情報をテキストマイニング、など……。 統計ツールを駆使して、難事件を見事解決! データ分析にまったく縁のなかった≪僕≫が、探偵事務所に就職し、職場で出会う事件(トラブル?)のなかで、データ分析の基本から高度な手法までを身につけていきます。数理的な知識は不要。商店街の住人たちからのさまざまな無理難題を、社長の天羽さんや助手のいっ子さんとともに、データ分析を駆使して解決していきます。とりわけ、頼りになるのは、フリーソフトのRStudio。統計学もRも初心者レベルの≪僕≫だけど、扱い方からていねいに解説してもらって、なんとかなったぞー! やっと就職が決まった僕の勤め先は「商店街の顧問探偵」をやっているというおかしな興信所。 おまけに仕事に必要なのは、勘や経験ではなく、≪データ分析?!≫ 美人社長・天羽さんには怒鳴られて、かわいい助手のいっ子さんにはやさしくフォローしてもらいつつも、僕のデータ分析修業が、ともかく始まった!
-
-本書は文系理系を問わず、高校卒業レベルの読者が、情報科学とデータ分析の基礎を学ぶための入門書です。とくに「データサイエンス」を理解するための基礎知識と、その関連技術の紹介に重点を置いています。 また、本書は数理・データサイエンス教育強化拠点コンソーシアムが公開しているリテラシーレベルのモデルカリキュラムを参考に構成しています。たとえば、第1章は標準カリキュラムの「1.導入、社会におけるデータ・AI 利活用」に、第2章は「2.基礎、データリテラシー」、第3章は「3. 心得、データ・AI 利活用における留意事項」、第4章は「4.選択、オプション」に相当します。数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル)に 対応させると、第1章が「項目1」と「項目2」、「項目3」に、第2章が「項目5」に、そして第3章が「項目4」に対応しています。
-
4.8近年,確率分布を使った数理モデルをデータにあてはめることで現象の理解と予測を促す「統計モデリング」が注目されている。既存の手法と比べた時の利点は解釈のしやすさと予測のよさの両立である。解釈がしやすいので,モデルに含まれる値を推定した後で次のアクションにつなげやすい。このため現実のデータ解析に極めて有効な手法と評価されている。 背景には,コンピュータの計算速度の向上,大規模のデータが入手しやすくなったこと,モデリングの試行錯誤を極めて簡単にする確率的プログラミング言語の進歩がある。こうした言語の中から,本書ではフリーソフトであるStanを紹介する。Stanは優れたアルゴリズムを搭載し開発も急速に進んでいるパッケージであるが,R用のパッケージであるRStanが並行して公開されているためRから手軽に利用することができる。Stanの記述力は高く,階層モデルや状態空間モデルをわずか30行ほどで書くことができ,推定計算も自動で行なわれる。さらに解析者の問題にあわせたオーダーメイドの拡張が簡単に可能だ。 一般にベイズ統計を扱う書籍は初歩的な内容にとどまるものか,難解な数式が多く実際の問題への応用が難しいものが多い。しかし,本書はこれらの書籍とは一線を画し,現実のデータ解析を念頭に置いて非常に実践的な内容に仕上げた。本書でStanとRを介して身につけた統計モデリングの考え方は,Stanの文法が変化しても,他の統計モデリングツールを扱う場合にも,大いに役に立つと確信している。
-
4.0
-
5.01巻4,400円 (税込)※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 本書は、機械学習コンセプト全般をカバーし、理論的背景とPythonコーディングの実際を解説しています。初歩的な線形回帰から始め、ディープラーニング(CNN/RNN)、敵対的生成ネットワーク、強化学習などを取り上げ、scikit-learnやTensorFlowなどPythonライブラリの新版を使ってプログラミング。第3版では13~16章の内容をほとんど刷新したほか、敵対的生成ネットワークと強化学習の章を新たに追加。機械学習プログラミングの本格的な理解と実践に向けて大きく飛躍できる一冊です。◎本書は『Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow 2, 3rd Edition』の翻訳書です。◎微積分/線形代数、Python の文法、データ分析用ライブラリについてある程度理解している必要があります。[原著の第1版]●ドイツ語、韓国語、中国語、日本語、ロシア語、ポーランド語、イタリア語に翻訳。●ACM(米国計算機学会)の「21st Annual list of Notable Books and Articles(2016)」にランクイン。[日本語の第1版]●「ITエンジニア本大賞2017」ベスト10にランクイン。
-
5.0本書はAIによる画像認識あるいは文章生成の原理や仕組みを実際に自分の手で動かしながら学びたいという方や、生成AIを実生活に応用したいという方向けに構成されています。 本書では、主にクラウド環境のAPIという仕組みを通じて、比較的簡単かつ短いコード(プログラミング言語の命令)で、言語生成AIや画像認識AIを手軽に利用する方法について解説しています。 まずは、本書に記載されている内容を模倣し、実際に自分で動かすことでAI技術にふれ、この体験を通じて、さらにAIを活用するために必要な知識と技術を身に付けること、これが本書の目的となります。
-
3.3ビッグデータ分析をきっかけとして「機械学習」に注目が集まり,ビジネス利用への検討がはじまっています。しかし,実際に「機械学習」を理解しているエンジニアや分析担当者は少なく,うまく活用できていないのが現実です。「機械学習」を利用するにはアルゴリズムの理解,プログラミング技術,ビジネス知識などが必要になってきます。本書では,第1部で機械学習のアルゴリズムやビジネスへの応用方法,流行の深層学習などに触れ,第2部ではPythonを用いた機械学習,画像認識,推薦エンジンなど,サンプルコードをもとに手を動かして試すことができます。機械学習分野で先頭を走る著者陣が,面白く,わかりやすい解説でお届けします。
-
3.5“とある弁当屋”を舞台に、いま話題のデータサイエンティストが活躍するユニークな統計の入門書! 本書では、物語風に統計解析の目的と方法を解説します。具体的には、最近注目を浴びている「データサイエンティスト」を主人公にみたて、顧客であるお弁当屋さんの売上向上を目指して活躍するという筋立てです。主人公が、お店の看板娘に解説するという形式で、統計の基礎概念、方法論、また応用について懇切丁寧に解き明かします。通勤通学の電車の中でも通読できるよう、できるだけ単純化した説明を試みました。そこで、机に向かってじっくり本書の内容を復習したいという読者には、サポートサイトを用意する予定です。統計学なんかまるで縁がなかった、習ったかもしれないけどもう忘れたという社会人や大学生、数学Iの「データの分析」がわけ分からんという高校生に贈ります。
-
5.01巻2,310円 (税込)※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 第3版まで続くロングセラーのPyTorch版! 機械学習の基本から先進的な手法まで本格解説 『機械学習を実践的に学ぶための優れたテキスト』 『多くのトピックを網羅した深い一冊。強力にお勧め』 ―原著への読者の声 本書の前半は、基本的な機械学習ライブラリのscikit-learnを使った手法を解説。 分類の基本モデルに始まり、単層ニューラルネットまでを実装するほか、データ前処理、次元削減、 ハイパーパラメーターのチューニング、アンサンブル学習、回帰分析などを取り上げます。 後半では、PyTorchによるさまざまなディープラーニングの手法を説明。 PyTorchの仕組みを示したあと、CNN/RNN/Transformerといったモデルの実装を解説。 敵対的生成ネットワーク、グラフニューラルネットワーク、強化学習もカバー。 ◎本書は『Machine Learning with PyTorch and Scikit-Learn: Develop machine learning and deep learning models with Python』の翻訳書です。 ◎微積分/線形代数、Pythonの文法、データ分析用ライブラリについてある程度理解している必要があります。
-
4.0本書はPythonによる自然言語処理、あるいはテキストマイニングの初歩について解説したものです。 テキストマイニングとは、テキストをコンピュータで探索(マイニング)する技術の総称です。ここで「テキスト」とは、小説や論文、あるいは新聞や雑誌の記事にとどまらず、インターネット上のブログ、あるいはSNSに投稿された文章など、およそ人間の言葉で書かれたものを指します。 Pythonの基本からテキスト分析の手順、形態素解析器の導入、さまざまな分析手法についてわかりやすく解説しています。また、本書の最後に、ディープラーニングを使ったテキストマイニング事例についても紹介します。 なお、本書の一部については解説動画が用意されています。
-
-最新環境に対応した第3版の登場! データ分析エンジニア必携の 基本技術を習得できる 【本書の概要】 本書はデータ分析エンジニアに必要な 以下の基礎技術について サンプルを交えながら丁寧に解説します。 ・データの取得・加工 ・データの可視化 ・プログラミング ・基礎的な数学の知識 ・機械学習の流れや実行方法 【第3版のポイント】 ・Pythonデータ分析試験の主教材に指定 ・Python 3.13に対応 ・各種ライブラリの最新版への対応 【本書で学べること】 ・Pythonの基本的な文法 ・データフォーマットについて ・データの前処理技術 ・データの可視化技術 ・既存アルゴリズムでの機械学習の実装方法 【対象読者】 データ分析エンジニアを目指す方 【目次】 第1章 データ分析エンジニアの役割 第2章 Pythonと環境 第3章 数学の基礎 第4章 ライブラリによる分析の実践 第5章 応用:データ収集と加工 ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。 ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。 ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。 ※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。
-
-読者の声に応えて第2版の登場! データ分析エンジニアに必要な 基本技術をしっかり習得できる 【本書の概要】 本書はデータ分析エンジニアに必要な 以下の基礎技術を丁寧に解説しています。 ・データの取得・加工 ・データの可視化 ・プログラミング ・基礎的な数学の知識 ・機械学習の流れや実行方法 【第2版のポイント】 ・Python 3.10対応 ・よりわかりやすい解説 ・Pythonデータ分析試験の主教材に指定 【本書で学べること】 ・Pythonの基本的な文法 ・データフォーマットについて ・データの前処理技術 ・データの可視化技術 ・既存アルゴリズムでの機械学習の実装方法 【対象読者】 データ分析エンジニアを目指す方 【目次】 第1章 データ分析エンジニアの役割 第2章 Pythonと環境 第3章 数学の基礎 第4章 ライブラリによる分析の実践 第5章 応用:データ収集と加工 ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。 ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。 ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。 ※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。
-
-※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 <データサイエンス/データ分析の基本技術を体系的に網羅!> <pandasの威力を実感! 効率的なデータ操作と可視化を実践できる> データ分析や機械学習を利用する現場では、データを取り込み、変換/整備する必要があります。 そうしたデータの取り込みや前処理から始め、データ解析をスムーズに進めるための Pythonライブラリとして、pandasが用意されています。 本書では、pandasなどを使ったデータ分析全体の基本手法を体系的・網羅的にカバー。 巻末の付録では、Python環境のインストールや文法などPythonの基本事項も確認できます。 初中級レベルの方がコードを試しながら理解を深めたり、おぼろげな知識について 確認したりすることで、基礎技術の定着やスキルアップが図れる一冊になっています。 「データクリーニング/前処理に慣れてから、モデリングを解説! 解釈しやすい形にデータセットを変更できる」 ※本書は『Pandas for Everyone, 2nd Edition』の翻訳書です。 ■本書の「序文」から抜粋 pandasを使うと、Pythonによるデータ分析が理解しやすくなり、 組織的で保守が可能なデータセットを作ることができ、 しかも(最も重要なことですが)整然としたデータセットが得られます。
-
-「評価指標でXXXという最高のスコアが出た!」と喜び勇んで,機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。 ところが,ビジネス上のKPIと相関が高い評価指標を選んでいなかったために,KPIの推移を見てみると大した変化がありませんでした。 あるいは「毎日夜遅くまで残業をして,特徴量生成とクロスバリデーションによって評価指標を改善しました!」というデータサイエンティストがいたとします。ところが,KPIの改善のためには そこまで高い評価指標の値を達成する必要ありませんでした。このようなケースでは,データサイエンティストが費やした工数がすべて水の泡となってしまいます。----------(はじめにより)---------- このような状況が起きてしまう背景にはさまざまな原因が考えられますが,あえて一言で言うと「データサイエンスの問題が解くべきビジネスの問題と乖離していた」ためです。 機械学習モデルの”良し悪し”を決めるときには,評価指標(Evaluation Metrics)を必要とします。本質的に評価指標の設計方法は自由であり,ビジネス上の価値を考慮して自ら作成することも可能です。RMSEやAUCといったスタンダードなものから,ドメインに特化した数値まで,あらゆる指標が評価指標になりえます。では評価指標はどのように決めるのが良いのでしょうか。また,どのように決めれば冒頭のような悲しい状況を生まずに済むのでしょうか。 本書はこれらの疑問に答えるため,機械学習の良し悪しを決める評価指標を軸に,解くべきビジネスの問題をどうやってデータサイエンスの問題に落とし込むのか,その原理を解説していきます。この原理が普遍的なものであれば,ビジネスがどんなものであっても応用できると考えることができます。 回帰,分類で使用するスタンダードな評価指標についても,基本から丁寧に解説します。本書を読むことで,どのようなケースでどの評価指標を選ぶべきかがわかり,評価指標の読み間違いを避けることができます。
-
-1巻2,398円 (税込)月刊誌『Software Design』の特集や単発企画で評判の良い、機械学習とPython関連の記事を再編纂。機械学習・深層学習に取り組んでいる開発現場のITエンジニアが自身で試して学んだことが記事のベースになっており、いま押さえておくべき技術を習得する足がかりとして最適です。
-
5.0本書は,統計的因果推論の理論(数理的メカニズム)と実装(Rによる数値解析)の両方を統一的にカバーしたものである。具体的には,ハーバード大学統計学科のDonald B. Rubinの提唱した潜在的結果変数の枠組みによる統計的因果推論を扱う。また,データの一部が観測されない場合の因果推論も扱っており,これは類書にはほとんどみられない本書の特徴である。本書の数理的な理論解説は,できるだけ高校数学の範囲内で理解できるように工夫した。微積分や線形代数も,ほぼ登場しない。さらに,必要な数学的知識は,登場する箇所で解説を加えた。また,Rを使った数値計算により,数学が苦手な人にも統計的因果推論のメカニズムを理解してもらえるように工夫している。そして,数式とRコードとの対応関係をRの初心者も理解できるように,できるだけ1行ごとに完結するコードを書くよう心がけた。さらに,Rを使って統計的因果推論の実証研究を行うための実践的な内容も盛り込んでいる。本書の解析結果は,シミュレーション結果を除いて,すべて,本書の中に記載されているRコードを使って再現できるようにした。そして,本書で使用したデータはすべて,本書のサポートページからダウンロードして使用できるので,本書記載のRコードと一緒に活用することで,統計的因果推論を実践的に学ぶことができる。