検索結果

  • データ分析失敗事例集 失敗から学び、成功を手にする
    値引きあり
    4.6
    【その分析、もう失敗しているかも…… 失敗を回避し、成功に近づくためのガイド】 本書は、第一線で活躍するデータサイエンティストたちが経験した、データ分析プロジェクトの「失敗」をもとに再構成された25の事例が収録されている。これらの臨場感あふれる事例から、データの活用に関わる人たちが、失敗を避けるために何をしてはならないのか、について学びとることができる。プロジェクトの失敗の予兆となる致命的な要因を察知し、失敗に至る「毒薬」を飲まないように注意するための知見が本書には随所に含まれている。 データの活用に関わる分析者、そして、分析を依頼する立場となる経営者や企画部、マーケティング部に所属する方々に送る、失敗から学び、成功への道筋を描くための必読書――失敗は成功の母である!
  • 効果検証入門~正しい比較のための因果推論/計量経済学の基礎
    4.2
    ビジネスで利用されるデータの多くは,その施策の意思決定を行う人物や組織の目的にそった活動の延長上で作られています。具体的には,DM送付などの広告施策であれば,担当者はユーザの反応率を上げるために,反応しやすいであろうユーザに対してのみDMを発送します。ここで発生したデータでDMの効果を計る場合,単純にDMを受け取っているか否かで結果を比較することは,DMの効果以外にも意図的にリストされたユーザの興味や関心を含んでしまうことになります。 データが生まれるプロセスに人の意思が関わる場合,単純な集計では判断ミスとなる可能性があります。わずかな計算の狂いでも後々のビジネスにおいて大きな影響を及ぼすことになるため,バイアスのない状態で効果検証できることが望まれるのです。 本書では「単純に比較すると間違った結論に導くデータ」から,より正しい結果を導くための分析手法と考え方を提供します。計量経済学における効果とは何か? を提示し,RCT(ランダム化比較試験)がいかに理想的な方法かを説明し,RCTができない場合でも因果推論を用いてRCTの再現が可能だということを説明していきます。
  • 評価指標入門~データサイエンスとビジネスをつなぐ架け橋
    -
    「評価指標でXXXという最高のスコアが出た!」と喜び勇んで,機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。 ところが,ビジネス上のKPIと相関が高い評価指標を選んでいなかったために,KPIの推移を見てみると大した変化がありませんでした。 あるいは「毎日夜遅くまで残業をして,特徴量生成とクロスバリデーションによって評価指標を改善しました!」というデータサイエンティストがいたとします。ところが,KPIの改善のためには そこまで高い評価指標の値を達成する必要ありませんでした。このようなケースでは,データサイエンティストが費やした工数がすべて水の泡となってしまいます。----------(はじめにより)---------- このような状況が起きてしまう背景にはさまざまな原因が考えられますが,あえて一言で言うと「データサイエンスの問題が解くべきビジネスの問題と乖離していた」ためです。 機械学習モデルの”良し悪し”を決めるときには,評価指標(Evaluation Metrics)を必要とします。本質的に評価指標の設計方法は自由であり,ビジネス上の価値を考慮して自ら作成することも可能です。RMSEやAUCといったスタンダードなものから,ドメインに特化した数値まで,あらゆる指標が評価指標になりえます。では評価指標はどのように決めるのが良いのでしょうか。また,どのように決めれば冒頭のような悲しい状況を生まずに済むのでしょうか。 本書はこれらの疑問に答えるため,機械学習の良し悪しを決める評価指標を軸に,解くべきビジネスの問題をどうやってデータサイエンスの問題に落とし込むのか,その原理を解説していきます。この原理が普遍的なものであれば,ビジネスがどんなものであっても応用できると考えることができます。 回帰,分類で使用するスタンダードな評価指標についても,基本から丁寧に解説します。本書を読むことで,どのようなケースでどの評価指標を選ぶべきかがわかり,評価指標の読み間違いを避けることができます。
  • 施策デザインのための機械学習入門~データ分析技術のビジネス活用における正しい考え方
    4.0
    予測に基づいた広告配信や商品推薦など,ビジネス施策の個別化や高性能化のために機械学習を利用することが一般的になってきています。その一方で,多くの機械学習エンジニアやデータサイエンティストが,手元のデータに対して良い精度を発揮する予測モデルを得たにもかかわらず,実際のビジネス現場では望ましい結果を得られないという厄介で不可解な現象に直面しています。実はこの問題は,機械学習の実践において本来必要なはずのステップを無視してしまうことに起因すると考えられます。機械学習を用いてビジネス施策をデザインする際に本来踏むべき手順を無視して予測精度の改善だけを追い求めると,「解くべき問題の誤設定」や「バイアス」といった落とし穴に気づかぬうちにハマってしまうのです。 この問題を解決するためには,機械学習のビジネス応用において必要となる前提条件を着実にクリアしなくてはなりません。しかし多くの現場では,「学習」や「予測精度」などに関する手法やテクニックのみに注目してしまう傾向があり,「機械学習にどのような問題を解かせるべきなのか」「実環境と観測データの間の乖離(バイアス)の問題にどのように対処すべきか」といった効果的なビジネス施策をデザインするために重要な観点が軽視されがちです。機械学習をビジネス施策に活かすための前提が整えられていないにもかかわらず,発展知識を身に付けたり論文の内容をそのまま実装したところで,望ましい結果を継続的に得ることは難しいのです。 本書では,ビジネス施策を自らの手で導くために必要な汎用的な考え方を身につけることを目指します。そのため本書ではまず,機械学習をビジネス現場で活用する際に本来踏まねばならないステップを明文化した汎用フレームワークを導入します。そしてその汎用フレームワークを活用しながら,効果的な施策を自らの手で導出する「施策デザイン」の流れを繰り返し体験します。これまで軽視されてきた「機械学習の威力を担保するために必要な前提のステップ」をフレームワークとして明文化し,データから施策を導くプロセスを自らデザインするという斬新なコンセプトで,ビジネスにおける変幻自在/臨機応変な機械学習の応用を可能にすることが,本書の最終目標です。
  • モデル オブ ザ マインド~脳を読み解く。物理学・工学・数学によるアプローチ
    NEW
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 ◆脳の解明に挑んだ数々の研究者たちの功績をたどる一冊◆ 読者を魅了しつつも平易であり、夢中にさせる科学史であると同時に、神経科学の最前線への優れた案内役ともなっている。 ―――リアム・ドリュー(サイエンスライター、神経生物学博士) 脳に関する我々の研究と、脳を理解するための科学的洞察を集めた一冊。 ―――ラリー・アボット(コロンビア大学理論神経科学センター教授) グレース・リンゼイはこの研究分野の魅力を十二分に語っており、難解なテーマを巧みな筆致と機知に富んだ表現で解き明かしている。 ―――ショーン・キャロル(ジョンズ・ホプキンズ大学自然哲学科教授)  人間の脳は約850億個のニューロンで構成されており、それらは100兆以上のシナプスによって結びついている。1世紀以上にわたり、たくさんの研究者たちが、これらのニューロンが何をしているのか、どのように情報をやりとりし、どのようにして思考や知覚、行動を生み出すのかを記述するための「言語」を探し求めてきた。そして求めていた言語こそ数学であり、数学なしには今日のように脳を理解することはできなかっただろう。  『Models of the Mind』では、著者であり計算論的神経科学者のグレース・リンゼイが、数学的モデルがどのようにして意思決定や感覚処理、記憶の定量化など、脳のさまざまなプロセスの解明に貢献してきたのかを解説する。現代神経科学の最も重要な概念を紹介するとともに、数学的モデリングという抽象的な世界と、生物学の複雑で混沌とした現実とがぶつかることで生じる緊張関係にも光を当てる。  各章では、神経科学の特定の分野に適用されてきた数学的手法に焦点を当て、脳の最も基本的な構成要素である個々のニューロンから始まり、相互作用するニューロンの回路、脳の領域全体、そして脳が制御する行動へと進んでいく。  リンゼイはこの分野の歴史を振り返り、18世紀後半にカエルの脚を使って行われた実験から始まり、現代の人工知能の基盤となる大規模な人工ニューラルネットワークのモデルへと至る過程を探求する。そして、神経科学という精緻な機構を記述するうえで、数学という優雅な言語が持つ価値を明らかにしていく。 ■目次 1章 球形の牛~数学が提供するもの 2章 ニューロンが発火する仕組み~漏れ積分発火モデルとホジキン・ハクスリーニューロン 3章 計算能力の獲得~マカロック・ピッツモデル、パーセプトロン、人工ニューラルネットワーク 4章 記憶の形成と維持~ホップフィールドネットワークとアトラクター 5章 興奮と抑制~バランスのとれたネットワークと振動 6章 視覚の発達~ネオコグニトロンと畳み込みニューラルネットワーク 7章 神経符号の解読~情報理論と効率的符号化 8章 低次元空間における運動制御~動力学、運動学、そして次元削減 9章 構造から機能へ~グラフ理論とネットワーク神経科学 10章 合理的な意思決定の方法~確率とベイズの法則 11章 報酬が行動選択に与える影響~時間差分と強化学習 12章 脳の大統一理論~自由エネルギー原理、1000の脳理論、そして統合情報理論 ■著者プロフィール Grace Lindsay(グレース・リンゼイ):ニューヨーク大学アシスタントプロフェッサー。2018年にコロンビア大学の理論神経科学センターで博士号を取得。その後、ユニバーシティ・カレッジ・ロンドンで博士研究員を務め、感覚処理を探求する数理モデルの構築に焦点を当てた研究を行う。それ以前は、ピッツバーグ大学で神経科学の学士号を取得し、ドイツのフライブルクにあるベルンシュタイン計算神経科学センターに在籍。2016年には、計算神経科学のGoogle PhDフェローシップを授与され、複数の国際会議で講演を行った。 ■訳者プロフィール 市川太祐(いちかわだいすけ):医師・医学博士。現職は キバロク株式会社 代表取締役。医師としての知見と、電子カルテ/健診/レセプト等の医療ビッグデータを統計解析・AIで扱うデータサイエンスの専門性を併せ持ち、医療の質と効率を改善するソリューションの提供に注力している。 高柳 慎一(たかやなぎしんいち):2020 年 総合研究大学院大学複合科学研究科博士課程修了、博士(統計科学)。著書、監修書等多数。 牧山幸史(まきやまこうじ):LINEヤフー株式会社データサイエンティスト 兼 株式会社ホクソエム代表取締役社長。翻訳書多数
  • 前処理大全[データ分析のためのSQL/R/Python実践テクニック]
    4.3
    データサイエンスの現場において,その業務は「前処理」と呼ばれるデータの整形に多くの時間を費やすと言われています。「前処理」を効率よくこなすことで,予測モデルの構築やデータモデリングといった本来のデータサイエンス業務に時間を割くことができるわけです。本書はデータサイエンスに取り組む上で欠かせない「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。ほとんどの問題についてR,Python,SQLを用いた実装方法を紹介しますので,複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。
  • 統計的因果推論の理論と実装 潜在的結果変数と欠測データ
    5.0
    本書は,統計的因果推論の理論(数理的メカニズム)と実装(Rによる数値解析)の両方を統一的にカバーしたものである。具体的には,ハーバード大学統計学科のDonald B. Rubinの提唱した潜在的結果変数の枠組みによる統計的因果推論を扱う。また,データの一部が観測されない場合の因果推論も扱っており,これは類書にはほとんどみられない本書の特徴である。本書の数理的な理論解説は,できるだけ高校数学の範囲内で理解できるように工夫した。微積分や線形代数も,ほぼ登場しない。さらに,必要な数学的知識は,登場する箇所で解説を加えた。また,Rを使った数値計算により,数学が苦手な人にも統計的因果推論のメカニズムを理解してもらえるように工夫している。そして,数式とRコードとの対応関係をRの初心者も理解できるように,できるだけ1行ごとに完結するコードを書くよう心がけた。さらに,Rを使って統計的因果推論の実証研究を行うための実践的な内容も盛り込んでいる。本書の解析結果は,シミュレーション結果を除いて,すべて,本書の中に記載されているRコードを使って再現できるようにした。そして,本書で使用したデータはすべて,本書のサポートページからダウンロードして使用できるので,本書記載のRコードと一緒に活用することで,統計的因果推論を実践的に学ぶことができる。

    試し読み

    フォロー

最近チェックした作品からのおすすめ