西内啓のレビュー一覧
-
Posted by ブクログ
未来を予想するための理論としてペイズ定理というのがある。過去の情報に基づいて未来を予想する。しかし、過去の情報には、重要な情報であるシグナルと、誤情報であるノイズとがある。ノイズによってバイアスがかかり、誤った予想がなされてしまう。そこで、結果と照らし合わせて、確率論的に次の予想を行う。これを何度も繰り返すことで、より正確な予想が行えるようになる。これは、気象予想やチェスでは威力を発揮する。正確なフィードバックが得られ、コンピュータの力、特に生成AIの力を存分に発揮できるからだ。一方、地震や経済のように、システムが複雑で、予想が正しかったか否かの検証が難しい場合には、コンピュータでは対応出来な
-
Posted by ブクログ
実地での統計的手法の活用方法の基本(アウトカムを高めたいときの施策の抽出に限り、平均値などの現状分析や株価の予測などに関する内容はあまり掲載されていない。)がよくわかった。
データを整理したら、まずは重回帰分析(アウトカムが量的)かロジスティクス分析(アウトカムが質的)で影響している説明変数を見抜き、当該変数を操作することでアウトカムを変えられるのかどうか(当該説明変数とアウトカムの関係が、因果関係なのか相関関係なのか)をランダム化比較実験で検証し、その検証にあたってはz検定やt検定を行うと。
結局、χ2乗検定や分散分析は実用上あまり出番はないということか。
帰無仮説平均と対立仮説平均の差と、 -
Posted by ブクログ
経営戦略、人的資本管理、マーケティング、オペレーションの順にデータ分析と活用の手法を具体的に解説した良書。
共通するのは、適切なデータ分析対象範囲を決め、適切なアウトカム(=目的変数)を設定し、これに関係しそうな説明変数候補を決め(この時、先行研究で使えるものがあれば大いに参考にする)、ステップワイズ法などで説明変数を適度な数に縮約し、重回帰分析やロジスティクス分析により有意な説明変数を特定し、これを変えることでアウトカムに良い効果が出るかをランダム化テストで検証して改善に繋げる、という流れ。
そのうえで、それぞれのデータ活用におけるポイントもしっかり解説されていた。
経営戦略に関するデータ活 -
Posted by ブクログ
本書を選んだ理由
私自身の目下の業務には今のところ絡んでいないのですが、個人的に最近、AI・機械学習のセミナーに参加しました。その講師の先生が「専門家以外の人がAIや機械学習を学ぶ場合でも、統計学の基本だけは押さえておくべき」と言っていたため、本書を手に取りました。
「なぜ統計学が最強の学問」と言えるのか?
論をするにしても不可欠なプロセスとなるからだ” と本書では言っています。また、統計学を知っているかどうか?が結果を分ける事例として、本書の中に「あみだくじで買い出し当番を決める」と言う筆者の研修者時代の経験が出てきます。あみだくじについて私はこれまで、選んだところによってたどり着く結果が -
Posted by ブクログ
ただでさえ統計学のビジネス利用を主軸としたシリーズの「ビジネス編」ということで、どこまでビジネスに特化した内容なのかと期待と疑問を同時に抱きながらも手に取る。
前回までの内容と同じく統計学に関する前提知識はほとんど仮定されていないと言える。結果的にビジネスでどのように分析するのかの詳細な具体的な例があるわけではないので実際に手を動かして勉強することを期待するとがっかりするかもしれない。
しかし、統計学をビジネスの場面で活用する上で「著者はここまで広範な知識を持っているのか」と驚かされる一冊だった。
「AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]」などのデータ分析系 -
Posted by ブクログ
〇学んだこと
1.あみだくじは、当たりたければ真ん中・外れたければ一番外側を引くこと
2.サンプリング調査と標準偏差の関係(コストメリットを考える)
3.解析はそれ自体価値があるものではなく、それを活かして何を行い、どれだけの価値を得られるのか
4.十分なデータと適切な比較を行うこと(その際、比較している対象がフェアであるかどうかをチェック)
5.統計学的な裏付けもないのに、それが絶対誤りだと決めつけることも愚か
6.ランダム化の3つの壁(現実・倫理・感情)
7.統計学的に、遺伝や人種に基づいて差別するメリットは存在しない
8.一般線形化モデルの表(結果変数(連続・ありなし)と説明変数(2・多 -
Posted by ブクログ
標準誤差が見込まれる差の3分の1になるようにサンプル数を設定すれば、検出力は85%になる(有意水準5%の1.96+検出力85%の1.04)。
顧客の退会までの期間は、生存時間解析を用いることができる。
複数の時点のデータを個体差を捉える情報として扱う経時データ分析では、混合効果モデルが用いられる。
因子得点を回帰モデルの説明変数にするよりも、共分散構造分析(構造方程式モデリング)を使う方がよい。
因子分析の応用として、表面的な反応に対する潜在的な力を明らかにする項目反応理論がある。
傾向スコアを用いた代表的な手法として、周辺構造モデルがある。