あらすじ
※この電子書籍は固定レイアウト型で配信されております。固定レイアウト型は文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
一般的に調査・観測データには欠測が生じることが多く、適切な欠測データの処理をしなければ、解析結果に偏りが生じることがある。多重代入法は、尤度解析法と並んで最も汎用的な欠測データ解析法であるが、これまでの書籍では理論的な解説が主で、実際の応用事例や具体的な手順の記述が少なかった。そのため、実証分析を行う社会科学者や実務者が多重代入法を実際に活用することにはハードルがあった。
本書は、ワンポイントとして代入法を中心に解説している。平均値のt検定、重回帰分析、ロジスティック回帰分析、時系列分析、パネルデータ分析といった社会科学において頻繁に使用される分析手法に関して、データに欠測が生じている場合に、多重代入法を用いてどのように欠測データを処理していけばよいかを具体的に示している。
事例で扱ったデータとRコードが掲載されているので、読者は本書に示された手順を再現しながら、欠測データの解析法を学んでいくことができる。主に、ウェブ上で入手可能な実データで解説しているので、実践的な技能が身につく。本書は、座学として単に読むだけでなく、ぜひコンピュータ上で実際に処理を体験して欲しい。それが、欠測データの解析法を理解し、修得する近道である。
感情タグBEST3
予備知識必須
この本はいわば初学者向けというより研究者やある程度の熟達者向けといった印象を受けました。予備知識の薄い自分としてはかなり読むのが大変だったので雰囲気を掴むことだけを意識して結構読み飛ばしてしまいました、、、。
Posted by ブクログ
電力消費実績の時系列データの欠損値の処理に悩んでいたため購入。
Rユーザーであれば、容易に本書の内容を再現することができる。統計学の知識に乏しい私にとって、FCSアルゴリズムやEMBアルゴリズムはやや難解であった。しかしながら、5つの観測値を用いたブートストラップや単変量のEMアルゴリズムの具体的なコードなどが示されており、理解への助けとなった。
特に、”第11章 時系列データの多重代入法:ARIMAモデル”はとても参考になった。しかし、モデルの診断プロセスについて疑問が残った。時系列データの欠損値の補定は、ameliaによる代入モデルではなく、m個の代入済みデータに対するARIMAモデルから行うのであろうか?