あらすじ
「サービスのデザインはログのデザインから。」良いサービスを作り上げるには,ログデータを収集し,改善を続けるシステムの構築が必要です。本書は,ログデータを効率的に収集するFluentdをはじめ,データストアとして注目を集めているElasticsearch,可視化ツールのKibanaを解説します。本書を通して,ログ収集,データストア,可視化の役割を理解しながらデータ分析基盤を構築できます。2014年に刊行した「サーバ/インフラエンジニア養成読本ログ収集 可視化編」の記事をもとに最新の内容に加筆しています。
...続きを読む感情タグBEST3
Posted by ブクログ
1章 データ分析の概要
2章 ログデータの基礎
3章 データ分析基盤の構築
4章 データ分析基盤の運用
5章 ログ収集ミドルウエアの紹介
概要の紹介
6章 はじめてみようFluentd
データ転送ツールであるFluentdの説明。Input->Filter->OutPutとプラグインを活用してストリームデータを流していくデータのルーティングの基本となっているのはタグとラベル。
treasuredata社がメンテナンスしている。
7章 Fluentd設計のこつ
tailプラグインの使い方、Fluentdノードのデザインパターン。これはFluentdを複数配置させ末端のFluentdノードには無理をさせずアグリゲ-タノードでデータ集約させて通信量を抑えるなど工夫を紹介。Fluentdを多重化配置させ障害につよい構成。
8章 Fluentd運用Tips
Fluentdの監視、性能評価について紹介。ログ欠損対策であるバッファリングの設定など。
第3部 Elasticsearch,kibanaは省略
Appendix Embulk、Digdag入門
EmbulkこのツールもおもしろいFluentdと同じ作者さんがつくっているとか
Posted by ブクログ
fluentdは本当にすごい発明だと思う。
データストアと可視化ツールは本書でも触れられているように、Elasticsearch以外に選択肢が沢山ある。
データのストリーミングはfluentd以外もう考えられない。
プラグインを書いてくれている方たちには感謝してる。
Posted by ブクログ
会社にあったので読んでみました。
Splunk や Elasticsearch などの基盤を一通り解説。
あくまで基盤の本なので、「どういう分析ができるか?」といった点はありません。