西田圭介のレビュー一覧
-
ビッグデータに関わる歴史から現時点での全体像が把握できたので非常に満足でした。データの分析基盤構築を個人の環境で実践してみて、より理解を深めたい。Posted by ブクログ
-
技術者としてビッグデータを始めたいときの最初の一冊として良いと思う。
私(ともう一名の仲間)はこれでビッグデータの言葉と意味を覚えて現場に旅立った。
実際、とりあえず読んで理解すれば知ったフリをして話すことができる程度にはなる。
あとはそこから詳しい本を使って覚えていけばいい。Posted by ブクログ -
Hadoopがバズりだした頃、、、だったかな。Hadoopの元はGoogleの研究論文だったりして、その論文などをベースに、Googleのとんでもねークラスタを解説した本。私自身はOracleのシングルノードでほげほげみたいな世界観で仕事してたので、すごい衝撃を受けた。Posted by ブクログ
-
最近(というほど最近でもないかもしれないけど)、BigDataなるキーワードが脚光を浴びているので、事前知識を得るために読んでみました。
ざっくりと概念的に、Google検索がどういうことをやっているのかということがわかるとともに、GFS、MapReduceという大規模分散データ処理を扱う仕組みが...続きを読むPosted by ブクログ -
Googleの基本技術GFS、BigTable、Chubby、MapReduceなどに関する概要解説本。名前だけは聞いたことあったけど、詳しい内容については知らなかったので大変参考になった。最近Hadoopなどがはやってきているので、一見の価値あり。Posted by ブクログ
-
最初に本書の内容はほぼ全てgoogleの発表した論文にあり、英語が読めない人にとってはいい本。
googceのシステムがどのようにして、分散化システムを構築し、そのハードウエアの持てるパワーをいかにひきだしているかがわかる。Googleの検索能力の早さは使用している人ならわかるが、それを支える技術力...続きを読むPosted by ブクログ -
スケールアウトを考慮すると
インフラだけでなくアプリでもかなり考慮が必要ですね
電気代については今まで考えたことなかったー
消費電力ベースのパフォーマンスは目鱗Posted by ブクログ -
一通りデータ処理する基盤構成はわかった。
具体的にデータ分析基盤を作り込むときに、どのような製品を使用するか/どう作り込むかのイメージはまだつかない。
たとえば、
・データレイク/データウェアハウス/データマートのそれぞれの概念はわかったが、それにあたる製品/ツールのマッピングや作り込み方、それぞれ...続きを読むPosted by ブクログ -
googleの検索レスポンスは恐ろしく速い。私は仕事柄、どんなソフトを見ても、なんとなくその構造を想像できるが、googleだけは全くわからない。なぜ、あれほど堅牢に、あれほど正確、あれほど速いのか?それに答えるのが本書である。 まず、最初に一般的な検索サイトの技術要件をて定義し、googleの検索...続きを読むPosted by ブクログ
-
Googleを支える技術の入り口を見せてくれる本。Googleでは細かい部分まで綿密に設計されていることがわかる。消費電力のくだりは新鮮であり勉強になった。Posted by ブクログ
-
「ハードディスクはいつ壊れるか」
年間平均故障率(AFR)…いつどこで作られたかが重要
利用頻度には相関がみられない
温度は低い方が故障しやすい傾向(25℃以下)
故障率に大きく影響するSMART値
①スキャンエラー、②リアロケーション数、③オフラインリアロケーション、④リアロケーション前のセクタ数...続きを読むPosted by ブクログ -
MapReduceとHadoopでビッグデータの知識が止まっている自分でも(もちろん全てを理解できたわけではないが)読める分かりやすさ。メッセージ配送とストレージを扱った第4章が特に面白かった。第5章のワークフローの話も合わせてMQって当たり前に使ってるけど信頼性を考えると奥が深い。Posted by ブクログ
-
前半はざっくりと検索システムの仕組みについて述べ、その後で Google でどのように実現しているかを解説。
こういうシステム/アーキテクチャに興味がある人には、
面白い本だと思います。Posted by ブクログ -
技術者にとって興味深い内容がたくさん書いてある。
ただ、実際にそこで開発に携わらない限り必要なさそうな
詳細な記述まであって、ところどころ難解な箇所がある。Posted by ブクログ -
フォトリーディングNo.53
目的:Google技術をおさらい
トリガーワード:Web検索エンジン、インデックス、クローラ、ランキング、データセンター、クラスタ、分散、GFS、マスタ、チャンクサーバ、クライアント、レコード、スナップショット、障害対策、ビッグテーブル、タブレットサーバ、キャッシュ...続きを読むPosted by ブクログ -
Googleを支える仕組みを、ソフト、ハードだけでなく、組織の仕組みまで含めて解説。
ためになる内容が多いんだけど、特に序盤から中盤は教科書っぽくて読みづらい。もっと興味の強くなった時にまた読みたいかも。Posted by ブクログ -
世界的に使われているGoogleのシステムアーキテクチャ概要を解説した本である。細かな話が出てくるため、非常に読みにくく理解しにくいが、大まかに言うと、安価なPCレベルの機器を大量に利用することでスケールアウトしている点、GFSという分散ファイルシステムを利用している点、MapReduceによる分散...続きを読むPosted by ブクログ
-
MapReduceの仕組みや検索エンジンの仕組みが書かれた良書。
執筆時点でここまで書けるのはすごい。著者を尊敬する。Posted by ブクログ -
〇感想
・良かったところ:
・世界中のウェブから高速でデータを検索する
Googleの技術を知ることができた。
Googleはウェブから事前にページを探し、
検索に適する形式で内部データベースに保存しておく。
それをベースにユーザーのキーワードで検索する。
...続きを読むPosted by ブクログ -
分散技術のあたりは専門的な内容となっていて結構頭を使った.技術的に理解はできても絶対自分じゃ実装できないだろうなーって思いながら読んでいた.最後の章のGoogleの開発体制とか面白かった.運営って難しいのね.Posted by ブクログ