西田圭介のレビュー一覧

  • [増補改訂]ビッグデータを支える技術——ラップトップ1台で学ぶデータ基盤のしくみ

    Posted by ブクログ

    ビッグデータに関わる歴史から現時点での全体像が把握できたので非常に満足でした。データの分析基盤構築を個人の環境で実践してみて、より理解を深めたい。

    0
    2021年06月26日
  • ビッグデータを支える技術 刻々とデータが脈打つ自動化の世界

    Posted by ブクログ

    技術者としてビッグデータを始めたいときの最初の一冊として良いと思う。
    私(ともう一名の仲間)はこれでビッグデータの言葉と意味を覚えて現場に旅立った。
    実際、とりあえず読んで理解すれば知ったフリをして話すことができる程度にはなる。

    あとはそこから詳しい本を使って覚えていけばいい。

    0
    2019年03月03日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    最近(というほど最近でもないかもしれないけど)、BigDataなるキーワードが脚光を浴びているので、事前知識を得るために読んでみました。

    ざっくりと概念的に、Google検索がどういうことをやっているのかということがわかるとともに、GFS、MapReduceという大規模分散データ処理を扱う仕組みがわかりました。
    また、本書では基本的にざっくりとした構造・仕組みの説明をしているのですが、随所に原典論文URLが書かれていて、詳しく調べるのにも便利だと思います。(自分は、たぶんそこまで読み込まないけどw)

    わかりやすく、内容も適度な詳細さですので、私はかなりの良書だと思います。

    0
    2012年03月04日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    Googleの基本技術GFS、BigTable、Chubby、MapReduceなどに関する概要解説本。名前だけは聞いたことあったけど、詳しい内容については知らなかったので大変参考になった。最近Hadoopなどがはやってきているので、一見の価値あり。

    0
    2011年07月10日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    最初に本書の内容はほぼ全てgoogleの発表した論文にあり、英語が読めない人にとってはいい本。
    googceのシステムがどのようにして、分散化システムを構築し、そのハードウエアの持てるパワーをいかにひきだしているかがわかる。Googleの検索能力の早さは使用している人ならわかるが、それを支える技術力というのは想像を絶する。
    中でも興味深いのは、Googleは
    一度検索するとコーヒー2杯分のお湯が沸くといわれるほど電力消費が激しいと言われているが、そのサーバの電力は緻密に計算された上での、最低限の電力消費であり、最高に高いの電力効率で運営されている事がわかる。

    0
    2011年07月08日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    スケールアウトを考慮すると
    インフラだけでなくアプリでもかなり考慮が必要ですね

    電気代については今まで考えたことなかったー
    消費電力ベースのパフォーマンスは目鱗

    0
    2010年01月20日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    現在のIT業界を牽引するとも言える企業のGoogle。
    そのGoogleのビジネスの根底にあるものは当然ITとしての基盤と技術。
    それを公開されている確かなる情報を基に、
    丁寧にわかりやすく解説、まとめてくれている。
    クラウドコンピュータから、CPUの電源効率まで、一挙大公開。

    元々がまとまっているから、要約しにくい・・・。
    以下ほぼ単語抜粋。

    ○Google的意味のあるページの評価基準(今は昔)
     −PageRank:ページリンクを得点する
     −アンカーテキスト:アンカーされていたら得点する

    ○インデックス構造:文字を数値にすることで二つのメリット
     −コンパクトになり、ディスクのシー

    0
    2009年10月07日
  • ビッグデータを支える技術 刻々とデータが脈打つ自動化の世界

    Posted by ブクログ

    一通りデータ処理する基盤構成はわかった。
    具体的にデータ分析基盤を作り込むときに、どのような製品を使用するか/どう作り込むかのイメージはまだつかない。
    たとえば、
    ・データレイク/データウェアハウス/データマートのそれぞれの概念はわかったが、それにあたる製品/ツールのマッピングや作り込み方、それぞれの連携のさせ方はイメージがつかない。
    ・ETLはデータ加工するという概念的なものだと思うが、どのように加工するものなのかわからない(非構造化データを構造化データにすることなのか、それ以外の何かしらの加工も含むのか、、)
    など。
    実際に手を動かしてみないと、イメージは掴めなそう。

    0
    2020年02月14日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    googleの検索レスポンスは恐ろしく速い。私は仕事柄、どんなソフトを見ても、なんとなくその構造を想像できるが、googleだけは全くわからない。なぜ、あれほど堅牢に、あれほど正確、あれほど速いのか?それに答えるのが本書である。 まず、最初に一般的な検索サイトの技術要件をて定義し、googleの検索システムの概要説明を行う。大枠のアーキテクチャがなんとなくわかったところで、システムの重要な概念、モジュールであるgfs、bigtabel、MapReduceなどの詳細を解説。ここでのキーワードは、「大容量」である。googleのシステムは、全世界からダウンロードしてきた大量データに特化したアーキテ

    0
    2018年10月23日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    Googleを支える技術の入り口を見せてくれる本。Googleでは細かい部分まで綿密に設計されていることがわかる。消費電力のくだりは新鮮であり勉強になった。

    0
    2018年10月07日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    ネタバレ

    「ハードディスクはいつ壊れるか」
    年間平均故障率(AFR)…いつどこで作られたかが重要
    利用頻度には相関がみられない
    温度は低い方が故障しやすい傾向(25℃以下)
    故障率に大きく影響するSMART値
    ①スキャンエラー、②リアロケーション数、③オフラインリアロケーション、④リアロケーション前のセクタ数(ProbationalCount)
    SMART値に関係なくいきなり壊れるものもある。
    すべてを予測するのは難しく、壊れる前提での設計が必要。

    「Googleのソフトウェア開発」
    小人数(2~6人)のプロジェクトチーム
    就業時間の20%を新しいことに費やす20%ルール
    コードレビューを通じてコーデ

    0
    2018年05月19日
  • ビッグデータを支える技術 刻々とデータが脈打つ自動化の世界

    Posted by ブクログ

    ‪MapReduceとHadoopでビッグデータの知識が止まっている自分でも(もちろん全てを理解できたわけではないが)読める分かりやすさ。メッセージ配送とストレージを扱った第4章が特に面白かった。第5章のワークフローの話も合わせてMQって当たり前に使ってるけど信頼性を考えると奥が深い。‬

    0
    2017年11月18日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    前半はざっくりと検索システムの仕組みについて述べ、その後で Google でどのように実現しているかを解説。
    こういうシステム/アーキテクチャに興味がある人には、
    面白い本だと思います。

    0
    2015年07月19日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    技術者にとって興味深い内容がたくさん書いてある。
    ただ、実際にそこで開発に携わらない限り必要なさそうな
    詳細な記述まであって、ところどころ難解な箇所がある。

    0
    2013年08月07日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    ネタバレ

    フォトリーディングNo.53

    目的:Google技術をおさらい

    トリガーワード:Web検索エンジン、インデックス、クローラ、ランキング、データセンター、クラスタ、分散、GFS、マスタ、チャンクサーバ、クライアント、レコード、スナップショット、障害対策、ビッグテーブル、タブレットサーバ、キャッシュ、コミットログChubby、バックアップ、ロック、イベント、MapReduce、キー、値、シャッフル、分散、grep、分散ソート、アグリゲータ、電力、クロック周波数、SMART値、開発、コードレビュー

    質問:①インデックスをどのようにつくって使うのか?
    ②Googleの初見重要そうな技術は?

    0
    2013年01月01日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    ネタバレ

    Googleを支える仕組みを、ソフト、ハードだけでなく、組織の仕組みまで含めて解説。
    ためになる内容が多いんだけど、特に序盤から中盤は教科書っぽくて読みづらい。もっと興味の強くなった時にまた読みたいかも。

    0
    2012年11月13日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    世界的に使われているGoogleのシステムアーキテクチャ概要を解説した本である。細かな話が出てくるため、非常に読みにくく理解しにくいが、大まかに言うと、安価なPCレベルの機器を大量に利用することでスケールアウトしている点、GFSという分散ファイルシステムを利用している点、MapReduceによる分散データ処理、障害が起こることを前提とした運用設計などが特徴としてあげられる。

    0
    2012年06月14日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    MapReduceの仕組みや検索エンジンの仕組みが書かれた良書。
    執筆時点でここまで書けるのはすごい。著者を尊敬する。

    0
    2012年05月31日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    ネタバレ

    〇感想
     ・良かったところ:
       ・世界中のウェブから高速でデータを検索する
        Googleの技術を知ることができた。

        Googleはウェブから事前にページを探し、
        検索に適する形式で内部データベースに保存しておく。
        それをベースにユーザーのキーワードで検索する。
      
        それを支えるのが、インデックスや分散コンピューティング。
        Google=検索エンジンとしか考えず、
        中身については知らなかったが、理解が深まった。   

     ・悪いところ
      ・プログラミングを記載して多くのページを割いているが、
       クローラなど重要なことを詳しく書

    0
    2012年03月12日
  • Googleを支える技術 ……巨大システムの内側の世界

    Posted by ブクログ

    分散技術のあたりは専門的な内容となっていて結構頭を使った.技術的に理解はできても絶対自分じゃ実装できないだろうなーって思いながら読んでいた.最後の章のGoogleの開発体制とか面白かった.運営って難しいのね.

    0
    2011年10月05日