あらすじ
(概要)
多彩な技術の集合体。
ビッグデータの今。
スマホで買い物をして,翌日には届けてもらえる。たとえば,このような身近な場面でも,背後では決済/在庫管理/配送をはじめとした複数のシステムが連携して動いています。
コンピュータの性能向上に伴い,機械学習をはじめとした,データを活かすシステム開発への期待は高まる一方です。今後,システム規模の大小を超えて「データ処理そのものをシステムの一部とする」技術への需要は増していくでしょう。
データ処理をどのようにシステム化するか。
本書ではこのエンジニアリングの問題に主軸を置き,可視化を例に,一連のデータ処理に必要な要素技術を整理しデータを効率良く扱うための土台を作り,その上でシステムの自動化をサポートする種々の技術を追っていきます。
感情タグBEST3
Posted by ブクログ
技術者としてビッグデータを始めたいときの最初の一冊として良いと思う。
私(ともう一名の仲間)はこれでビッグデータの言葉と意味を覚えて現場に旅立った。
実際、とりあえず読んで理解すれば知ったフリをして話すことができる程度にはなる。
あとはそこから詳しい本を使って覚えていけばいい。
Posted by ブクログ
一通りデータ処理する基盤構成はわかった。
具体的にデータ分析基盤を作り込むときに、どのような製品を使用するか/どう作り込むかのイメージはまだつかない。
たとえば、
・データレイク/データウェアハウス/データマートのそれぞれの概念はわかったが、それにあたる製品/ツールのマッピングや作り込み方、それぞれの連携のさせ方はイメージがつかない。
・ETLはデータ加工するという概念的なものだと思うが、どのように加工するものなのかわからない(非構造化データを構造化データにすることなのか、それ以外の何かしらの加工も含むのか、、)
など。
実際に手を動かしてみないと、イメージは掴めなそう。