あらすじ
クラウド基盤として広く利用されているAmazon Web Services(AWS)の活用技法について、初学者の方にもわかるようにわかりやすく解説します。AWSの概要や歴史、基礎知識、関連知識の学習方法に始まり、最近のAWS開発で求められるWebアプリケーション構築のポイント、サーバレスアプリケーション開発、さらにデータ収集、分析と可視化までを1冊で学ぶことができます。AWSの膨大な製品・ソリューション群の中でも読者が開発・運用でAWSを利用するために理解しておくべきポイントを、最新の技術トレンドを踏まて具体的に解説しました。
...続きを読む感情タグBEST3
Posted by ブクログ
4章のデータ分析基盤のところが非常にわかりやすかった。
データレイクは構造データ、非構造データを全部一緒に保存しておく箱。ストレージでAWSだとS3。
今まではRDBのDWHのみが主流だったが、最近は画像や音声、動画データ、Iotデータなど非構造化データが増えて来たので、データレイクにぶち込んでおく流れ。
DWHは企業がアクションに繋げるために活用するデータベースでRDB形式に整理されている。AWSならRedshift。
データレイクからDWHにデータを持ってくる際の前処理としてETL(Extract、Transform、Load)がある。
AWSならAWS glue。これにはデータカタログを作る機能もあり、AWS Athenaを使うとS3のデータをSQLクエリで呼び出せる。
従来はデータレイクの横に別のサーバーを置いて、そこで前処理してからDWHにデータを移行していたが、最近はDWH側の性能が上がって一旦データをDWH側にロードして、DHWで整理して置き換えするやり方が増えてきたらしい。
そしてDHWに溜まったデータを活用するにはBIを使う。
AWSならQuick sight。