無料マンガ・ラノベなど、豊富なラインナップで100万冊以上配信中!
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
◆次世代のテーブルフォーマットIcebergを完全解説!◆
Apache Icebergは、ストレージ上のファイル群を抽象化し分散クエリエンジンで扱うためのオープンな「テーブルフォーマット」です。本書では、データレイク構築に関する基本的な考え方やIcebergを使うことのメリットといった基本から、Sparkなどの各種分散クエリエンジンにおける実践的な活用方法、そして実運用のためのノウハウまで、豊富なハンズオンとともに解説。次世代のデータ基盤の構築・運用に関わるエンジニア必携の一冊です。
■こんな方におすすめ
・データ基盤の開発・運用に携わるエンジニア、これからデータ基盤を作りたいエンジニア
■目次
第1部 Apache Icebergの基本
・第1章:データレイクの課題とApache Iceberg
・第2章:Apache Icebergの仕組みと機能
・第3章:Icebergカタログとストレージ
第2部 分散クエリエンジンでの利用
・第4章:Apache Spark
・第5章:Apache Flink
・第6章:Trino
・第7章:Apache Hive
・第8章:PyIceberg
第3部 ユースケースと応用
・第9章:ユースケースとソリューションパターン
・第10章:AWSでIcebergを活用する
・第11章:運用管理
・第12章:パフォーマンス最適化
・第13章:Icebergへの移行戦略とパターン
■著者プロフィール
田中智大(たなか ともひろ):アマゾン ウェブ サービス ジャパン合同会社 サポートエンジニアリングチームに所属。2017年にAWSにジョインし、ビッグデータに関連するサービスについて、日々お客様の技術的課題の解決に取り組んでいる。最近はApache Iceberg OSSへの貢献をはじめ、海外カンファレンスでの登壇などコミュニティ活動にも積極的に参加している。
疋田宗太郎(ひきた そうたろう):アマゾン ウェブ サービス ジャパン合同会社所属。SI企業でエンタープライズITに向けた市場取引システムやデータ分析基盤の構築、運用に従事。AWSではデータ分析基盤の構想策定から具体的な実装支援までを行う。巨大なデータを効率よく柔軟に扱う技術と、それを支えるOSSに関心があり、Apache IcebergやOpenSearchを好む。
※アプリの閲覧環境は最新バージョンのものです。
※アプリの閲覧環境は最新バージョンのものです。