Apache Sparkビッグデータ性能検証

インプレス

伊藤雅博（著者）、木下翔伍（著者）

ユースケースで徹底検証！ Sparkのビッグデータ処理機能を試す。

ビッグデータ向けの処理基盤として「Apache Spark」が注目を集めています。Sparkにはストリームデータを処理する「Spark Streaming」というコンポーネントがあります。

本書では、Spark Streamingとその他のOSSを組み合わせたストリームデータ処理システムを構築し、その性能検証結果を紹介していきます。

第1章 Spark Streamingの概要と検証シナリオ
第2章 Kafka、Spark、Elasticsearchによるシステム構築と検証の進め方
第3章 Kafka、Spark、Elasticsearch のパラメータチューニング
第4章マシン台数の調整とシステム全体のボトルネックについての考察
第5章 Spark 2.0を活用した配電設備の負荷集計システムの性能検証
第6章 Spark 2.0の性能検証の結果とボトルネックの考察
第7章 Sparkのデータ処理プロセスと処理性能のボトルネック
第8章 Sparkの性能向上のためのパラメータチューニングとバッチ処理向けの推奨構成

※本書は紙書籍はモノクロ、電子書籍はカラーでの提供となります。
※本書は、インプレスが運営するWebメディア「Think IT」で、「ユースケースで徹底検証！ Sparkのビッグデータ処理機能を試す」として連載された技術解説記事を書籍用に再編集したものです。
※本書の内容は、執筆時点（2016年7月～2017年1月）までの情報を基に執筆されています。

発売日：2017-05-12

ページ数：106ページ

著者プロフィール

絶賛！発売中！

書籍一覧へ