マナティ

購入形態

PDF
2,200円
数量:

カートに追加されました。カートを見る

カートに入れる
紙の本を買う

Apache Sparkビッグデータ性能検証

インプレス

ユースケースで徹底検証! Sparkのビッグデータ処理機能を試す。

ビッグデータ向けの処理基盤として「Apache Spark」が注目を集めています。Sparkにはストリームデータを処理する「Spark Streaming」というコンポーネントがあります。

本書では、Spark Streamingとその他のOSSを組み合わせたストリームデータ処理システムを構築し、その性能検証結果を紹介していきます。

第1章 Spark Streamingの概要と検証シナリオ
第2章 Kafka、Spark、Elasticsearchによるシステム構築と検証の進め方
第3章 Kafka、Spark、Elasticsearch のパラメータチューニング
第4章 マシン台数の調整とシステム全体のボトルネックについての考察
第5章 Spark 2.0を活用した配電設備の負荷集計システムの性能検証
第6章 Spark 2.0の性能検証の結果とボトルネックの考察
第7章 Sparkのデータ処理プロセスと処理性能のボトルネック
第8章 Sparkの性能向上のためのパラメータチューニングとバッチ処理向けの推奨構成


※本書は紙書籍はモノクロ、電子書籍はカラーでの提供となります。
※本書は、インプレスが運営するWebメディア「Think IT」で、「ユースケースで徹底検証! Sparkのビッグデータ処理機能を試す」として連載された技術解説記事を書籍用に再編集したものです。
※本書の内容は、執筆時点(2016年7月~2017年1月)までの情報を基に執筆されています。

発売日:2017-05-12

ページ数:106ページ

目次

表紙
免責事項
第1章 Spark Streamingの概要と検証シナリオ
目次
第2章 Kafka、Spark、Elasticsearchによるシステム構築と検証の進め方
第3章 Kafka、Spark、Elasticsearch のパラメータチューニング
第4章 マシン台数の調整とシステム全体のボトルネックについての考察
第5章 Spark 2.0を活用した配電設備の負荷集計システムの性能検証
第6章 Spark 2.0の性能検証の結果とボトルネックの考察
第7章 Sparkのデータ処理プロセスと処理性能のボトルネック
第8章 Sparkの性能向上のためのパラメータチューニングとバッチ処理向けの推奨構成
著者紹介
奥付

著者プロフィール

  • 伊藤雅博(著者)

    株式会社日立製作所 OSSソリューションセンタ所属。これまでにストレージ装置とその管理ソフトウェアの開発に従事してきた。現在はHadoop/Spark/HBaseを中心としたビッグデータ関連OSSの導入支援やソリューション開発に従事している。最近は学生時代に取り組んできた機械学習やデータ分析に再び取り組みたいと考えている。

  • 木下翔伍(著者)

    株式会社日立製作所 OSSソリューションセンタ所属。これまでにIaaS稼働監視サービスの基盤開発、OpenStackを題材にしたクラウド基盤の運用管理に関する研究、CloudFoundryの検証・評価業務などに従事してきた。現在はビッグデータに関するソリューション開発やOSSの検証業務に従事している。