Pythonで学ぶ画像認識 機械学習実践シリーズ|Tech Book Zone Manatee

マナティ

29501599110000000004.jpg

購入形態

PDF
3,850円
数量:

カートに追加されました。カートを見る

カートに入れる
紙の本を買う

Pythonで学ぶ画像認識 機械学習実践シリーズ

インプレス

画像認識の基礎から実践までを一冊に凝縮

近年の技術の発展により、画像認識技術はますます身近になっています。スマホの顔認証やオンライン会議での人物と背景を認識して背景をぼかすなどをはじめ、画像認識技術ははさまざまな場面において人々の生活をサポートしています。本書では画像認識について実践的に学べるように、Pythonを使った実装を示しています。また画像認識の基礎については簡単に触れるにとどめ、最新の画像認識手法について紙幅を割き、多くの部分で深層学習の実装について学ぶことができる構成になっています。

発売日:2023-03-22

ページ数:352ページ

目次

表紙
本書の前提
目次
序章
第1章 画像認識とは?
第1節 画像認識の概要
第2節 コンピュータによる画像認識の仕組みを理解しよう
第3節 実社会で使われている画像認識アプリケーション
第4節 画像認識のための開発環境構築
コラム:画像認識とクラウドサービス
第2章 画像処理の基礎知識
第1節 画像データを読み込んで表示してみよう
第2節 画像に平滑化フィルタをかけてみよう
第3節 畳み込み演算を使った特徴抽出
第4節 アテンションを使った特徴抽出
コラム:海外で働くことをめざす方へ
第3章 深層学習を使う準備
第1節 学習と評価の基礎
第2節 深層ニューラルネットワーク
コラム:AIとエネルギー問題
第4章 画像分類
第1節 順伝播型ニューラルネットワークによる手法
第2節 畳み込みニューラルネットワークによる手法?ResNet18を実装してみよう
第3節 Transformerによる手法?Vision Transformerを実装してみよう
第4節 精度向上のテクニック
コラム:見えるメリットとデメリット
第5章 物体検出
第1節 物体検出の基礎
第2節 データセットの準備
第3節 CNNによる手法?RetinaNetを実装してみよう
第4節 Transformerによる手法?DETRを実装してみよう
コラム:画像生成AI
第6章 画像キャプショニング
第1節 画像キャプショニングの基礎
第2節 データセットの準備
第3節 CNN-LSTMによる手法?Show and tellを実装してみよう
第4節 アテンション機構による手法?Show, attend and tellを実装してみよう
第5節 Transformerによる画像キャプショニングを実装してみよう
コラム:スタンフォード大学のコンピュータビジョン研究者養成術
参考文献
索引
著者プロフィール
奥付

著者プロフィール

  • 田村 雅人(著者)

    田村雅人(たむら・まさと)
    2016年に東京大学大学院工学系研究科修士課程を修了し、(株)日立製作所に入社。パブリックセーフティ向け映像認識技術の研究開発に従事し、人物検出や追跡、人と物体の関係性検出など、映像監視に使われるAI技術を開発。2021年よりアメリカ・シリコンバレーにオフィスをおくHitachi America, Ltd.に出向し、世界トップレベルの研究者たちと映像認識技術の開発に従事。

    中村克行(なかむら・かつゆき)
    2007年 東京大学大学院 新領域創成科学研究科 博士課程修了。同年、(株)日立製作所 中央研究所入社。物体追跡、一人称視点映像解析、マルチモーダル認識などの研究開発に従事し、2022年より同社研究開発グループ 先端AIイノベーションセンタ 知能ビジョン研究部長。2015-2016年 スタンフォード大学コンピュータサイエンス学科 客員研究員。2005年 FIT ヤングリサーチャー賞、2011年 IEEE Consumer Electronics Society Best Paper Award in Television Technologyなど受賞。