Pythonで学ぶ画像認識機械学習実践シリーズ

インプレス

田村雅人（著者）、中村克行（著者）

画像認識の基礎から実践までを一冊に凝縮

近年の技術の発展により、画像認識技術はますます身近になっています。スマホの顔認証やオンライン会議での人物と背景を認識して背景をぼかすなどをはじめ、画像認識技術ははさまざまな場面において人々の生活をサポートしています。本書では画像認識について実践的に学べるように、Pythonを使った実装を示しています。また画像認識の基礎については簡単に触れるにとどめ、最新の画像認識手法について紙幅を割き、多くの部分で深層学習の実装について学ぶことができる構成になっています。

発売日：2023-03-22

ページ数：352ページ

表紙
本書の前提
目次
序章
第1章画像認識とは？
第1節画像認識の概要
第2節コンピュータによる画像認識の仕組みを理解しよう
第3節実社会で使われている画像認識アプリケーション
第4節画像認識のための開発環境構築
コラム：画像認識とクラウドサービス
第2章画像処理の基礎知識
第1節画像データを読み込んで表示してみよう
第2節画像に平滑化フィルタをかけてみよう
第3節畳み込み演算を使った特徴抽出
第4節アテンションを使った特徴抽出
コラム：海外で働くことをめざす方へ
第3章深層学習を使う準備
第1節学習と評価の基礎
第2節深層ニューラルネットワーク
コラム：AIとエネルギー問題
第4章画像分類
第1節順伝播型ニューラルネットワークによる手法
第2節畳み込みニューラルネットワークによる手法—ResNet18を実装してみよう
第3節 Transformerによる手法?Vision Transformerを実装してみよう
第4節精度向上のテクニック
コラム：見えるメリットとデメリット
第5章物体検出
第1節物体検出の基礎
第2節データセットの準備
第3節 CNNによる手法—RetinaNetを実装してみよう
第4節 Transformerによる手法—DETRを実装してみよう
コラム：画像生成AI
第6章画像キャプショニング
第1節画像キャプショニングの基礎
第2節データセットの準備
第3節 CNN-LSTMによる手法—Show and tellを実装してみよう
第4節アテンション機構による手法—Show, attend and tellを実装してみよう
第5節 Transformerによる画像キャプショニングを実装してみよう
コラム：スタンフォード大学のコンピュータビジョン研究者養成術
参考文献
索引
著者プロフィール
奥付

著者プロフィール

田村雅人（著者）

田村雅人（たむら・まさと）
2016年に東京大学大学院工学系研究科修士課程を修了し、（株）日立製作所に入社。パブリックセーフティ向け映像認識技術の研究開発に従事し、人物検出や追跡、人と物体の関係性検出など、映像監視に使われるAI技術を開発。2021年よりアメリカ・シリコンバレーにオフィスをおくHitachi America, Ltd.に出向し、世界トップレベルの研究者たちと映像認識技術の開発に従事。

中村克行（なかむら・かつゆき）
2007年東京大学大学院新領域創成科学研究科博士課程修了。同年、（株）日立製作所中央研究所入社。物体追跡、一人称視点映像解析、マルチモーダル認識などの研究開発に従事し、2022年より同社研究開発グループ先端AIイノベーションセンタ知能ビジョン研究部長。2015-2016年スタンフォード大学コンピュータサイエンス学科客員研究員。2005年 FIT ヤングリサーチャー賞、2011年 IEEE Consumer Electronics Society Best Paper Award in Television Technologyなど受賞。

絶賛！発売中！

書籍一覧へ

購入形態

Pythonで学ぶ画像認識 機械学習実践シリーズ

画像認識の基礎から実践までを一冊に凝縮

目次

著者プロフィール

Pythonで学ぶ画像認識機械学習実践シリーズ