『つくりながら学ぶ!深層強化学習』サポートサイト | マイナビブックス

「つくりながら学ぶ!深層強化学習」サポートサイト

:カバー

このページは2018年6月発行、マイナビ出版刊『つくりながら学ぶ!深層強化学習』(ISBN978-4-8399-6562-4)のサポートページです。

 公開日:2018年5月17日
 更新日:2020年7月14日
 発行:マイナビ出版

商品紹介ページへ戻る

プログラムコードの提供

本書各記事で作成したプログラムコードを下記にて配布いたします。

 

 Deep-Reinforcement-Learning-Book-master.zip

 https://github.com/YutaroOgawa/Deep-Reinforcement-Learning-Book

ダウンロード可能なZIPとGitHubサイトの内容は同じです(GitHub上のデータが先に更新されるケースがあります)

 

[4_3_PyTorch_MNIST.ipynb]の修正

4.3「PyTorchで手書き数字画像の分類課題MNISTを実装」のp.109、「mnist = fetch_mldata('MNIST original') が実行できない問題」への対処につきまして、GitHub上の該当ファイル:4_3_PyTorch_MNIST.ipynbを修正しました。

 4_3_PyTorch_MNIST.ipynb

 

サポート情報

出版から時間が経ち、最新版のライブラリでは動かない部分が発生しています。 下記リンクに記載の修正例を試してください。

 

76-80pの cartpole animationについて

cartpole の animation ですが、73ページのインストール作業で、OpenAI Gymのバージョン0.9.7、matplotlibのバージョン2系(2.2.5)をインストールしてください。すでにインストールしている場合はアンインストールします。

pip uninstall gym -y
pip install gym==0.9.7
pip uninstall matplotlib -y
pip install matplotlib==2.2.5

 

[参考サイト]

 https://github.com/YutaroOgawa/Deep-Reinforcement-Learning-Book/issues/8

 https://teratail.com/questions/250202

 

正誤情報

 正誤が見つかり次第掲載いたします。(最終更新日:2019/2/4)

3~1刷

46ページ:変数の添え字を訂正、パラメータθの更新量の式(2行目)符号は+でなく-
誤)46p式
正)46p式

1刷

47ページ:コード(上段)
誤)delta_theta[i, j] = (N_ij + pi[i, j] * N_i) / T
正)delta_theta[i, j] = (N_ij - pi[i, j] * N_i) / T
48ページ:コード
誤)stop_epsilon = 10**-8 # 10^-8よりも ..
正)stop_epsilon = 10**-4 # 10^-4よりも ..

以上