「つくりながら学ぶ!深層強化学習」サポートサイト
このページは2018年6月発行、マイナビ出版刊『つくりながら学ぶ!深層強化学習』(ISBN978-4-8399-6562-4)のサポートページです。
公開日:2018年5月17日
更新日:2020年7月14日
発行:マイナビ出版
商品紹介ページへ戻る
プログラムコードの提供
本書各記事で作成したプログラムコードを下記にて配布いたします。
Deep-Reinforcement-Learning-Book-master.zip
https://github.com/YutaroOgawa/Deep-Reinforcement-Learning-Book
ダウンロード可能なZIPとGitHubサイトの内容は同じです(GitHub上のデータが先に更新されるケースがあります)
[4_3_PyTorch_MNIST.ipynb]の修正
4.3「PyTorchで手書き数字画像の分類課題MNISTを実装」のp.109、「mnist = fetch_mldata('MNIST original') が実行できない問題」への対処につきまして、GitHub上の該当ファイル:4_3_PyTorch_MNIST.ipynbを修正しました。
サポート情報
出版から時間が経ち、最新版のライブラリでは動かない部分が発生しています。 下記リンクに記載の修正例を試してください。
76-80pの cartpole animationについて
cartpole の animation ですが、73ページのインストール作業で、OpenAI Gymのバージョン0.9.7、matplotlibのバージョン2系(2.2.5)をインストールしてください。すでにインストールしている場合はアンインストールします。
pip uninstall gym -y pip install gym==0.9.7 pip uninstall matplotlib -y pip install matplotlib==2.2.5
[参考サイト]
https://github.com/YutaroOgawa/Deep-Reinforcement-Learning-Book/issues/8
https://teratail.com/questions/250202
正誤情報
正誤が見つかり次第掲載いたします。(最終更新日:2019/2/4)
3~1刷
1刷
- 47ページ:コード(上段)
- 誤)delta_theta[i, j] = (N_ij + pi[i, j] * N_i) / T
- 正)delta_theta[i, j] = (N_ij - pi[i, j] * N_i) / T
- 48ページ:コード
- 誤)stop_epsilon = 10**-8 # 10^-8よりも ..
- 正)stop_epsilon = 10**-4 # 10^-4よりも ..
以上