『Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ』サポートサイト

このページは『Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ』(ISBN978-4-8399-7498-5)のサポートページです。
更新日:2022年5月12日
2刷発行日:2021年9月17日
公開日:2021年7月5日
発行:マイナビ出版
商品紹介ページへ戻る
関連サイト
● 原著者ページ
[GitHub] github.com/abhishekkrthakur/approachingalmost
サポート提供
補足)
18ページ:コード
scikit-learnで0.24以上のバージョンをご利用の場合、pixel_valuesの型がpandas.DataFrameになり、コードの修正が必要になります[1]。
0.24からpandas.DataFrameをデフォルトで返す設定に変更されたためです[2]。本書では0.23.1を利用しています[3]。
引数にas_frame=Falseを追加すると0.24でも動作することを確認しています[4]。
- [1]: https://github.com/abhishekkrthakur/approachingalmost/issues/50
- [2]: https://scikit-learn.org/stable/modules/generated/sklearn.datasets.fetch_openml.html
- [3]: https://github.com/abhishekkrthakur/approachingalmost/blob/master/requirements.txt
- [4]: https://www.kaggle.com/sishihara/sklearn-0-24-aaamlp-p-18
正誤情報
本書の正誤について見つかり次第掲載します。(2021/10/19 更新)
- 25ページ:2枠目のコード、最初のimport文の改行忘れ
- 誤)from sklearn import tree from sklearn import metrics
- 正)from sklearn import tree
from sklearn import metrics
- 53ページ:2行目
- 誤)閾値が高いと偽陽性が多くなってしまう
- 正)閾値が高いと偽陰性が多くなってしまう
- 53ページ:3行目
- 誤)閾値値が、真陽性と
- 正)閾値が、真陽性と
- 54ページ:図3.5の表のヘッダー
- 誤)threshold tp fr
- 正)threshold tp fp
- 168ページ:1枠目のコード、1行目に改行が必要
- 誤)importances = model.feature_importances_idxs = np.argsort(importances)
- 正)importances = model.feature_importances_
idxs = np.argsort(importances)
- 185ページ:関数optimize コード中コメント(引数の解説文、上より10行目)
- 誤):param params: gp_minimize 用のパラメータ
- 正):param params: hyperopt用のパラメータの辞書
- 185ページ:関数optimize コード中コメント(引数の解説文、上より11行目)
- 誤):param param_names: パラメータ名。順序は重要。
- 正)※この引数はないので削除
- 277ページ:関数max_voting コード中コメント(引数の解説文、上より8行目)
- 誤):param probas: 予測値の2次元配列
- 正):param preds: 予測値の2次元配列
--- 以下1刷の正誤
- 26ページ:コードのインデントが1段下がっていない箇所がある
- 正)「# 学習用と検証用データセットに対する予測」から「test_accuracies.append(test_accuracy)」まで1段下げる
26ページPDF
- 41-42ページ:コード記述の欠け
- 正)
def true_negative(y_true, y_pred): tn = 0 for yt, yp in zip(y_true, y_pred): if yt == 0 and yp == 0: tn += 1 return tn # ←この行を追加
- 103ページ:コード記述の欠け
- 正)
full_size = ( # ←この行を追加 ohe_example.data.nbytes + ohe_example.indptr.nbytes + ohe_example.indices.nbytes )
- 192-193ページ:コード記述の欠け
- 正)
for index, row in tqdm( training_df.iterrows(), # ←この行を追加 total=len(training_df), desc="processing images" ):
以上

