『東京大学のデータサイエンティスト育成講座』サポートサイト

PG_Python_cover_12-200x257.jpg

このページは、
『東京大学のデータサイエンティスト育成講座(ISBN978-4-8399-6525-9)』
のサポートページです。

紙版: 2019/3/11 初版第1刷発行
 

サンプルファイルのダウンロード

本書のサンプルファイルです。下記からダウンロードしてください。

ダウンロードのためのIDは「6525」、パスワードは、本書のP2に記載がございますので、そちらをご覧ください。

サンプルファイル

 

サンプルファイルはJupyter Notebook形式です。本書巻末に案内のあるAnacondaなどをインストールしてご覧ください。
 

特典ファイルのダウンロード

ダウンロードのためのIDは「6525」、パスワードは、本書のP2に記載がございますので、そちらをご覧ください。

特典ファイル(まとめてダウンロード)

特典ファイルの内容は以下の通りです。
(1) PG_Python_Special.pdf…「データサイエンティスト中級者への道」(36ページ分)(これだけダウンロード
(2) PG_Python_Special_Setup.pdf… (1) ファイルのための環境構築説明(これだけダウンロード
(3) Tokuten_Answer.ipynb … (1) の練習問題解答(これだけダウンロード

 

訂正情報

以下の誤りがありました。お詫びの上訂正します。

  

● P.033の「2-1-1-2 fromを使ったインポート」の最終行 ※7刷で修正
誤: 「ny.random.機能名」と記述する必要があるところを…
正: 「np.random.機能名」と記述する必要があるところを…

 

● P.042の「2-2-4 行列」 の「入力」 ※5刷で修正
誤: 行列から、行や列のみを抜き出したいときは、「[行範囲:列範囲]」のように表記します。それぞれの範囲は、「開始インデックス,終了インデックス」のように、…
正: 行列から、行や列のみを抜き出したいときは、「[行範囲,列範囲]」のように表記します。それぞれの範囲は、「開始インデックス:終了インデックス」のように、…

 

● P.072のページ半ばの「出力」 ※7刷で修正
誤: "chap3/ student-merge.R student.txt student-mat.csv student-por.csv wine_data.csv"
正: "chap3/ student-merge.R student.txt student-mat.csv student-por.csv (※wine_data.csvが不要でした)

 

● P.080の「3-3-3 分散と標準偏差」の「入力」と「出力」 ※8刷で修正
誤: 入力: # 分散 student_data_math['absences'].var()
出力:64.050 

正: 入力: # 分散 student_data_math['absences'].var(ddof=0)
出力:63.887

 

● P.081のページ最初の「入力」と「出力」 ※8刷で修正
誤: 入力: # 標準偏差 σ student_data_math['absences'].std()
出力:8.008 

正: 入力: # 標準偏差 σ student_data_math['absences'].std(ddof=0)
出力:7.993

 

● P.101の最終行 ※6刷で修正
誤: P(A|B)は、Aが観測されたときにBが原因であるだろう確率(これを尤度と…
正: P(A|B)は、B が起きた場合にA が起こるであろう確率(これを尤度と…

 

● P.208の【練習問題8-1】の1~2行目 ※6刷で修正
誤: このデータに対して、目的変数をpriceとし、説明変数にlengthとengine-sizeを使って重回帰のモデル構築をしてみましょう。
正: このデータに対して、目的変数をpriceとし、説明変数にwidthとengine-sizeを使って重回帰のモデル構築をしてみましょう。

 

● P.072のページ上部の「入力」の2行目 ※5刷で修正
誤: url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/00356/student.zip'
正: url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/00356/student.zip'

 

● P.212の本文4~5行目 ※5刷で修正
誤: オッズ比とは、それぞれの係数が1単位増加したとき、正解率にどの程度影響があるかを示す指標です。
正: オッズ比とは、それぞれの係数が1単位増加したとき、予測確率にどの程度影響があるかを示す指標です(影響なし時は1.0となります)

 

● P.212の2つ目の「入力」 と「出力」 ※5刷で修正
誤: 入力:model.coef_
出力:array([[-4.510e-03, -5.717e-06, -1.082e-03, 3.159e-04, 7.230e-04]])

正: 入力:np.exp(model.coef_)
出力:array([[0.996, 1. , 0.999, 1. , 1.001]])

 

● P.301のプログラム1行目 ※5刷で修正
誤: for year in range(1987,2000):
正: for year in range(1987,1990):

 

● P.312の【総合問題1-1 素数判定】1 の本文6~7行目 ※2刷で修正
誤: calc_prime_num(10)
正: なし(※最後の1行は不要でした)

 

● P.342の【練習問題6-4】 の「入力」 ※2刷で修正
誤: pd.merge(df4, df5)
正: pd.merge(df4, df5, on='ID')