The Kaggle Workbook 著名コンテストに学ぶ!競技トップレベルの思考と技術
インプレス
- Konrad Banachewicz(著者)、 Luca Massaron(著者)、 株式会社クイープ(著者)
データ分析競技サイトで力をつけるメソッドを解説!
名高いコンペの解き方をたどる!
ケーススタディと練習問題で実践力を養おう
世界中の何百万人もの人々がKaggleに参加し、
さまざまなコンペティションで、より良い結果を得るためにしのぎを削っています。
本書は、そのためのスキルをより素早く身につけるのに役立つ
ワークブックとして構成されています。
過去の代表的なコンペを取り上げ、どのように段階を踏んで
ソリューションを構築していくのかを解説します。
たとえば、ディスカッションを読み、ノートブックを再利用し、
特徴量エンジニアリングやさまざまなモデルの訓練を見ていきます。
テーマによっては、基本的なソリューションから高度なものへと発展させていきます。
各種トピックについて理解を深めるための練習問題も掲載されています。
どのような情報や知見、理論をもとにして、
どのようなソリューションが導き出されたのか。
さまざまな手を尽くしながら競い合っていることもわかるでしょう。
※本書は『The Kaggle Workbook: Self-learning exercises and valuable insights
for Kaggle data science competitions』の翻訳書です。
※本書の姉妹書『The Kaggle Book』の内容を参照する箇所があります。
※『The Kaggle Book』で説明しているKaggleプラットフォームやデータサイエンスの
基本的な理解を前提にしています。
発売日:2023-10-19
ページ数:162ページ
目次
表紙
サンプル/正誤表など
著者紹介
レビュー担当者
はじめに
第1章 最も名高いテーブルコンペティション―Porto Seguro's Safe Driver Prediction
1.1 コンペティションとデータを理解する
1.2 評価指標を理解する
1.3 優勝したMichael Jahrerのソリューションを調べる
1.4 LightGBMベースのソリューションを構築する
1.5 デノイジングオートエンコーダとDNNをセットアップする
1.6 結果をアンサンブル化する
1.7 本章のまとめ
第2章 Makridakisコンペティション―正解率と不確実性に関するKaggleのM5
2.1 コンペティションとデータを理解する
2.2 評価指標を理解する
2.3 4位に入賞したMonsaraidaのソリューションを調べる
インタビュー:Masanori Miyahara
2.4 特定の日付と時間区間の予測値を計算する
2.5 パブリックリーダーボードとプライベートリーダーボードの予測値を整理する
2.6 本章のまとめ
第3章 画像分類コンペティション―Cassava Leaf Disease Classification
3.1 データと指標を理解する
3.2 ベースラインモデルを構築する
3.3 上位のソリューションから学ぶ
3.3.1 事前訓練
3.3.2 テスト時のデータ拡張/3.3.3 Transformer
3.3.4 アンサンブル
3.4 完全なソリューション
3.5 本章のまとめ
第4章 自然言語処理コンペティション―Google QUEST Q&A Labeling
4.1 ベースラインソリューション
4.2 上位のソリューションから学ぶ
4.3 本章のまとめ
索引
翻訳者プロフィール/STAFF LIST
奥付
著者プロフィール
-
■著者プロフィール
◎Konrad Banachewicz(コンラッド・バナシェヴィッチ)
アムステルダム自由大学にて統計学の博士号を取得。その後、さまざまな金融機関でデータ分析の問題に取り組む。電子商取引会社eBayのリードデータサイエンティストを経て、現在はデータサイエンティストとしてオンライン広告会社のAdevintaに勤務。Kaggleの称号としてNotebooksとDiscussionのGrandmaster、CompetitionsとDatasetsのMasterを取得。過去の最高ランクはDiscussionで7位。
◎Luca Massaron(ルカ・マサロン)
10年以上の経験を有するデータサイエンティスト。現在、オンライン銀行illimity Bankのデータサイエンス&モデリング・シニア・エキスパート。機械学習のGoogleデベロッパーエキスパートであり、AIやアルゴリズムなどに関する多数の書籍の共著者でもある。Kaggleの称号としてDiscussionのGrandmaster、CompetitionsとNotebooksのMasterを取得。過去の最高ランクはCompetitionsで7位、Discussionで8位。
■翻訳者プロフィール
◎株式会社クイープ
1995年、米国サンフランシスコに設立。コンピュータシステムの開発、ローカライズ、コンサルティングを手がけている。2001年に日本法人を設立。主な訳書に、『The Kaggle Book:データ分析競技 実践ガイド&精鋭31人インタビュー』『実践XAI[説明可能なAI]機械学習の予測を説明するためのPythonコーディング』『Python機械学習プログラミング PyTorch&scikit-learn編』などがある(いずれもインプレス発行)。
絶賛!発売中!
-
- 実戦で学ぶ 藤沢里菜の感覚 [予約]
-
- 藤沢里菜(著者)
- 囲碁その他
- わたしは囲碁をこう考える
-
- 日本のすごい鉄道 [予約]
-
- 西園寺(著者)
- 旅行・観光
- すごすぎる日本の鉄道を紹介!!
-
- なぜAIは動くのか(仮) [予約]
-
- Ronald T. Kneusel(著者)、 長尾高弘(翻訳)、 三宅陽一郎(監訳)
- ロボット・電子工学・loT
- 初期AIからニューラルネットワークの登場、機械学習、現代の大規模言語モデルまでAIの進化の歴史と技術的背景がわかる
-
- 混乱のアメリカと日本の未来(仮) [予約]
-
- 中林美恵子(著者)
- ビジネス・経済 読み物
- アメリカがバラバラになっている。日本もその影響下にある
Copyright © Mynavi Publishing Corporation