スラスラ読める Pythonふりがなプログラミング スクレイピング入門|978STORE

978STORE

【978STORE キュー・ナナ・ハチ ストア】は市販書籍の電子版・電子オリジナル書籍・オンデマンド書籍が買えるお店です

2950117411000000000f.jpg

購入形態

PDF
2,178円
数量:

カートに追加されました。

カートに入れる
紙の本を買う

スラスラ読める Pythonふりがなプログラミング スクレイピング入門

インプレス

プログラムが読めればデータ収集・効率化が自由自在!!

■□■プログラムが読めればデータ収集・効率化が自由自在!!■□■

「プログラムの読み方をすべて載せる(ふりがなをふる)」という手法で究極のやさしさを目指した、まったく新しいプログラミングの解説書「ふりがなプログラミング」シリーズから、Pythonを使ったスクレイピングの入門書が登場しました。

スクレイピングを用いれば、Web上のサイトを定期的にチェックしたり、一覧になったURLのリンク先を順番に参照したりといった作業を、プログラムで自動化できるようになります。応用できる範囲は趣味から仕事まで実に幅広く、Pythonで行えることが一気に広がります。

本書では、サンプルのWebページや実際のWebページを題材にして、Webサイトの構造を把握することからしっかり解説。データの収集、データの整理・加工といった、一連の流れを学ぶことができます。

■本書はこんな人におすすめ
・Pythonを使ったスクレイピングの基本を身につけたい人
・過去に入門書で挫折してしまった人
・プログラマーやエンジニアを目指す人
・仕事でPythonを活用してみたい人

発売日:2021-12-01

ページ数:192ページ

目次

表紙
著者プロフィール
はじめに
プログラムの読み方
Chapter 1 スクレイピング最初の一歩
01 スクレイピングって何?
02 本書の読み進め方
03 Pythonのインストール
04 Visual Studio Codeのインストール
05 スクレイピングに必要なライブラリのインストール
06 VS Codeでプログラムを作成してみよう
Chapter 2 スクレイピングをやってみよう
01 HTMLを理解することがスクレイピングの第一歩
02 Webページから要素を取り出す
03 HTML属性を指定して要素を取り出す
04 Webページから要素を複数取り出す
05 パターンに一致した要素を取り出す
06 取り出した要素をさらに絞り込む
07 実際のWebページでスクレイピングする
08 要素を取り出せない場合は(1)
09 CSSセレクタってどんなもの?
10 CSSセレクタを使って要素を取り出す
Chapter 3 スクレイピングの応用テクニック
01 Webページ内のリンクを取り出す
02 画像を取り出す
03 前後の要素を取り出す
04 ページ遷移しながらスクレイピングする
05 要素を取り出せない場合は(2)
06 エラーに強いプログラムを作成する
Chapter 4 集めたデータを整理・加工しよう
01 集めたデータを使うには
02 全角・半角の表記ゆれをなくす
03 大文字・小文字の表記ゆれをなくす
04 文字列を置換する
05 表形式のデータを扱う
06 表形式のデータから列や行を取り出す
07 条件に一致したデータを取り出す
08 欠損値があるデータを加工する
09 表形式のデータを集計する
10 グラフでデータを可視化する
Chapter 5 Web APIでデータを集めよう
01 Web APIを使ってみよう
02 その他のスクレイピングライブラリ
あとがき
索引
本書サンプルプログラムのダウンロードについて
奥付

著者プロフィール

  • リブロワークス(著者)

    リブロワークス
    書籍の企画、編集、デザインを手がけるプロダクション。手がける書籍はスマートフォン、Webサービス、プログラミング、WebデザインなどIT系を中心に幅広い。著書に『やさしくわかるPythonの教室』(技術評論社)、『解きながら学ぶ Pythonつみあげトレーニングブック』(マイナビ出版)、『スラスラ読める Pythonふりがなプログラミング 増補改訂版』(インプレス)など。

  • 株式会社ビープラウド(著者)

    株式会社ビープラウド
    ビープラウドは2008年にPythonを主言語として採用、優秀なPythonエンジニアがより力を発揮できる環境作りに努めている。Pythonに特化したオンライン学習サービス「PyQ(パイキュー)」、システム開発者向けクラウドドキュメントサービス「TRACERY(トレーサリー)」、研修事業などを通して技術・ノウハウを発信。また、IT勉強会支援プラットフォーム「connpass(コンパス)」の開発・運営や勉強会「BPStudy」の主催など、コミュニティ活動にも積極的に取り組んでいる。

絶賛!発売中!

書籍一覧へ

  • 20553_1042940_s.jpg
    古代史悪党列伝
    歴史・地理・伝記その他
    そもそも正史とは「正しい歴史書」ではなく、政権側に都合のいい歴史書ということでしかない。中臣鎌足、物部守屋、雄略天皇、恵美押勝、行基、道鏡など、歴史の中で「ワル」のレッテルを貼られた者は、ただ単に「政争に敗れたもの」にすぎないことがままあるのだ。その一方で、ヤマトタケル、中大兄皇子、天武天皇など、英雄と思われた人物が、実際には本当の「ワル」だったということも。彼らの正体は果たしていかなるものだったのか…。
  • 20234_1042494_s.jpg
    粉飾資本主義
    経営・マーケティング
    なぜ粉飾決算はくりかえされるのか。米国のエンロン事件、日本のライブドア事件などを比較しつつ歴史的に位置づけ、資本主義と株式会社の本質を明らかにする。株式会社研究の第一人者による渾身の論考。
  • 20234_1042487_s.jpg
    TIME HACKS!
    スキルアップ・仕事術
    ヒット作『IDEA HACKS!』の著者が贈る時間管理のノウハウ集。個人の予定管理から、チームの行動管理、中長期の目標管理まで、ワンフレーズでわかる時間管理のコツが満載!
  • 20234_1042491_s.jpg
    整理HACKS!
    スキルアップ・仕事術
    20万部突破のヒットシリーズの最新刊。書類、情報から思考、生活まで、人生の森羅万象をハックするコツを紹介。この1冊で紙の書類の山のオフィスからあなたもオサラバできます!