スラスラ読める Pythonふりがなプログラミング スクレイピング入門
インプレス
- リブロワークス(著者)、 株式会社ビープラウド(著者)
プログラムが読めればデータ収集・効率化が自由自在!!
■□■プログラムが読めればデータ収集・効率化が自由自在!!■□■
「プログラムの読み方をすべて載せる(ふりがなをふる)」という手法で究極のやさしさを目指した、まったく新しいプログラミングの解説書「ふりがなプログラミング」シリーズから、Pythonを使ったスクレイピングの入門書が登場しました。
スクレイピングを用いれば、Web上のサイトを定期的にチェックしたり、一覧になったURLのリンク先を順番に参照したりといった作業を、プログラムで自動化できるようになります。応用できる範囲は趣味から仕事まで実に幅広く、Pythonで行えることが一気に広がります。
本書では、サンプルのWebページや実際のWebページを題材にして、Webサイトの構造を把握することからしっかり解説。データの収集、データの整理・加工といった、一連の流れを学ぶことができます。
■本書はこんな人におすすめ
・Pythonを使ったスクレイピングの基本を身につけたい人
・過去に入門書で挫折してしまった人
・プログラマーやエンジニアを目指す人
・仕事でPythonを活用してみたい人
発売日:2021-12-01
ページ数:192ページ
目次
表紙
著者プロフィール
はじめに
プログラムの読み方
Chapter 1 スクレイピング最初の一歩
01 スクレイピングって何?
02 本書の読み進め方
03 Pythonのインストール
04 Visual Studio Codeのインストール
05 スクレイピングに必要なライブラリのインストール
06 VS Codeでプログラムを作成してみよう
Chapter 2 スクレイピングをやってみよう
01 HTMLを理解することがスクレイピングの第一歩
02 Webページから要素を取り出す
03 HTML属性を指定して要素を取り出す
04 Webページから要素を複数取り出す
05 パターンに一致した要素を取り出す
06 取り出した要素をさらに絞り込む
07 実際のWebページでスクレイピングする
08 要素を取り出せない場合は(1)
09 CSSセレクタってどんなもの?
10 CSSセレクタを使って要素を取り出す
Chapter 3 スクレイピングの応用テクニック
01 Webページ内のリンクを取り出す
02 画像を取り出す
03 前後の要素を取り出す
04 ページ遷移しながらスクレイピングする
05 要素を取り出せない場合は(2)
06 エラーに強いプログラムを作成する
Chapter 4 集めたデータを整理・加工しよう
01 集めたデータを使うには
02 全角・半角の表記ゆれをなくす
03 大文字・小文字の表記ゆれをなくす
04 文字列を置換する
05 表形式のデータを扱う
06 表形式のデータから列や行を取り出す
07 条件に一致したデータを取り出す
08 欠損値があるデータを加工する
09 表形式のデータを集計する
10 グラフでデータを可視化する
Chapter 5 Web APIでデータを集めよう
01 Web APIを使ってみよう
02 その他のスクレイピングライブラリ
あとがき
索引
本書サンプルプログラムのダウンロードについて
奥付
著者プロフィール
-
リブロワークス(著者)
リブロワークス
書籍の企画、編集、デザインを手がけるプロダクション。手がける書籍はスマートフォン、Webサービス、プログラミング、WebデザインなどIT系を中心に幅広い。著書に『やさしくわかるPythonの教室』(技術評論社)、『解きながら学ぶ Pythonつみあげトレーニングブック』(マイナビ出版)、『スラスラ読める Pythonふりがなプログラミング 増補改訂版』(インプレス)など。 -
株式会社ビープラウド(著者)
株式会社ビープラウド
ビープラウドは2008年にPythonを主言語として採用、優秀なPythonエンジニアがより力を発揮できる環境作りに努めている。Pythonに特化したオンライン学習サービス「PyQ(パイキュー)」、システム開発者向けクラウドドキュメントサービス「TRACERY(トレーサリー)」、研修事業などを通して技術・ノウハウを発信。また、IT勉強会支援プラットフォーム「connpass(コンパス)」の開発・運営や勉強会「BPStudy」の主催など、コミュニティ活動にも積極的に取り組んでいる。
絶賛!発売中!
-
- ITナビゲーター 2012年版
-
- 野村総合研究所(著者)
- ビジネス・経済 読み物
- IT業界の現状と今後の市場動向を完全予測する『ITナビゲーター』の2012年版。ビッグデータ、スマートグリッド、ネットビジネス、メディア、モバイル、ブロードバンド等の2016年までの見通しを徹底分析。
-
- イノベーションとは何か
-
- 池田信夫(著者)
- ビジネス・経済 読み物
- 「ものづくりからイノベーションへ」。重要性は常に指摘されながら、真面目に論じられないイノベーションを正面から取り上げた画期的な1冊。起こりやすい条件から阻害要因、企業・政府の対策まで完全網羅。
-
- あなたのとなりの熟年離婚
-
- 岡野あつこ(著者)
- 生活
- メディアで活躍する離婚カウンセラーが、自身の経験をもとに語る、「正しい熟年離婚のススメ」。「最善の努力をしない上での離婚は絶対に避けるべき」という信念のもと、自身が見てきた熟年離婚の理想と現実を、豊富な事例とともに紹介します。
-
- 古代史悪党列伝
-
- 関裕二(著者)
- 歴史・地理・伝記その他
- そもそも正史とは「正しい歴史書」ではなく、政権側に都合のいい歴史書ということでしかない。中臣鎌足、物部守屋、雄略天皇、恵美押勝、行基、道鏡など、歴史の中で「ワル」のレッテルを貼られた者は、ただ単に「政争に敗れたもの」にすぎないことがままあるのだ。その一方で、ヤマトタケル、中大兄皇子、天武天皇など、英雄と思われた人物が、実際には本当の「ワル」だったということも。彼らの正体は果たしていかなるものだったのか…。
7217件中 7089-7092件目先頭前へ1771177217731774177517761777177817791780次へ最後
Copyright © Mynavi Publishing Corporation