Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド-

著者 :
  • 技術評論社
3.65
  • (7)
  • (10)
  • (11)
  • (2)
  • (1)
本棚登録 : 317
感想 : 8
本ページはアフィリエイトプログラムによる収益を得ています
  • Amazon.co.jp ・本 (400ページ)
  • / ISBN・EAN: 9784774183671

作品紹介・あらすじ

Webデータ収集・解析の技法を基礎から実用まで徹底解説。

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • 1章 クローリング・スクレイピングとは何か
     Python以外のツールでのクローリング・スクレイピングの
     解説がある。この本では対象はgihyo.jpでのクローリング・
     スクレイピングを解説している。

    2章 Pythonで始めるクローリング・スクレイピング
     Pythonの基本的な機能、標準ライブラリでクローリング・スクレイピング
     を行う方法。ページ取得・パース・保存まで、ひとおりやっている。

    3章 強力なライブラリの活用
     ページの取得 Requests,Beautiful Soup,pyquery
     データの保存 MySQL

    4章 実用のためのメソッド
     robots.txtによるクロール禁止、接続先への過剰負担の禁止など
     実用にあたってのアドバイス。
     エラー処理。訪問先のWebページの変更への対応

    5章 クローリング。スクレイピングの実践とデータの活用
     MeCabを活用した自然言語処理、APIを活用したデータ収集
     AmazonAPIを使用した実例、YouTubeAPIの活用事例
     為替データの活用方法、PDFからのデータ抽出
     RoboBrowserによるWebページの自動操作

    6章 フレームワークScrapy
     本格的なフレームワークを使用し継続的なクローリング
     スクレイピングが可能となる。

    7章 クローラーの継続的な運用・管理
     AmazonEC2の無料枠を使用しサーバーを立ち上げその中で
     クローラーを運用する方法を解説している

  • すぱっと目先のhow toが知りたいだけの場合には、前半が長ったらしく思えるかも。

  • Pythonでスクレイピング、クローリングするための本。とてもわかりやすい。

  • 図書館で借りた。丁度やってるとこ

  • ある(2018/09/26)

  • 取得から加工とスケーリングなど必要な知識全体を網羅している。

  • 【読書メモ】Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド- http://yyy1980.hatenablog.com/entry/2017/01/19/231950

  • 請求記号 547.48/Ka 86

全8件中 1 - 8件を表示

加藤耕太の作品

この本を読んでいる人は、こんな本も本棚に登録しています。

有効な左矢印 無効な左矢印
エリック・リース
リンダ グラット...
Bill Lub...
ジェームス W....
有効な右矢印 無効な右矢印
  • 話題の本に出会えて、蔵書管理を手軽にできる!ブクログのアプリ AppStoreからダウンロード GooglePlayで手に入れよう
ツイートする
×