データを集める技術 最速で作るスクレイピング&クローラー (Informatics&IDEA)
- SBクリエイティブ (2016年11月29日発売)
- Amazon.co.jp ・本 (256ページ)
- / ISBN・EAN: 9784797389029
作品紹介・あらすじ
インターネット・SNSから思い通りに情報を収集するための知識と実例をわかりやすく解説
ExcelやGoogleスプレッドーシート、APIなどを使ってクローラーをプログラミンし、簡単な操作で効率的にデータを集める手法を解説していきます。
企業情報、株価情報、Amazonの新刊情報、商品の口コミデータ、Googleの検索順位の履歴、Twitterから特定のキーワードの発見、iTunes/Google Playのアプリランキングなど、さまざまな役立つデータを収集していきます。
感想・レビュー・書評
-
EXCELマクロ、Googleスプレッドシートなどを使って、ウェブ上に転がっているデータを集めるにはどうしたらできるか?という基本的な疑問を解決してくれる一冊。
最後にapiyq、スクレイピングの効率的な仕組み作りに触れられているが、全般的には体感する事をメインにした内容です詳細をみるコメント0件をすべて表示 -
ネット、特にウェブにある情報を収集するための方策についてまとめたもの。
・Excelによる収集
・googleスプレッドシートによる収集
・import.ioによる収集
・IFTTTによる転送
というあたりがメイン。
あとは実例と、応用について。
それぞれ特徴があって、Excelだとローカル実行できるが、VBA開発が手間で、自動化しづらい。で、Excelが無いとそもそも動かせない。
googleSSだとクラウドだからネットで完結する。端末依存が無い。import.ioは完全にネットの専用アプリなので簡単に集められる。IFTTTは転送がメインなので、アプリの組みあわせを考える必要があるが、それさえできれば最終成果物を得られる。
ネットアプリはアクセス元がアメリカなので、日本特有のデータを集める場合にNG。その場合は唯一ローカル実行できるExcelしかない。IFTTTはデータ転送なので、決まったものしか集められないし、転送先も固有なので、自由度が乏しい。
そんなとこだろうか。 -
手を動かしながら覚えたい人にとっては、現在、最適の一冊。
-
何が出来るか、を確認する程度に読みました。
-
同分野の書籍はまだ読んでないけどスクレイピングの入門書かな。PC初心者のためにでもあるのか、ツールのアカウント作成にページを割いている。それがいまいち。6章からが本番ということでしようか。
後半のぶん投げっぷりは他の入門書と同じ。
コードを書かなければさつくり読めて、取っ掛かりにはいいと思う。
これを参考にGASのスクリプト書いてみよう! -
請求記号 547.48/Sa 75
-
こういうのが今の実務書なんだよなあ。。
僕は自己啓発書としてPCの前ではなく電車で読んでます。こういうのがさらっとできるといいなと。 -
こういうのを全く考えたことがなかった人には、うってつけの一冊かしら
例題が偏ってるので、これをやりたい人にはいいかもね。