Pythonによるスクレイピング&機械学習 開発テクニック BeautifulSoup,scikit-learn,TensorFlowを使ってみよう
- ソシム (2016年12月6日発売)
- Amazon.co.jp ・本 (400ページ)
- / ISBN・EAN: 9784802610797
作品紹介・あらすじ
Pythonでスクレイピングや機械学習をやってみたい!そんなアナタのための一冊。サンプルコードを動かしながら、仕組みと使い方が理解できます。Python3対応。
感想・レビュー・書評
-
0章 機会学習のためのデータ処理とは
クローリング、スレイピングでWeb上のデータを集め
そのデータで機会学習をするというのが本書の目的
ただ構造化されたデータ(表形式の数値、文字列)に
限る。数値以外のデータは数値に変換してから使う。
1章 クローリングとスクレイピング
pythonのライブラリであるurllibをつかってWeb上からデータを
ダウンロードさせる。データを取得するためのAPIをつかって取得する
方法などを紹介。BeautifulSoupというライブラリをつかって
より複雑な方法の紹介。実際に為替情報の取得の実例。
2章 高度なスクレイピング
ログインが必要なサイトでのスクレイピングについて紹介。
WebサイトにJavaScriptを使用しているとpythonのライブラリ
だけでは動作できなくなる。そこでいわゆるヘッドレスブラウザ
をpythonで操ってWebサイトを動作させる方法の解説。
WebAPIを使ったデータ取得についても解説あり。
CRONを使った定期的な情報収集に役立ちそうなことも解説
3章 データソースと書式・整形
Web上のデータにはXML,JSON,YAML,CSV,TSV,Excelなどいろいろな
フォーマットがあるがPythonで読み込む手段について解説。
Web上で集めたデータの保存先としてデータベース(SQLite,MySQL)
の使い方の解説。NOSQL型データベースとしてTinyDBの解説もあり
4章 機械学習
機械学習の代表的な手法について解説
5章 深層学習に挑戦しよう
TensorFlowをつかった深層学習。実例としてMNISTの手書き文字の
認識、肥満度判定
6章 テキスト解析とチャットボットの作成
日本語の形態素解析の解説ライブラリはMeCab,Janomeが紹介されている。
文書のベクトル化にWord2Vecの使用例がありWikipediaを使った語彙を
増やす工夫も解説。テキスト分類の解説もあり。チャットボットの作例あり。
7章 深層学習を実践してみよう
牛丼の写真をスクレイピングで集めてきて深層学習(CNN)で学習させ
未知の牛丼を分類算定させるというアプリを作成している
てんこ盛りでいろいろ解説してある詳細をみるコメント0件をすべて表示 -
TensorFlow
WebAPI紹介 -
所在:展示架
請求記号:007.64/Ku25
資料ID:11800470
Pythonの基礎知識から機械学習の実践的な内容まで書かれている一冊です。機械学習やスクレイピングに興味のある学生はぜひ読んでみて下さい。
選書担当者:牧野