- Amazon.co.jp ・本 (392ページ)
- / ISBN・EAN: 9784873113647
作品紹介・あらすじ
本書は現在注目を集めている「集合知」をテーマにした書籍です。機械学習のアルゴリズムと統計を使ってウェブのユーザが生み出した膨大なデータを分析、解釈する方法を、基礎から分かりやすく解説します。本書で紹介するのは「購入・レンタルした商品の情報を利用した推薦システム」、「膨大なデータから類似したアイテムを発見し、クラスタリングする方法」など。del.icio.us、eBayなどが公開しているWeb APIを使用した解説も本書の大きな特徴です。本書のサンプルコードは可読性に優れたPythonを使用していますが、他の言語のプログラマでも理解しやすいようにアルゴリズムを解説しています。日本語版ではYahoo!日本語形態素解析Webサービスを利用した日本語テキスト処理について加筆しました。
感想・レビュー・書評
-
2009年くらいの本。大量のログデータからいわゆる機械学習の手法を中心に使って、推薦システムや各種クラスタリングをどのように行うかなどをサンプルコードベースで説明しているのでわかりやすい。アルゴリズムの解説も難しい数式などがないしとっつきやすい。NMFの章で行列計算がでてくるが、そこでも行列とはみたいなとこから解説してるので知らなくてもいける。ニューラルネットワークを使って検索エンジンを作る章では入力層から出力層へ電波していく過程が図になっててわかりやすい。プログラマで機械学習に興味はあるけど具体的に何をしたらいいかわからない人には実際に手を動かして外観を掴みながらできるこの本が良い気がする。
詳細をみるコメント0件をすべて表示 -
初めてPythonという言語を知った本でありなつかしい。
主にレコメンドシステムなどで集合知を説明してある。
1章 集合知への招待
省略
2章 推薦を行う
Amazonのサイトで行われている推奨システムに使われている手法を説明
強調フィルタリングとはユーザーと好みが似た集団をみつけその集団が好きなものをユーザーに推奨する。このとき似た集団を類似性スコアで測る。
3章 グループを見つけ出す
データクラスタリングの話。ブロガーの文書を分析して似通ったグループに分けていく。
4章 検索とランキング
クロール手法について説明
5章 最適化
旅行の最適化について最小コストを求める方法(何がコストかはユーザーの要求によって異なる)
遺伝アルゴリズムの説明もある。
6章 ドキュメントフィルタリング
Eメールのスパムフィルタリングについて説明。
単純ベイズ分類器の構築。SQLiteへデータ保存についても説明がある。
7章 決定木によるモデリング
決定木でユーザーが優良顧客になるか予測する。
学習する。
8章 価格モデルの構築
ワインの価格を近傍法で予測する
9章 高度な分類手法:カーネルメソッドとSVM
省略
10章 特徴を発見する
ニュースの語彙から特徴を抽出氏文書のカテゴリを分類する。
11章 進化する知性
遺伝プログラミングについて、省略
12章 アルゴリズムのまとめ
今までの技術のまとめ
今から振り返ると衰退した手法、発展した手法があり、まったくこのときはまったくなかった手法などもある。 -
懐かしい。輪読して読むには内容として最適な書でした。
-
数学的な説明はそれほどないがチュートリアルのような感じで実際にスクリプトを組んで行くので非常に面白い。
どのようなデータに対してどういったアプローチをするのが良いかが説明されているので実践的。 -
データマイニング系の本は始めて。ざっと読んだが、飲み込みきれていないので後でもう一度読む予定。
-
2009/02/07読了
-
展示期間終了後の配架場所は、開架図書(3階) 請求記号 007.64//Se16
-
後期かけて真剣に読みたい
-
レコメンドエンジンの実装や人工知能のプログラミングがしてみたいと思い手にとる。
テーマは推薦エンジン、ユーザの相関、ニューラルネットワーク、SVMなどなどを実装できるようになっている。
コードや参考URLも多いので普段からpythonでモノづくりをしている人にはいい本であると思う。
しかしpythonを理解していなくてもいいと書かれてるが、まったくそれは難しいと思う。
とにかくコードにも間違いが多いので、キチンと理解するまで心が折れるかもしれないです(折れかかりました) -
機械学習でよく使用される手法をPythonで組み立て,それを用いてマイニングのイメージをつかむことができます。
オライリーの本に共通ですが,間違いがいくつか。本の数値結果とは一致しない。また,APIの使用方法が異なるなど。 -
「集合知」というキーワードに興味があったので読んでみました。読み応えのある本です。集合知に限らず、データマイニング関連の最初の一冊としても良いかもしれません。とてもよくできた本だと思います。なので5点。■データマイニング手法の紹介本訳者前書きにも書かれているのですが、この本は群集の叡智(集合知)を収集するツール・テクニックの紹介本という性質があります。本文中ではそれほど数学的に深い説明もなく、さらっと読み流せるようになっています。「こうすれば使える」というのがよくわかるようになっています。実用性の高い内容です。■サンプルプログラムも可読性が高いサンプルプログラムの言語にはPythonを使用しています。私は本書を読むまでPython言語の存在すら知らなかったのですが、そんな人間にもソースがすらすら読めるほど可読性が高いです。紹介されているツール・開発環境はすべてフリーなので、実際に手を動かして一つずつ確かめながら進めていくことができます。
-
まだ読んでいる最中ですが
Pythonの具体的なコードとともにアルゴリズムの説明がなされており
理解しやすいです.
Pythonでデータマイニングや機械学習をしようと考えているなら参考になるのではないかと思います. -
Pythonを勉強してまた読み直す予定。
ちゃんと読むとFacebookにも応用が効く -
サンプル一杯で嬉しいが、ちょっとコードが雑な気も。勉強というよりは、研究中に必要なサンプルをトレースすると良いのかもしれない。
-
Amazon でも出てくる「この商品を買った人はこんな商品も買っています」のアルゴリズムが載っている本. 仕事では prolog で知識処理をしているので、関心があり購入.
-
クラスタリング、ニューラルネットワーク、ベイジアンフィルタなどをWeb 2.0 的な実例を
通して紹介した本。
最後のSVMの項を除けば、最低限の理論的説明もされており、
「ライブラリをブラックボックス的に呼び出しておしまい」となっていないところが好感が持てる。
Web 2.0 に興味がなくても、bioinfomatics などで、上記のキーワードに興味があるなら、
読んで損はない。
サンプルコード(Pythonによる)が短くコンパクトにまとめられているのも読みやすくてよい。 -
三人寄れば文殊の知恵。Amazonのオススメのようにたくさんの人のデータを集めて有効に使う手法。協調フィルタリングなどのアルゴリズムの解説がわかりやすい。プログラムの書き方がイマイチなところも。Python。
-
Pythonでプログラミングしたいのだが、。
-
「機械学習のアルゴリズム」と「統計」を使って、ウェブのユーザ
が生み出した膨大なデータを分析・解釈する方法を、基礎から分か
りやすく解説してくれるそうです。
各種データマイニング技術がWeb2.0の中でどのように使用されているのかがわかる。
自分にとっては以下が特に参考になった。
・決定木の事例
・Yahoo!ファイナンスからのデータのダウンロード
-
2008年11月に書店で購入。サンプルコードがPythonということでとりあえずPythonの勉強をしてからまた本書に戻ってこようと思う。しばしのお別れだ。
-
2008/8/6購入
-
プログラマーに最適なデータマイニングの教科書です。詳細は以下にて。
http://d.hatena.ne.jp/kunimiya/20081116/p1 -
pythonやりながら読んでる
-
python覚えるか?みたいな。