入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック
- オライリージャパン (2011年11月26日発売)
- Amazon.co.jp ・本 (368ページ)
- / ISBN・EAN: 9784873115139
作品紹介・あらすじ
膨大なソーシャールデータから価値ある情報を見出すために必要な一連の技術について解説。ソーシャルネットワークが生み出すデータを抽出、分析、可視化するまでのテクニックを学ぶことができる。技術的なアプローチの背景となる概念や理論、有用なツールの活用方法なども解説。ソーシャルデータとはどのようなものか、またどのようにアプローチすればよいのか、そのために必要な知識や技術は何かなど、ソーシャルデータを扱おうとする開発者に必要な基礎をわかりやすく提供する。
感想・レビュー・書評
-
ノルマ読書。期待が高かった分、ちとイマイチ。「何を分析するか」が沢山あると思ったが、「どう取得するか」が主な感じ。WebAPIコードが長いから仕方ないか。
詳細をみるコメント0件をすべて表示 -
本書はデータマイニングの専門家、Matthew A. Russellによる、Pythonを用いたソーシャルデータマイニングの入門書である。
本書ではWeb上、または個人のメールボックスなどから手に入るソーシャルデータを入手、整形、解析し、視覚化する方法について説明されている。Pythonのスクリプト言語としての使い勝手の良さと、ライブラリの豊富さのおかげで、極めてシンプルなコーディングで目的を達成することができている。後半の章ではNLTKを用いた自然言語処理にも触れられている。
また、実際の運用環境で問題になる、大量のデータの処理時間およびデータの永続化については、CouchDBとmap/reduce、およびRedisなどのいわゆるNoSQL (KVS) を使用することにより解決されており、コーディング例として参考になると思われる。
ただ、全体としては上記NoSQLやNLTKの説明を入れたことにより、内容が分散していることが欠点となっている。また自然言語処理については、本書の説明では (特に日本語環境においては) 不十分であると思われ、Luceneなどを含めて自然言語処理のテキストを別に読む必要があると思われる。
もう1つの欠点は、マイニング手法としてあまり高度な方法が使用されていないことである。多変量解析および統計・確率モデル的な手法に関しての例示が豊富であるとは言えず、その点は同じくオライリーから出版されている「集合知プログラミング」のほうが有用である。
上記で述べた欠点を踏まえて、また、「集合知プログラミング」の内容の充実と比べて、本書は★4つと評価したい。 -
もっとちゃんと読もうっと。
これをきちっとやれば、自分でもデータマイニングできるようになるかもしれないし。 -
easy_install geopy
NLPは本質的に複雑で、まずまずのレベルの成果を上げるのがむずかしい
最新鋭のNLPスタックに強く依存するなら、オープンソースではなく買え
sunburst -
何らかのアプリケーションを設計する時、書く時に参考にする予定である。
-
"データマイニング、分析、可視化のテクニック" ということで、Twitter, LinkedIn, Facebook などのソーシャルデータを収集して、可視化するサンプルがいろいろ掲載されている。サンプルプログラムが Python で書かれていて、好感が持てる。 ^^
広く浅く…という方針だそうで、サンプルが多数あり、説明は簡潔。
私が期待していた内容とはちょっと違うが、なかなか興味深い一冊だった。 -
読んで良かった。でも、テクニカルな面で得られるものは、少なかったと思う。
Python。全然読んだことなかったけど、簡単な言語ですよね。面白かった。
可視化は「Beautiful Visualization」の方が参考になる。 -
ソーシャルデータの解析についての本。必要なときにはぜひ手元においておきたい本でした。
ブログはこちら。
http://blog.livedoor.jp/oda1979/archives/4065311.html -
貸し出し状況等、詳細情報の確認は下記URLへ
http://libsrv02.iamas.ac.jp/jhkweb_JPN/service/open_search_ex.asp?ISBN=9784873115139