- Amazon.co.jp ・本 (192ページ)
- / ISBN・EAN: 9784627848412
作品紹介・あらすじ
電子化されたテキストの中から、有益な情報を探し出すテキストマイニング。ソフトのインストールから実際の解析まですべてフリーでできる。
感想・レビュー・書評
-
ある(2018/09/26)
詳細をみるコメント0件をすべて表示 -
RMeCabを使ってテキストマイニングを学ぶ本。
初めてテキストマイニングを学ぶには良いかなと思います。
最近は簡単に試すことが出来るようになっており、
書いている内容をすぐにトライすることが出来るのはよいですね。
【勉強になったこと】
・テキストマイニングを使えば、どんな単語がよく頻出して
いるかが簡単にわかる。アンケート分析にはよい。
・日本語形態素解析には、辞書が不可欠。 -
RMeCabを使った、テキストマイニングの初歩を扱っています。入門書なので、まずはこれで一通りのイメージをつける意味ではよいと考えます。サンプルコードも豊富な点もよいです。
欲を言えば、辞書作成を含めた前処理、グラフ化について、もう少し扱ってほしかったです。 -
ばすがすばくはつばすがすがすがつ!
-
著者は形態素解析MeCabをRから読み出せるRMeCabを開発。安価にテキストマイニングを行える環境に貢献している。このような研究の発展を支える活動に頭が下がる。
-
購入。
形態素解析のフリーソフトMeCabをRから使用してテキストマイニングを行う。
テキストマイニングってどんなものか興味のある人には薦められる。ソースも載っていて、分析過程もきちんと書かれているからよいと思う。
マイニング自体の細かい説明はない。 -
個人的2013夏の課題図書の1つ。
- 現在の仕事に直接関係はないものの、自然文をテキストデータ+スクリプトの形でうまく処理したい(テキストマイニングに近い)ニーズは常にある業務なので、将来の何かの"種"になるかといろいろ参考になった
- この本の構成が丁寧で、単に趣味としてこの内容を試してみたい、と思ったのも、お金出して買ってもいいと思えた理由。だいたい実務3:趣味7くらい
簡単なチュートリアル形式であれば、Web上のリソースでまかなえなくはないのだけれど、知識を合わせて体系的にじっくり積み上げたいときは、やっぱり書籍がよいと実感。そして、そう思わせてくれる本は意外と少ない(書籍でもわかりづらいものは案外多い)
- RMeCabは「R」「MeCab」を足し合わせた著者による独自パッケージ。MeCabによる形態素解析の結果をそのまま「R」に渡していろいろ分析できる、という仕組み
- 3章までは、テキストマイニングとは何か、Rそのものの基本、などについて触れられている
- 4-5章でRMeCabが登場。OS別の環境導入手順が丁寧。RもMeCabもRMeCabも無償提供されているので、読んだその日から触れる
- 新しい言語や分析環境を触りたいとき、その目的ははっきりしていても、構築に手間がかかるようだと案外気が向かないことが多い。趣味ベースだとなおさら
- RMeCabはユーザー側から見ると一種のライブラリ関数として見てよく、5章の役割はそのリファレンス
- 後半6-10章まで、公開テキストデータを用いて対応分析やクラスタリングを用いて、言えることは何か?までが解説される
- t検定やカイ二乗検定がごく当たり前に登場するが、末尾の付録に解説があるのでとまどうことはなさそう。ただ、統計分析の基本書ではなく、あくまでRMeCabによる分析が主役なので、基本事項はおさらい程度、必要最小限という感じ
- 10章では夏目漱石と森鴎外の文章を青空文庫から入手し、「文の特徴から著者を判別できるか?」という目的で、N-gramを併用したクラスター分析・主成分分析等でしっかり分類できていた
- こういう簡単な事例で一種の成功体験を与えてくれるので、自分なりにもっと試してみようとか、思いやすくなる構成 -
今考えていることの実現手段として勉強していた本。 内容はRの簡単な使い方から実応用まで、網羅されている。プログラミング知識に自信があれば前半は読み飛ばしてしまって構わない。(ベクトルオブジェクトの概念さえ抑えればあとは普通のスクリプト)
-
Rすごい。RMeCab作ってくれた石田先生、ありがとう。そして、それでどう分析するかを手取り足取り教えてくれる本書、万歳。これで私もテキストマイニングしてみます。
-
後輩が修論の後遺していった書籍。これは何かに使えないかなあ。。。