- Amazon.co.jp ・本 (224ページ)
- / ISBN・EAN: 9784320112612
作品紹介・あらすじ
本書は,テキストの電子化から始め,テキスト分析のための事前処理,目的に合わせた分析項目の集計方法およびそのテキストの分析方法などについて,例を織り込みながら,テキスト分析に関わる統計的データ処理や機械学習的手法について平易に解説している。
テキストにおける法則と指標,テキストの特徴分析,テキストのクラスター分析,テキストの分類分析,テキスト関連の予測や要因分析に分けて,伝統的な方法から最新の方法まで順を追って解説している。例えば,特徴分析では主成分分析,対応分析などの統計的データ分析法から始め,NMF(非負行列因子分解)分析やトピックモデルなどの機械学習的手法まで,分類分析では線形判別,マハラノビス距離判別分析,ナイーブベイズ判別分析などの伝統的判別分析法からサポートベクターマシン,ランダムフォレスト,深層学習を含むニューラルネットワークなど最新の機械学習方法およびその統合分析まで扱っている。
分析の方法に関しては,簡潔にその考え方とアルゴリズムを示すことで,読者が全体像をつかむように工夫した。例で用いたデータはネットから入手でき,本書中のスクリプトを実行することに主な手法の分析方法の理解をより深めることができる。
感想・レビュー・書評
-
請求記号 007.6/Ki 41
詳細をみるコメント0件をすべて表示 -
テキストマイニングの上位概念がテキストアナリティクスとあるが、自然言語処理とテキストアナリティクスとは別物とある
なにかこだわりがあるのだろうけどその説明はない
(あえて)自然言語処理関連の本って
1. ツールつかって分かち書きしてTwitterのツイートを分類しました
2. tidytext!
3. 自然言語処理の扱いはそこそこに機械学習の説明をひたすら
4. 自然言語処理の扱いはそこそのに深層学習の説明をひたすら
5. そもそも計量言語学たるものは、、、
本書はRのコードが添え物程度にあるが3. 5. という感じか