入門 多変量解析の実際 第2版 (KS理工学専門書)

著者 :
  • 講談社
3.50
  • (2)
  • (4)
  • (10)
  • (0)
  • (0)
本棚登録 : 57
感想 : 5
本ページはアフィリエイトプログラムによる収益を得ています
  • Amazon.co.jp ・本 (208ページ)
  • / ISBN・EAN: 9784061539631

作品紹介・あらすじ

本書は、読者にいきなり多変量解析をわからせる本といってよい。内容的には、因子分析やクラスター分析、数量化理論など産業界でポピュラーに利用されている手法を平易に解説し、豊富な適用例をとりあげている。さらに、随所に見られる○○手法はこう使う!といった明快なコメントや、さまざまなトラブル・シューティングの技法の紹介は、ユーザーの人々にとって有益であることは間違いない。

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • *****
     では,同じパターン分類の方法である,コレスポンデンス分析と数量化理論Ⅲ類はどこが違うかというと,対象とするデータ行列の形式が違うだけである。コレスポンデンス分析は反応頻度を分析データにしているのに対して,数量化理論Ⅲ類は,YESかNOつまり1-0のダミー変数行列を分析する。しかし頻度が解けるのであれば,頻度がたまたま“1”か“0”かであっても解けるはずだ。その意味でコレスポンデンス分析は数量化理論Ⅲ類を含んだ,より一般的なモデルということになる。簡単にいえば,コレスポンデンス分析のプログラムさえあればⅢ類の問題は解けるよ,ということである。(p.29)

     パターン分類を行うときは,あらかじめ次元を想定した上で変数を設定しなければならない。しかし,現実には明確な意図もなく,何となく集まってしまったデータにパターン分類を適用するという場合も多い。その結果として,解釈できない分析結果が出てくることもあれば,DK (don't know) に対応した次元が出てくるだけのこともある。分析がうまくいかなかったとしても,コンピュータが狂ったわけでもなければ,分析モデルが悪いわけでもない。他人のせいにすべからず!たいていは分析者自身に責任がある,と思ってよい。
     つまり,パターン分類を成功させる最も肝心なポイントは,計算段階ではなくパターン分類に必要な設問を用意して,分析データを収集する計画段階にあるのである。
     何の目的でパターン分類をしたいのか?そのためには,どのようなデータを集めなければならないのか?という根本の遡って,データ収集計画を立てるのが正しい解析の姿勢である。何となく出力されてしまったアウトプットを気合をいれて読んで,無理やり解釈をこねまわす,というのは,分析の無計画さを糊塗する姿勢というべきであろう。(pp.38-39)

    ...因子分析と比べると,[主成分分析は]共通性の推定だとか因子の一意性をめぐるわずらわしい問題がなく,理屈が単純で使いやすい。(p.40)

    私は主成分は焼鳥とか焼トウモロコシのクシのようなもの,というイメージをもっている。よく屋台でトウモロコシを手に持ちやすいように棒を通して売っているが,あれが第1主成分ではないかと思う。
     もう1本串刺しにするなら,トウモロコシの中央部に1本目と直角にさしてやると安定がよくなるはずだ。これが第2主成分という感じである。もともとあった$x_1$,$x_2$を旧座標とすれば,$f_1$と$f_2$を新座標と考えることができる。データの散らばり具合,トウモロコシでいえばツブツブの位置の違いが一番要領よく表現できるように新座標を決めてやるのが主成分分析なのではないだろうか。(p.43)

     ところが,この[累積寄与率80%という]打ち切り基準そのものがあいまいなのだ。そもそも,この80%という数字はどこから出てきたのかといえば,単なる社会的な約束ごとであって,各方面のユーザーの長年にわたる了解事項に過ぎないのである。
     多変量解析には,このようにユーザーの間の極めて人間臭い取り決めに使い方を委ねてしまう,という側面がよく現れる。しかし,ではどの組織と法律に基づいて,80%という打ち切り基準が制定されたんだ,責任者は誰なんだ,と問い詰められても困る。決まっているような決まっていないような,あいまいな約束ごとなんですよ,とノラリクラリと逃げるしかないのである。(p.49)

     主成分の意味は,必ず解釈しなければならないとはいえないが,もしどうしても解釈するとしたら,主成分が直交している,という前記の性質は念頭においておくべきだろう。第1主成分が重さを表す主成分で,第2主成分は軽さを表す主成分だ,といった解釈を時々目にするが,これはナンセンスだ。もし第1主成分のプラス方向が「重い」ことを表すとしたら,第1主成分のマイナス方向が「軽い」ことを表すからだ。したがって第2主成分は第1主成分とはまったく関係のない主成分として解釈しなければならない。(pp.50-51)

     産業界における因子分析の利用度は極めて高く,利用頻度は多変量解析全体の3割くらいを占めているのではないか,と思われる。(p.56)

    やかましくいえば,この[SDチャート作成]ような数的処理が許される前提として,①尺度の1次元性,②等間隔性を仮定していることになる。①は,SDの尺度が物差しのように真直ぐかどうか?,「つまらない」という形容詞の対極にくるのは「面白い」だろうか,もし「楽しい」としたら結果が違ってきはしないだろうか?という問題である。
     ②は段階の幅がすべて等しいのだろうか?という疑問である。「非常に面白い」と「かなり面白い」の心理的な差は「やや面白い」と「どちらともいえない」との差と等しいと言いきれるのだろうか。
     ①②とも,個々の分析事態でさえ実証することが難しい問題で,一般的な立証などできるはずがない。一応①,②の性質が成り立つと仮定して,割り切って分析するしかないのが実情である。(pp.57-58)

    [オズグッドは概念の意味空間は言語や文化の違いに影響されずに共通しており,3因子 (Evaluation 評価,Potency 力動性,Activity 活動性) からなるとし,社会科学における一時のSD法ブームをもたらした。しかし,これには以下のような顛末がある。]
     にもかかわらず,オズグッドの3因子説が普遍的に成立するかのように誤解されたのは,次のような「実証」のカラクリによる。
    ① はじめからEPA3因子が抽出できそうな変数群を分析者が用意する。
    ② それでも解釈しづらい因子が出てきたら,その因子に関連する変数をカットしてしまう。
    ③ 再分析すると,必ずEPA3因子が抽出できて,「仮説は実証できました」と発表する。EPAという命名そのものが解釈にすぎないわけだから,「EPAだ」という強弁は必ず通るのである。……
     というような①→②→③の検証プロセスを反復してきたからであろう。
     いうまでもなく,このような論証はトートロジー (同義反復) であって,実証になっていない。仮説を否定することもできる調査が検証調査なのであって,必ずYESにできる調査では検証調査とはいえないのだ。最近はEPA3因子の検証という研究テーマが減ってきたのは,さすがに研究者自身がこれまでの「我田引水」の論法に気づいたためではないかと思われる。(pp.68-69)

    多変量解析といえども,人間の協力のもとにデータを獲得しようとするのであれば,人間の回答能力を無視しては応用が成り立たない。数多くの対象をそれぞれ数多くのスケールについて,5段階や7段階で延々と回答してゆくのはひと苦労であるに違いない。こうした負担を避ける手段として,最近ではSD法に代わって,…コレスポンデンス分析が利用されるようになってきたのである。(p.69)

     つまり,因子分析は観測データを分解しているのに対して,主成分分析は観測データを積み上げているのである。前者が微分的だといえば,後者は積分的だといえよう。あるいは,地面の上か下か,という比喩なら因子分析の方がモグラ的だといえば納得できるだろうか。(p.69)

     因子分析の論理では,調査なり実験から得られた観測データ自体にはさほど関心をもたず,観測値の背後に潜んでいると思われる (因子) という仮設的な概念の方に関心をもつのである。なぜこうもややこしい理屈を考え出したのかというと,因子分析が人間の心的構造を探ろうとする心理学者の手によって生み出されたという出自に理由がある。たとえば,生徒たちに試験をしたらできのいい子はどの科目も成績がよかった,としよう。すると表面に現れた各科目の成績の背後には「一般的な知能因子」が存在しているのではないか,などと思案されるのである。さらにその知能因子は,「理数系能力」と「語学系能力」に分かれるのではない,あなどといった研究が因子分析の先駆者達によってなされてきた。
     一方,主成分分析は$\bm{f = Xw}$という乗積モデルであるから,論理は単純明快である。要するに,多数の指標ではわずらわしいから,それを少数の合成指標に要約しちゃえ,という実務的なニーズに沿った方法なのである。
     因子分析と主成分分析はどちらが難しいかというと,因子分析の方がはるかに難しく高度な問題を扱っている。このようなややこしく面倒な議論を嫌う人は,主成分分析を選ぶ傾向があるし,逆にややこしく面倒な議論を好む人は,因子分析を選ぶ傾向が強い。(pp.69-70)

     ユーザーにとってみれば,回転は因子分析と主成分分析を分ける大きな相違点である。回転のしようによっては因子の解釈が用意になる,というこれまた主観的な「解釈」があり得る。これも因子分析のファンにとっては,因子分析の醍醐味といえる。
     一方主成分分析の方は,同一のデータであれば誰が分析しても同じ結果が出てくるので,分析の再現性という意味で価値がある。結局,この2つの分析法の使い分けは,分析者の性格ないし価値観によって決まるということになろう。時々,同じデータなのに,因子分析と主成分分析では違った結果が出たが,どちらが正しいんだろうか?と悩む人がいる。真実は「どちらも正しい」のである。(pp.70-71)

    因子分析では,つい仮説が実証できたかのように思い込みがちであるが,むしろ仮説通りの結果が出たら,プラス情報が何もなかったと思わなければならない。明るい,陽気だ,クヨクヨしない,前向きだ…などと似たような変数を用意して因子分析しておいて,「明るさ因子」が発見されました,などといって何の意味があるというのだろうか。
     …
     なぜこの質問項目とこの質問項目が同じ因子に結びついてしまったのだろうか?なぜ予想通りの因子が出てこなかったのだろうか?と疑問をもって研究をスタートさせることに,因子分析の本来の価値がある。因子分析は研究のゴールではなく出発点なのだ。(p.73)

  • 多変量解析で実務的に迷ったときに使える。

  • 私が多変量解析に触れたのは上司による勉強会。(10年以上前)
    内容が数理中心だったこともあり「むつかしい」という印象しか残らず、ソフトウェアも手元にあるのに多変量解析の適用は全く進まず。。。という苦い経験があります。
    その後、「とにかくやってみよう的」書籍との出会いが後押しとなり、手元のソフトウェアで実行してみるも、ソフトウェアによって考え方に違いがあるためか結果数値が異なる。。。 う〜ん、でも違いがわからない。
    加えて、解法が多岐にわたる手法もあって、どれがベターかもわからない。。。 どうしてこんなに難解なんだ?

    この書籍は、そんな悩みに一番応えてくれた書籍でした。「あっ、そうだったんだ」「とりあえずこの方法でやりゃあいいんだ」「いくつかの手法の組み合わせもこんな風にできるんだ」などなど、個人的にはかなり助かりました。

    私と同じような悩みを持つ人は結構いるんじゃないかな。この本は そんな悩みを持つ輩にとっての先生ですね。

  • 多変量解析について概要を示していてよかった.本当に入門書としてはよさそう.多変量解析の本を買うとしたら,これよりも高度なものを買おう.

  • 多変量解析の理解に最も役立った本。統計ソフトなどで実践していく際に、側に置きたい。

全5件中 1 - 5件を表示

著者プロフィール

中大

「2017年 『ビジネスマンがはじめて学ぶベイズ統計学』 で使われていた紹介文から引用しています。」

朝野煕彦の作品

  • 話題の本に出会えて、蔵書管理を手軽にできる!ブクログのアプリ AppStoreからダウンロード GooglePlayで手に入れよう
ツイートする
×