動的視覚化による統計学入門

著者 :
  • 日科技連出版社
3.00
  • (0)
  • (0)
  • (1)
  • (0)
  • (0)
本棚登録 : 3
感想 : 1
本ページはアフィリエイトプログラムによる収益を得ています
  • Amazon.co.jp ・本 (171ページ)
  • / ISBN・EAN: 9784817103925

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • 浪平 博人(なみひら ひろと、1942年2月21日- )は、大妻女子大学社会情報学部教授、技術士(情報処理)、博士(工学)
    http://ja.wikipedia.org/wiki/%E6%B5%AA%E5%B9%B3%E5%8D%9A%E4%BA%BA

    統計学の基礎を"動的視覚化"技法を用い、イメージで理解できるように工夫されている。

    要点
    「統計学は、母集団に関する知識について、標本を通して知るための組織的な方法である。」
    「統計学は、ばらつくデータを用いて合理的な判断・推定・判定を必要とする問題の解決に欠かせない道具である。」
    「無作為抽出とは、標本はどのデータも公平に、あるいは別の言葉で言えばまったくデタラメに、選ぶべしという原則です。無作為抽出で選ばれた標本のとき、それは母集団の性質を受け継いだもの、あるいは母集団の縮図であると考えることができます。」
    「分散は分布のばらつき度合いを示す値である。σ^2=Σ(xi-μ)^2・p(xi)分散の平方根を標準偏差と言い、分布から生じる値が中心から外れる平均的な距離を示す。σ=√Σ(xi-μ)^2・p(xi):標準偏差」
    「1回の試行で事象Aが確率pで起きるとき、n回の試行で事象Aの起きる合計回数xの従う分布を2項分布と言う。P(x)=(n x)p^xq^n-x=n!/x!(n-x)!・p^xq^(n-x), q=1-p 平均: μ=np 分散: σ^2=npq=np(1-p) 標準偏差: σ=√npq 」
    「一定領域内にランダムに起きるある事象Aの生起回数平均がλであるとき、x回生じる確率は次のポアソン分布に従う。P(x)=λ^x/x!・e^-λ 平均: μ=λ 分散: σ^2=λ 標準偏差: σ=√λ 」
    「正規分布は、平均と分散のみで規定され、N=(μ, σ^2)と表記される。P(x)=1/√2πσ・e^-(x-μ)^2/2σ^2 正規分布の確率の目安 μ-σとμ+σとの間の面積は、約68% μ-2σとμ+2σとの間の面積は、約95% μ-3σとμ+3σとの間の面積は、約99.7% すべての正規分布は相似形で、標準化の公式で標準正規分布に変換される。 z=(x-μ)/σ」
    「分布の合成: 分布S X={1, 2, ・・・, n} p(i), i=1, 2, ・・・, nがある。Sかm個の確率変数の和Zの分布はmが大きくなると、分布Sの平均、分散をμ, σ^2として、N(mμ, mσ^2)に近づく、ここで、μ=Σip(i), σ^2=Σ(i-μ)^2・p(i)
    n個の確率変数X1, X2, ・・・, Xnがあり、Xiは平均μi, 分散σi^2の分布に従って発生し、互いに独立であるとする。そのとき、Z=a1X1+a2X2+・・・+anXnの平均μzおよび分散σz^2は、次の式で表される。(加法定理)μz=a1μ1+a2μ2+・・・+anμn σz^2=a1^2・σ1^2+a2^2・σ2^2+・・・+an^2・σn^2 元の分布が正規分布のときは、Zは正確に正規分布である。元の分布が正規分布でなくとも、Zはnの増加とともに急速に正規分布に近づく。」
    「正規母集団N(μ, σ^2)から抽出されたn個の標本データより算出された標本平均mは、N(μ, σ^2/n)に従って分布する。すなわち、mの分散は母集団分散のn分の1、標準偏差で言えば母集団標準偏差の1/√nとなり、中心に集まった分布となる。」
    「標準正規分布N(0, 1)よりn個の互いに独立な確率変数x1, x2, ・・・xnを得たとき、χ^2=x1+x2+x3+・・・+xnは自由度nのカイ2乗分布に従う。このχ^2は、n個の独立変数における分散の合計を意味する。自由度nのカイ2乗分布の平均、分散および標準偏差は、以下のとおりである。平均: n 分散標準: 2n 偏差: √2n」
    「1)次の統計量tはt分布に従う。t=y/√χ^2/n x1, x2, ・・・, xn ←N(0,1), χ^2=Σxi^2, y←N(0,1)
    2)N(μ, σ^2)からn個の標本データをとり、次の統計量をとるとき、y=(xbar-μ)/σ/√n, χ^2=Σ(xi-xbar)^2/σ^2 これらの比tは、真の分散値を含まない量であり、自由度(n-1)のt分布に従う。t=y/√χ^2/(n-1)=(xbar-μ)/(σ/√n)/√Σ(xi-xbar)^2/((n-1)σ^2=(xbar-μ)√n/s ここで、s^2=1/(n-1)Σ(xi-xbar)^2で、標本分散である。」
    「1)χ1^2, χ2^2が自由度n1, n2のカイ2乗分布に従う互いに独立な変数のとき、次の量Fは、F=χ1^2/n1/χ2^2/n2 自由度(n1, n2)のF分布と呼ばれる分布に従う。
    2)正規分布N(μ1, σ1^2), N(μ2, σ2^2)からのn1, n2個の標本値x1, x2, ・・・, xn1およびy1, y2, ・・・, yn2とするとき、次のF値は自由度(n1-1, n2-1)のF分布に従う。s1^2=1/(n1-1)Σ(xi-xbar)^2 xbar=Σxi/n1 s2^2=1/(n2-1)Σ(yi-ybar)^2 ybar=Σyi/n2 F=s1^2/σ1^2/s2^2/σ2^2」
    「信頼係数α%に対応する係数をβα/2とすれば、信頼区間は次のように表現できる。P(xbar-βα/2・σ/√n≦μ≦xbar+βα/2・σ/√n)=α%」
    「nを標本数、α%を信頼係数として、母平均μのα%信頼区間は、分散既知の場合: P(xbar-βα/2・σ/√n≦μ≦xbar+βα/2・σ/√n)=α% ここで、βα/2は標準正規分布から計算 分散未知の場合: P(xbar-βα/2・s/√n≦μ≦xbar+βα/2・s/√n)=α% ここで、βα/2は自由度(n-1)のt分布から計算」
    「仮説H1の検定の手順は、次のようになります。(1)対応する帰無仮説H0を立て、H1を対立仮説とする。(2)有意水準αと対応する棄却領域を設定する。(3)標本データXをとる。(4)帰無仮説H0のもとで、Xの起こりやすさを示す指標Yを計算する。(5)Yが棄却領域に落ちれば、H1を採択する。規約領域でないなら、H1を否決する。」
    「相関係数とは、2つの確率変数間の関係度合いを数値で表したもので、-1〜1までの数値をとる。絶対値が1に近いほど関連が強い。」
    「誤差を含むデータ発生構造があるy=a0+a1x+ε (われわれは真の構造を知ることができない) → x, yがn回計測されたデータ(標本)を得た (もう1度別のデータをとれば、異なったデータの組が得られた) → これから(a0, a1)を推定する (これらは推定値であって、真のものではない) → (â0 â1)=(n Σxi Σxi Σxi^2)^-1(Σxi Σxiyi) これがa0, a1の最良推定値 推定に用いたデータはたまたま得られたものであり、このデータを基に推定した係数は真の値の周りにばらつく、そのばらつきを知りたい → 係数のばらつき方は誤差εの分散に関係する。誤差を知ることができず推定するしかない。残差を誤差に見立てて、誤差の分散を推定する。e1=yi-â1xi σ^2=Σei^2/(n-2) 自由度が(n-2)に減っている → 推定された誤差の分散から、係数の真の値からのばらつき(分散)を計算できる。これで推定された係数の信頼性(本当のものがどの範囲にあるか)がわかる。」

    参考
    「ポアソン分布の導出」
    「自由度nのt分布の密度関数は、次のようなものです。gn(t)=Γ((n+1)/2)/Γ(n/2)√nπ・(1+t^2/n)^-(n+1)/2」
    「自由度(n1, n2)のF分布の密度関数は、次のようなものです。F=χ1^2/n1/χ2^2/n2 χ1^2, χ2^2は自由度n1, n2の互いに独立なカイ2乗分布 hn1, n2(F)=Γ((n1+n2)/2)/Γ(n1/2)Γ(n2/2)・(n1/n2)^n1/2・F^n1/2-1(1+n1/n2・F)^-(n1+n2)/2」
    「誤差 εi=yi-(a0+a1xi) 残差 ei=yi-(âo-â1)」

    キーワード
    母集団、標本、無作為抽出、母数、頻度、階級値、事象、試行、離散的、連続的、確率密度関数、平均、分散、標準偏差、平均値、期待値、2項分布、ポアソン分布、正規分布、中心極限定理、畳み込み(convolution)、加法定理、線型結合、統計量、標本平均、標本分散、標本平均分布、標本平均の結合分布、カイ2乗分布、標本分散の分布、t分布、大標本論、小標本論、F分布、推定、信頼係数、信頼区間、検定、仮説、有意である、帰無仮説、対立仮説、有意水準、5%の有意水準で仮説は採択された、帰無仮説を棄却する領域を棄却域、第1種の過誤、第2種の過誤、平均の検定、割合の検定、平均の差の検定、分散の比較による検定、分布の型の検定、多変量、相関、相関係数、分散・共分散行列、回帰、線型関係、誤差、残差、不偏推定量、

    本書付属のCD-ROMに15種類の統計手法をVB(Visual Basic)実行形式で収録されている。
    ランダム分布、無作為抽出、母集団情報抽出、ヒストグラム、2項分布、ポアソン分布、正規分布、中心極限定理、標本平均分布、t分布、F分布、検定、カイ2乗検定、相関、単回帰

    【主要内容】
     大学ではじめて統計学を学ぶ昨今の学生に対しては、数式を厳密に説いても、手順をていねいに述べても、全体の意味はなかなか伝わらない。意味がわからないまま機械的に頭に詰め込んだ数式や手順で成り立った知識を積み上げていくとき、最後に残るものは“さっぱりわからない”という実感のみである。
     本書は統計学本来の意味を伝達することを主眼として書き、本文での説明において、目に見える形で表現できるものは視覚化するよう工夫している。その内容を実際に経験するためのコンピュータプログラムによって、統計学の主な手法のエッセンスを動的に視覚化した。これを見ながら学習することで、統計の本質をほぼ瞬時に理解できる。著者はこれを“Dynamic Visualization Method:動的視覚化技法”と呼び、論理の意味するところを印象的に学習できるようにした。付属CD-ROMには、2項分布、ポアソン分布、正規分布など15種の統計手法をVB(Visual Basic)の実行形式で収録している。実行形式は,手法ごとに画面図を添えてていねいに説明しており,容易に操作することができる。
    【主要目次】
     1章 統計学とは何か
         統計学の扱う問題/無作為抽出
     2章 標本の整理
     3章 分布の性質
         分布の基礎/平均の意味/分散の意味
     4章 主要な分布
         2項分布/ポアソン分布/正規分布/一般正規分布と標準正規分布との     対応/2項分布の正規近似/中心極限定理/分布を正規と仮定する根      拠(中心極限定理)/加法定理
     5章 標本分布
         標本平均および標本分散/標本平均の分布/カイ2乗分布:標本分散の
         分布/t分布/F分布:標本分散の比の分布
     6章 推定
         信頼区間の決め方/平均の推定/分散既知の場合の平均値の推定/
         分散未知の場合における平均値の推定/2項分布の母数の推定/分散     の推定
     7章 検定
         検定の構成/帰無仮説による検定/分布の型の検定
     8章 多変量
         相関/分散・共分散行列/回帰
    問題解答例
    付録
    附属CD-ROMについて

全1件中 1 - 1件を表示

浪平博人の作品

最近本棚に登録した人

  • 話題の本に出会えて、蔵書管理を手軽にできる!ブクログのアプリ AppStoreからダウンロード GooglePlayで手に入れよう
ツイートする
×