- Amazon.co.jp ・本 (272ページ)
- / ISBN・EAN: 9784887596993
感想・レビュー・書評
-
あまり新規性のあるような話では無いような。
詳細をみるコメント0件をすべて表示 -
統計データの見かたのポイントは、本文を読むよりさきに図を見ろ。自分で調べ、自分で考えるようにしよう。自分で考えることの最大の敵は、自分はわかっているという過信とズバリ指摘。私は、面倒くさいという怠惰な気持ちだと思うけどなぁ。
-
★若いうちに読んでおくとよい本
-
「データを自分でみて意思決定できるようになる」というコンセプトで書かれている本。
非常に分り易く書かれていて、読みやすい。
統計の細かい点には言及していないので、統計を学ぶことは出来ないが、「どのようなことに注意してデータと向き合うべきなのか」について理解できると思う。 -
自力で考えることの最大の敵は,自分にはわかっているという過信です.
べき分布はたいへんだあ -
統計学にもとづく事象の基本的な見方をどのようにするのか。身近な例をふんだんにもちいている点が評価でき、統計学にちょっとでも関心をもつこれから勉強する学生・社会人にはおすすめ。
-
データ、統計から読み解くための力を身につけるための本。
ガチガチな統計本ではなく、始終平易な文章で書かれています。
統計では入門書でも式が難しく挫折することがよくありますが、この本はそういったものがなく、身近を題材にしつつ、変に統計統計(?)してないところがこの本で凄いところです。
グラフからどうやって考えるのかといった思考方法の養成本としても優れているのではないでしょうか。 -
世の中にはデータやそれを解説した情報が氾濫しています、あるテーマに絞って詳細に見ていると、全く正反対の結論となっていることに気づきます。格差がこの10年で広がったか否かという議論を始め、人口が増加する減少する等、事実は一つであるはずなのに、それに用いるデータや仮定によって結論が違ってきているのだと思います。
データを解釈するには、それに至った過程や、そのような考え方をしたかが重要なのだと思いました。それを訓練する材料としてこの本はとても役に立ったと思います。また基本的なことでしたが、偏差値や合計特殊出生率の定義(p148、220)もこの本で勉強させていただき感謝しています。
以下は気になったポイントです。
・格差の目安となるローレンツ曲線は、所得の累計(X)が全体の何%にあたるか(Y)から求めるもの、XY軸の45度線とローレンツ曲線が囲む部分の2倍がジニ係数の定義、2倍にすることで値の範囲が0から1となって分かりやすい(p58)
・2002年と2005年(小泉政権は2000~2006年)のジニ係数の上昇分の9割は、高齢化(54.9から57.8歳)と、平均世帯人員の縮小(2.82から2.78)で説明できる(p64)
・ジニ係数は当初所得でみると1981年から2006年までに0.35から0.52へ上昇しているが、再分配所得(当初所得-税金+現物給付:医療、介護、保育)でみると、0.31から0.38程度の上昇、年金を考慮した等価再配分所得でみると、1993年から2006年までに0.30から0.32であまり変化はない(p63)
・アメリカの年間所得の”べき分布”(x:累積比率、y:年間所得)は、99%までと上位1%とは異なっている、1935年時点でそれが見られる(p123)
・所得データの場合は、平均値ではなく中央値のほうが状況を表すのに適している(p128)
・偏差値=50+10x(得点-平均点)÷標準偏差、正規分布であれば偏差値50±5:38%、55~65:24%、65~75:6%(p149)
・アンケートが偏るのは母集団をどれにするかで結果が異なる、インターネットを用いた社会調査は偏る可能性あり(p159)
・1997年のノーベル経済学賞をショールズとマートンは「元になる株とオプションの組み合わせ(ポートフォリオ)の収益率の平均が、銀行に預けた金利と同じになるように値段を決めればよい=ブラック・ショールズ評価式」と考えた、これを可能にした仮定は、株価の動きが正規分布を使って書けるというもの(p165)
・株価のように、ときおりものすごく大きく変動するものに対しては、平均や分散が存在しないことがある、つまりブラックショールズ評価式は使えないことがわかった(p176)
・LTCMという投資銀行は、正規分布に基づいてリスクを見積もり、何万年に1回も起きないと考えていた大変動で、その資産のほとんどすべてを失った(p177)
・現在においても、分散投資の基礎である現代ポートフォリオ理論は、「ポートフォリオに組み入れられる株や債権の価格分布が、それぞれ平均・分散をもつ」ということを前提にして行われている(p179)
・回帰直線において計算される決定係数(R2)は、横軸の値(説明変数)が、縦軸の値をどれくらい説明しているか、を示している(p187)
・回帰分析において注意することは、相関とは対応関係を示したものであり、因果関係ではないということ(p188)
・それまでに一度も起きたことがないことは、どんな分析手法を使っても予測できない、予測するためのデータが足りないからであり、データ分析の限界(p213)
・合計特殊出生率は、子供を生む可能性のある女性(15~49歳)における現時点での出生率を足したもの、「ある一人の女性が、現在の各年齢の女性と全く同じ確率で子供を生むと仮定した場合の出生数」である(p221)
・データのある1970~1985年生まれの年齢別累積出生率をみると、1985年生まれの女性は15歳から19歳にかけて、1970年生まれの女性よりも高い、但しコーホート完結出生率が上がる見込みはない(p225)
・従属人口指数=(年少人口+老齢人口)÷生産年齢人口(15~64)、1920~2050年までを見ると、1970~2004年までは50%を下回っていて負担の少ない時代、2014年頃に60%、2020年から2030年にかけて70%となる、これは戦前と同じレベル(p233)
・自分の興味を持つ分野の論文を検索する場合、”Google Scholar"が役に立つ(p241)
・日本の状態を概観するには、総務省のなかの日本統計年鑑のデータが有効(p259) -
小飼 弾の書評の、
統計学は理工学部でも実はきちんと教えず、頭ごなしに「こうしろ」と押し付けられることが多い学問なのだが、著者は「重点攻撃目標」を「分散」に定めることで、導出には大学レベルの数学が必要な「なぜこうする」を、中学生にもわかるように説明することに成功した。
してやられた、という感じだ。塾の講師をしていたとき、私もなぜ「標準偏差はなぜ2乗してルートを取るのか?」という質問を受けたことがあったが、どうしても彼女を納得させることが出来なかった。こんないい方があったとは!
を読んで、その方法が知りたくて読みました。さすがに、今はもう空気のように使っている式なのですが、確かに誰が決めたんだろう? なぜ、この式になったんだろう?? という疑問がありました。
でもって、読んで納得、すっきりです。
標準偏差でつまづいた方は、立ち読みでもいいから読んでみてください(pp. 137-144)。
それから、相関の話しもなかなか大切なことが書いてあって是非読むべきと思うのですが、個人的には、「サンプルサイズと意味のある相関係数の大きさ」の表(p. 197)が、「そうそう、この表、欲しかったんだよ」って感じで、うれしかったです。
要するに、データ群から相関を求める時に、EXCELで散布図を描けば、相関係数も出てくる(R^2の値)のですが、それがいくつ以上なら、相関があるって言ってよいかはデータの数によって変わってくるのですね。
したがって、この表を見て、例えば、サンプルデータ数が30個なら、その行を見て、偶然に相関係数が0.361を超える確率は5%以下で、0.463を偶然超えるのは1%以下かということが言えるというわけです。
(サンプルデータの数が30個で、相関係数が0.463を超えていたらまー、相関があるって言っていいよねって使えるということです)
もっとも、この本にも書いてありますが、サンプル数が20~30個程度で相関の有り無しを判定するのは危険ですが……。
あ。あと、書き忘れましたが、この本は、いわゆる文系で数式が苦手って方でもまったく問題なく読みこなせます。そして、「生のデータにあたれ!」や「グラフ化しろ!」というメッセージを実例を通して納得させられると言う点も価値があります。 -
再読!