- Amazon.co.jp ・本 (284ページ)
- / ISBN・EAN: 9784873116150
作品紹介・あらすじ
人気の高いオープンソースのツール、RとRubyを使い、生データを処理し、シミュレーションし、仮説を立て、統計的手法を用いて検証する、というデータサイエンスの基本の理解を促します。基本が学べるだけでなく、自分のメールボックスや自分の心臓の鼓動など身近な題材を対象としており、データサイエンスの醍醐味を味わうことができる一冊です。日本語版ではさまざまな統計手法についての入門となる章を追加。この本で使っている統計の基礎も学べる構成になっています。
感想・レビュー・書評
-
詳細をみるコメント0件をすべて表示
-
最初の二章はrubyとRの解説。
次は検定について。
残りはシミュレーションによるデータの生成と解析。すでにあるデータでなくシミュレーションに重きが置かれていてなんとなくくどい。トイレの数とか、親近感の湧かないテーマなのもイマイチ感を醸し出してる。 -
請求記号 417/C 33
-
日本語テキスト分析を自動化する上で、R+Rubyは最強の組み合わせ。修論研究では、この偉大な先人たちの資産を使用させて頂いた。ご恩返しとして、研究結果がわずかでも人類進展に寄与できるようがんばろう。たとえわずかでも。
-
R に関する本でも Ruby に関する本でも、データ解析に関する本でもないので、いずれかを期待して読むと裏切られる。そもそも原題は「Exploring Everyday Things with R and Ruby」なので、「データ解析入門」はほとんど誤訳と言っていいレベルだ。さすがにこの内容でデータ解析を名乗るのは気が引けたのか、翻訳者が統計に関する章を丸々 1つ追加して、さらに各章にその統計分析(t検定やスペクトル分析など)を利用する部分を追記しているのだが、これが完全に原著に混ぜ込む形で追記されているため、どこまでが原著者の意図した内容で、どこからが翻訳者が追加した内容なのかがまったく判らない(まあ、判るけど)。この統計分析の追加によって原著の意図を損なっていないとも限らず、これはさすがに翻訳をいう行為を逸脱しているのではないかと思った。
本の内容自体は面白く、Ruby を使ってトイレの待ち行列、需要供給と物価の関係、鳥の群れといった様々な出来事をモデル化した後、生成されたデータを R で可視化して考察する。その他、Ruby で音声データや動画データを解析することで、聴診器や血中酸素濃度を計るパルスオキシメターを自作したりもする。Ruby と R というツールで、世界の見方が変わるような素晴しい実験が簡単にできることを示し、プログラミングの可能性と楽しさを教えてくれる一冊。 -
Rを活用したデータ解析の入門書。工夫を凝らしたデータを活用し、興味をひくが、シミュレーションに基づくデータの比重がちょっと多すぎる印象。ネットに散らばるデータ活用の事例がもう少しあると良かった。