RとRubyによるデータ解析入門

  • オライリージャパン
3.18
  • (2)
  • (4)
  • (6)
  • (5)
  • (0)
本棚登録 : 212
感想 : 10
本ページはアフィリエイトプログラムによる収益を得ています
  • Amazon.co.jp ・本 (284ページ)
  • / ISBN・EAN: 9784873116150

作品紹介・あらすじ

人気の高いオープンソースのツール、RとRubyを使い、生データを処理し、シミュレーションし、仮説を立て、統計的手法を用いて検証する、というデータサイエンスの基本の理解を促します。基本が学べるだけでなく、自分のメールボックスや自分の心臓の鼓動など身近な題材を対象としており、データサイエンスの醍醐味を味わうことができる一冊です。日本語版ではさまざまな統計手法についての入門となる章を追加。この本で使っている統計の基礎も学べる構成になっています。

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • RとRubyによるデータ解析入門

    ### サマリ

    #### 動機
    Rubyを分析方面で使うとしたらどういう活用ができるのかイメージをつけるため

    #### 感想
    - データ解析入門というよりは、シミュレーションの事例集?この本を理解するために覚えるべきことが多いので今じゃないかな。

    ### 学んだこと

    コマンドラインでのRの起動

    ```
    $ R # 大文字

    > q() # 終了
    ```

    ベクトル(1次元配列)の入力。

    ```
    >height <- c(59,60,61,62,63,64,65)
    >weight <- c(115,117,120,123,126,129,132)
    >height[1] # Rubyの配列と違い、1から始まる
    ```

    散布図の表示(ターミナルで実行すると別タブで開く)

    ```
    plot(weight,height)
    ```

    範囲オブジェクトのような表現の仕方

    ```
    > a <- 1:10
    > a
    [1] 1 2 3 4 5 6 7 8 9 10
    ```

    関数の定義もまあイメージできる範囲

    ```
    > my_func <- function(x,y){ x + y }
    > my_func(1,2)
    ```

    RStudio環境設定の参考。まとまっていて非常にわかりやすい。
    https://das-kino.hatenablog.com/entry/2019/11/07/125044

    行単位の実行cmd enterとファイル全体の実行cmd sft enterは覚える

    Rのリストは位置とキー療法を持っているので、どちらでも参照できる

    ```
    b <- list(name="ken",age=29,glasses=TRUE)
    ```

    行列は2次元配列。`:`は~、`,`は行列を指定するのでそれぞれ扱いに注意。

    ```
    m <- matrix(1:20, nrow=5, ncol=4, byrow=TRUE) # byrowをつけると、数字を行方向に展開する
    m[1:2]
    dimnames(m) <- list(c('a','b','c','d','e'), c('q','w','s','d')) # 行列に名前をつける
    m
    ```

    Rの値には以下の3つがある。

    1. 名義値:カテゴリを記述するラベル。順位はない
    2. 順位値:ラベルだが、順位づけされているもの。
    3. 連続値:値の列。数字。

    データフレーム型が実際良く使うやつ

    ```
    home_wins <- c(14,10,9,7,5,3)
    home_draws <- c(0,1,2,3,4,4)
    home_losses <- c(0,2,1,3,4,5)
    league <- data.frame(team,home_wins,home_draws,home_losses)
    ```

  • 最初の二章はrubyとRの解説。
    次は検定について。
    残りはシミュレーションによるデータの生成と解析。すでにあるデータでなくシミュレーションに重きが置かれていてなんとなくくどい。トイレの数とか、親近感の湧かないテーマなのもイマイチ感を醸し出してる。

  • 請求記号 417/C 33

  • 日本語テキスト分析を自動化する上で、R+Rubyは最強の組み合わせ。修論研究では、この偉大な先人たちの資産を使用させて頂いた。ご恩返しとして、研究結果がわずかでも人類進展に寄与できるようがんばろう。たとえわずかでも。

  • R に関する本でも Ruby に関する本でも、データ解析に関する本でもないので、いずれかを期待して読むと裏切られる。そもそも原題は「Exploring Everyday Things with R and Ruby」なので、「データ解析入門」はほとんど誤訳と言っていいレベルだ。さすがにこの内容でデータ解析を名乗るのは気が引けたのか、翻訳者が統計に関する章を丸々 1つ追加して、さらに各章にその統計分析(t検定やスペクトル分析など)を利用する部分を追記しているのだが、これが完全に原著に混ぜ込む形で追記されているため、どこまでが原著者の意図した内容で、どこからが翻訳者が追加した内容なのかがまったく判らない(まあ、判るけど)。この統計分析の追加によって原著の意図を損なっていないとも限らず、これはさすがに翻訳をいう行為を逸脱しているのではないかと思った。

    本の内容自体は面白く、Ruby を使ってトイレの待ち行列、需要供給と物価の関係、鳥の群れといった様々な出来事をモデル化した後、生成されたデータを R で可視化して考察する。その他、Ruby で音声データや動画データを解析することで、聴診器や血中酸素濃度を計るパルスオキシメターを自作したりもする。Ruby と R というツールで、世界の見方が変わるような素晴しい実験が簡単にできることを示し、プログラミングの可能性と楽しさを教えてくれる一冊。

  • Rを活用したデータ解析の入門書。工夫を凝らしたデータを活用し、興味をひくが、シミュレーションに基づくデータの比重がちょっと多すぎる印象。ネットに散らばるデータ活用の事例がもう少しあると良かった。

全10件中 1 - 10件を表示

Sau Sheong Changの作品

  • 話題の本に出会えて、蔵書管理を手軽にできる!ブクログのアプリ AppStoreからダウンロード GooglePlayで手に入れよう
ツイートする
×