データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)

  • 412人登録
  • 3.37評価
    • (7)
    • (22)
    • (30)
    • (7)
    • (2)
  • 25レビュー
  • 技術評論社 (2013年8月8日発売)
  • Amazon.co.jp ・本 (152ページ)
  • / ISBN・EAN: 9784774158969

この本を読んでいる人は、こんな本も本棚に登録しています。

有効な左矢印 無効な左矢印
クリス・アンダー...
デール カーネギ...
エリック・リース
有効な右矢印 無効な右矢印

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)の感想・レビュー・書評

  • 良くも悪くも広く浅くデータサイエンスについての雰囲気を味わえる本。バランスはいいと思うので、表面的な知識を得るためには最適な一冊だと思う。一方で、この一冊だけでRやPythonなどでデータ分析する方法を学ぼうとすると生煮えになってしまうため、実行せず眺める程度に止めておくほうが無難かと思われる。

  • 昨今のビッグデータ時代の世の中で、どの様に活用してソリューションしているのか、全体を大掴みしたいなと思い、読んでみました。
    自分にとって初めての用語がかなり多くて、読み進めるのに難航しましたが、なかなか面白かったです。
    仕事では、正規分布や検定・推定といった古典統計しか使用してませんが、ここで述べられている機械学習で利用している各種ツール(k-means法、SVMなど)について、せっかくの機会なので、今の仕事のどこかで適用できたらいいなと思ってます。
    それが、この本を読んだ価値に繋がると思いますので。

  • データサイエンス侮り難し。思いの外、求められる技術が
    多岐にわたっている。
    自分の場合は、まずは統計学なんだろうなあ。
    いかんせん使われている言葉が分からなすぎる。

    そして、RかPythonだろうなあ。もしくは用途に応じて
    両方なのかもしれない。

    Webスクレイピングはちょっと怖いけど、面白そう。

    基本的に、分析するよりも情報収集している方が
    楽しいんだろうな。。。

  • データサイエンスの入門として、データサイエンスをとりまく様々な話題を扱ったもの。データサイエンティストに必要とされるスキル面の藩士から、Rやpythonでのいくつかのアルゴリズムの実際の記述、マーケティングなどの応用例、Flutend、SQL、Webスクレイピングと話題が多岐に渡っている。

    ちょっといろんな話題を詰め込みすぎて焦点がぼやけているような印象を受ける。レベル感もあまり統一されたものではない。最初に読んでそれぞれの事項がどんなものかをざっと掴む。個々の記述はレベルの高いものもあるので、いわば雑誌のように考えて後で記事に戻ってきたほうがよいだろう。

  • 読んでみたけど、あんまりクールな仕事じゃないな。
    やっぱりスキル面でのハードルが高い。

  • 教科書チック。データサイエンティストに必要なスキルを体系的にザッと学べる。読んでみたもののかなり難しく、興味も持てなかったためほとんど読み飛ばし。自分がデータサイエンティストに向いてないことが分かったことは大きな収穫。響きは面白そうなんだけどね笑

  • 2015/09/22
    全体を網羅する点では素晴らしい。書いてある内容を一個づつ参考書籍やWebなどで、自分のものにしていけばそれなりに最先端に近づくような教材っぽい仕上がり。
    網羅性に長けているわけでも、実務性に長けているわけでもないのが残念で、興味のとっかかりとしての雑誌のような役割だと思う。

  • データ活用の流れ、必要なスキルセット、代表的なデータ分析手法などがまとめられています。タイトル通りに「身につく」かどうかはわかりませんが、概要を知るにはよい雑誌だと思います。熟読するほど深みはありませんが、手元に置いておきたい一冊です。

  • 統計を実務に使う際の初歩的な事例がのっている

  • 基本的な項目。説明はざっと。でも、Rと、Rだけではできないところ、を中心に書いてあって、そこが良かった。より実践的

  • ざっくり知るには良いでしょう
    なんとなく分かるだけで詳しくは分かりません
    初めてデータサイエンスの世界を知りたい人に有効です

  • 図書館で借りた。かなり盛りだくさんデータサイエンティストって面白そう

  • バズワードであるデータサイエンティストとして必要なスキルの概略について説明されている。

  • 1.センサー技術
    2.Rというオープンソース
    機械学習、RFM分析(マーケティング)
    ーー
    機械学習には
    教師あり学習と教師なし学習があり、教師あり学習はランダムフォレストとSVMがある。
    ーーーーーデータサイエンティストのリテラシー
    MySQL:構造化データ
    MongoDB:非構造化データ
    WEBスクレイピング用にWEBスクレイピング関数を創ればよい。本書に掲載されている。
    seekRにいろいろなプログラムが掲載されている。
    カテゴリカル変数・連続値変数
    棄却率は5パーセント
    対立仮説と帰無仮説の相対する2つの仮説を立てる。
    t検定(対応あり/対応無し)及び分布状況によらないU検定がある。
    ratioの検定を行うカイ二乗検定。
    はずれ値の検定を行うスミルノフ・グラブス検定もある。
    ーーーーーー
    ●散布図行列ってなんだ?(不明)
    ●機械学習がよくわからん。
    ーーーーー
    ●データマイニングで必要な10個のスキル
    ①C4.5
    C5.0はRに実装されている。
    ②k-meansアルゴリズム
    クラスタリングで最も優れた手法。
    ・データにクラスタうぃ割り振る、
    ・平均値を計算
    上記2つを収束するまで計算。GAP統計量というクラスタ数を推測する関数をRでは出ている。
    ③サポートベクタマシン(SVM)
    機械学習の分野で最も優れた手法。手入力推測等で使用。

    ④アプリオリアルゴリズム
    大量のトランザクションからつながりを見つける。

    ⑤EMアルゴリズム
    別名:期待値最大化法。Rでは尤度比検定関数として用意されている。
    E:予想/M:最大化で収束するまで繰り返す。

    ⑥ページランク

    ⑦アダブースト
    ブースティング手法の一つ。
    いくつかの学習器を組み合わせて強力な予測性能が得られる。
    Rでは勾配ブースティングモデル(GBM)関数として実装。
    ⑧k-近傍分類
    まる暗記型分類器。

    ⑨ナイーブベイズ
    クラスを予測するための手法。
    統計、データマイニング、機械学習、パターン認識の分野で改良中。
    Rではlearn関数で実装。
    ⑩CART
    クラス、連続値、生存時間等の予測。
    ーーーーマーケティングサイエンス
    広告は3つに大別
    ①情報提供型
    ②説得型
    ③リマインダー型
    ※知覚マップの作り方がわからん
    GrossRatingPoint
    コンバージョン率の関連性の決定:カイ二乗検定

    多変量テスト(実験計画法/コンジョイント分析)???
    アパッチmahoutは機械学集のオープン。
    ーーー
    有向ネットワークと無向ネットワーク
    エッジリストと隣接表列からネットワーク解析が始まる。
    行列の知識が必要。
    人間関係には密度がある。それをクラスター係数で表現する。
    ホモフィリー:類は友を呼ぶの意味。
    AUC(ROC曲線下面積):分析結果の当てはまりの分析。
    Fluentdはログ解析の基。Runyで実装。グラフを実装している。(watcherで再構成可能)
    ーーーーーーーーーーーーー
    WEBスクレイピング
    robots.txt:クローラに対する負荷の宣言ファイル
    Python、Perl、Ruby等のを使う。

  • 和図書 675/D65
    資料ID 2013104179

  • データサイエンティストに必要なキーワードや概念を
    1冊に凝縮したような本になっている。
    まずは、データサイエンスに必要なスキルが書かれており、
    そのあとで R や Python を使ったりしての
    データ処理方法などが示されている。
    (このあたりは、R の文法を知っていると理解が
    深まると思う。)
    さらに、 mixi などでどのように大量のデータから
    有益な情報を抽出しているか、なども記されている。
    それぞれの内容がトピック的になっているので、
    きちんと理解するにはそれぞれの内容について
    調べなおす必要があるが、キーワードなどを
    ざっと知っておく、という点ではとても有益だと思う。

  • うーん、こういうのは読者のレベル感がバラバラだから難しいなーとりあえずのってるRのコードをうっても動かなかった。。
    あと物理的に本のページが開きにくいので、見ながらタイピングしにくい

  • ずっとamazonですすめられてたので気になってはいたのだけれども、会社で統計に関する仕事をすることになったのをきっかけに購入。
    特集1の第1章はデータのサンプルがどこかにないのだろうか。ソースコードは書いてあるけど、データやデータの置き場所が書いてないから、実行結果みてもいまいちよく分からない(read.table("body_sample.csv")みたいな記述があるのだけれども、サイトにそのサンプルファイルをおいているという記述はなし)。

    先日、『データ・サイエンスのプログラミング言語はRからPythonに置き換わる』(http://readwrite.jp/archives/2534)という記事を見つけたけど、この本にもRだけではなく、Pythonについての記事もいくつかあった。
    最近はRの勉強ばかりだけど、Pythonの勉強もしたほうがいいのかなぁ。
    Rでウェブスクレイピングしたいのだけど、この本にはPythonでのウェブスクレイピングの方法しか書かれてなかったし。

  • 本全体はデータ分析の入り口に立つには
    先の広さを眺める調度良い本だと思う。
    全くの素人では用語で躓きそうだけど、
    サンプルをなぞって雰囲気を知るには手頃な構成。
    (複数著者のため内容に重複があるのはしょうがないとして)

    ただ、ある記事に
    「統計的仮説検定は正規分布を仮定したものであり、
    機械学習などの正規分布を仮定しない統計をノンパラメトリックという」
    といった事が書いてあり、
    そりゃ大間違いだろ?と大きな疑問符が浮かんだ。
    ノンパラメトリック手法にだって「検定」はあるし、
    機械学習だって確率分布を使う。
    ただし、正規分布に限らず、
    モデルに見合った確率分布を使うだけではないか。
    「データマイニングには検定の概念がない」と
    言い切ってしまうのもどうだろう?
    決定木だけを見ても
    カイ二乗検定を判断材料にする方法があり、
    検定から全く無縁ではない。

    ビックデータの文脈で時折目にする
    「ビックデータでは関連性だけ見ればいい」
    という言葉は、
    実データの大部分に通用できる
    法則(モデル)が見つかれば、
    仮説検定に基づいた信頼性に囚われずとも
    ビジネス面で有効だと言っているに過ぎず、
    頑強性と信頼性のトレードオフを
    踏まえた話だと考えている。
    (ビジネスの道具となりえるか、
    科学的であるか?というバランス)

    背景を知っている上で端折るならよいけど、
    初学者向けの導入本で偏った先入観を与えかねないのでは?
    と疑問に残る記述が見られた。

  • 統計学のさわり、をかいつまんだ感じですかね。

  • 以下4章について印象に残った。
    概念
    ・Rで統計解析をはじめよう
    ・データマイニングに必要な10のアルゴリズム
    技術
    ・Fluentd入門
    戦略
    ・データサイエンティストリテラシー
    特にデータサイエンティストリテラシーのJリーグの選手の年俸から紐解くチーム力強化戦略が興味深かった。これまで分析手法を学ぶことはあったがその実践的な使い方を学ぶことはなかった。しかしながら本性においてはどのように分析して、その分析結果をどのように今後に活かすかが具体的に提示されていたので理解しやすかった。データサイエンスの入門書(教科書)的な存在だと思うので、必要に応じて繰り返し読みたい。

  • 読み終えた.
    読書感想文は,こちらのブログ

    http://isseium.hateblo.jp/entry/2013/08/18/232140

全25件中 1 - 25件を表示

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)を本棚に登録しているひと

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)を本棚に「読みたい」で登録しているひと

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)を本棚に「いま読んでる」で登録しているひと

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)を本棚に「読み終わった」で登録しているひと

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)を本棚に「積読」で登録しているひと

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)の作品紹介

データサイエンスの基本となる考え方から、R言語による統計解析の基礎、マーケティングに応用できるデータ分析など「データサイエンティスト」がおさえておきたい記事満載。

データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)はこんな本です

ツイートする