10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く (Informatics &IDEA)

著者 :
  • SBクリエイティブ
4.03
  • (12)
  • (15)
  • (11)
  • (0)
  • (0)
本棚登録 : 235
レビュー : 14
  • Amazon.co.jp ・本 (360ページ)
  • / ISBN・EAN: 9784797376272

作品紹介・あらすじ

本書ではSQLを使った分析の手法、そしてそのためのシステムの構築についてお話しします。なぜならば、SQLは企業において現実的に実現可能な中で最も制約の少ない分析手法だからです。 現実的にギリギリ可能な範囲で、でもできるだけ楽をしたい。本書はそんな現実的で、しかしよくばりな要望に対して、SQLという解で答えます。
ビジネスに役立つ分析を行いたいマーケターも、ビッグデータをどうにかしたいエンジニアも、みんなまとめて面倒みましょう。

感想・レビュー・書評

並び替え
表示形式
表示件数
  • SQLについて利用頻度高い文法も説明されている。購入したい。

    [more]

    # 読書記録 10年戦えるデータ分析入門
    [2017-03-12 09:25]

    - SQLを勧める理由
    1. 企業のデータは RDBMSかHadoopにある
    2. サイズの制約がない
    3. エンジニア・プランナーの共通言語として優れている
    - Web界隈エンジニアはRDBMSをただのストレージと考える傾向が強い
    - スキーマとはテーブルを分類してまとめるための箱。
    - データベース・スキーマ・テーブル の階層
    - 分析SQLでは原則として縦持ちにすべき
    - 値を行に並べる 例:1回の注文で4商品->4行にする
    - 一方Excelは横持ち
    - セッション:ユーザがウェブサイトを利用しているひとまとまりの時間
    - 分析システムのアーキテクチャ
    1. ソースデータ層:元データをそのまま格納した層
    2. DWH層: Data Ware House 整理・統合された汎用データモデル層
    3. アプリケーション層: 特定の用途に応じたデータ格納。データマート層
    - DWHの4つの要件
    1. subject oriented
    2. integrated
    3. time variant 時系列データを持つこと
    4. non-volatile データが永続化する
    - 大規模分析とリアルタイム処理の両立は出来ていない
    - 過去様々な取り組みあるが、結果は死屍累々
    - どこからビックデータか?
    - 現在なら1テーブル 100GB がしきい値
    - 100GB-1TB もしくは 10TB-100TB がビックデータ

    eof

  • 3年ほど前のプロジェクトが終わったあとに、読んでみようと買った本。
    半分くらい読み進めて、そのままになってました(使う機会がない。。。)が、ちょうどまたちょこっと基本的なデータ抽出と計算で使う機会ができたので、また読み返そうと思います。といっても、本格的にはできないんだけど、何ができそうで、どれくらい大変かくらいは理解しておきたいので。
    でもまあ、いまはPythonなのかな。もっと複雑なことできそうだし。
    ※18年8月追記

  • 全体的に知っている内容だった。

    ただ一部のウィンドウ関数の機能などは知らない部分あり多少は役に立った。

  • たしかにこれまで認識していたsqlの活用範囲を超える面白い内容だった。が、タブローみたいな手頃なbiツールを使ってるならそっちの方が楽だし早いとは思う

  • 羽生章洋『楽々ERDレッスン』で、RDBMSは情報部門のデータ貴族主義を廃し、ユーザーの手にデータを取り戻し、効果的な(効率的な、ではない)開発を実現するために生まれたとある。


    この書籍はそれを実感させる。

  • この本を読むと、SQLを本当に使いこなせれば、確かにあと10年は戦える感じがします。

    postgreSQLは10年前からありましたし、そういう意味では、10年前にSQLをモノにできた人は、20年戦えた、ということなのかもしれません。

    SQLの話しだけでなく、データベースの話し、データ分析全般の話し、最新キーワードの説明、1冊でかなり広い範囲について基本的な理解をすることができました。

    遅ればせながら、やっとSQLの基本的な処理についてかかれた本を読んで、言っていることがわかりかけてきたので、ここから実地練習する動機付けになりました。

  • DWH構築の実践的な本。

  • SQLを使ってデータ分析を行ってみる、という取っ掛かりになる内容の本で、こういった分野に疎い自分にとってはとても勉強になる本だった。
    後半のデータ分析基盤をどうやって構築していくか、という本も参考になった。

  • SQLを用いたデータ分析についての本。
    OLTP(業務システムやウェブアプリケーションで用いる処理)と分析処理は異なるらしい。例えば、MySQLはOLTP向けで、分析向けじゃないとか。それにしても、何でMySQLはウィンドウ関数を実装しないのだろう……。
    後、分析処理の場合は、インデックスはあまり効果がないらしい。大量のデータを使うからとのことだけど、そういうもんなのか。
    それと、サブクエリーを使うと遅いというイメージがあるけど、それはMySQLだけなんだとか。こうやって見てみると、MySQLの利点ってほとんどないような気がする。
    後、ウィンドウ関数のlagとleadという関数を初めて知った。これは確かに便利そう。覚えておきたい。
    ウィンドウフレームというという仕組みも初めて知った。グループ化する時にbetweenで範囲を指定できるんだとか。
    PostgreSQLだとこういった機能を使えるとのこと。PostgreSQLいいなぁ。使ってみたい。

  • 青木さんってこんなことやっていたんだ。普段SQLを書かないけど、こういう説明の順番もあるのかと勉強になった。2部も面白い箇所がいろいろあったけど、盛り込み過ぎな感もあり、1部をもう少し厚くした方がよかったのではという初見。

全14件中 1 - 10件を表示

著者プロフィール

青木峰郎(あおき みねろう)ふつうの体育会系プログラマー。現職のクックパッドでは全社のデータ分析基盤を担当。著書に『10年戦えるデータ分析入門』(SBクリエイティブ)『Rubyソースコード完全解説』(インプレス)などがある。

「2017年 『ふつうのLinuxプログラミング 第2版』 で使われていた紹介文から引用しています。」

10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く (Informatics &IDEA)のその他の作品

青木峰郎の作品

この本を読んでいる人は、こんな本も本棚に登録しています。

有効な左矢印 無効な左矢印
ベン・ホロウィッ...
エリック・リース
ジェームス W....
リンダ グラット...
有効な右矢印 無効な右矢印

10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く (Informatics &IDEA)を本棚に登録しているひと

ツイートする