10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く (Informatics &IDEA)
- SBクリエイティブ (2015年6月30日発売)
- Amazon.co.jp ・本 (360ページ)
- / ISBN・EAN: 9784797376272
作品紹介・あらすじ
本書ではSQLを使った分析の手法、そしてそのためのシステムの構築についてお話しします。なぜならば、SQLは企業において現実的に実現可能な中で最も制約の少ない分析手法だからです。 現実的にギリギリ可能な範囲で、でもできるだけ楽をしたい。本書はそんな現実的で、しかしよくばりな要望に対して、SQLという解で答えます。
ビジネスに役立つ分析を行いたいマーケターも、ビッグデータをどうにかしたいエンジニアも、みんなまとめて面倒みましょう。
感想・レビュー・書評
-
基本的な内容を期待して読んだが、SQLの書き方の話が多く、素人の私には少し辛かった。この内容が理解できるようになるための本があるといいなと思った。
詳細をみるコメント0件をすべて表示 -
SQLについて利用頻度高い文法も説明されている。購入したい。
[more]
# 読書記録 10年戦えるデータ分析入門
[2017-03-12 09:25]
- SQLを勧める理由
1. 企業のデータは RDBMSかHadoopにある
2. サイズの制約がない
3. エンジニア・プランナーの共通言語として優れている
- Web界隈エンジニアはRDBMSをただのストレージと考える傾向が強い
- スキーマとはテーブルを分類してまとめるための箱。
- データベース・スキーマ・テーブル の階層
- 分析SQLでは原則として縦持ちにすべき
- 値を行に並べる 例:1回の注文で4商品->4行にする
- 一方Excelは横持ち
- セッション:ユーザがウェブサイトを利用しているひとまとまりの時間
- 分析システムのアーキテクチャ
1. ソースデータ層:元データをそのまま格納した層
2. DWH層: Data Ware House 整理・統合された汎用データモデル層
3. アプリケーション層: 特定の用途に応じたデータ格納。データマート層
- DWHの4つの要件
1. subject oriented
2. integrated
3. time variant 時系列データを持つこと
4. non-volatile データが永続化する
- 大規模分析とリアルタイム処理の両立は出来ていない
- 過去様々な取り組みあるが、結果は死屍累々
- どこからビックデータか?
- 現在なら1テーブル 100GB がしきい値
- 100GB-1TB もしくは 10TB-100TB がビックデータ
eof -
3年ほど前のプロジェクトが終わったあとに、読んでみようと買った本。
半分くらい読み進めて、そのままになってました(使う機会がない。。。)が、ちょうどまたちょこっと基本的なデータ抽出と計算で使う機会ができたので、また読み返そうと思います。といっても、本格的にはできないんだけど、何ができそうで、どれくらい大変かくらいは理解しておきたいので。
でもまあ、いまはPythonなのかな。もっと複雑なことできそうだし。
※18年8月追記 -
全体的に知っている内容だった。
ただ一部のウィンドウ関数の機能などは知らない部分あり多少は役に立った。 -
たしかにこれまで認識していたsqlの活用範囲を超える面白い内容だった。が、タブローみたいな手頃なbiツールを使ってるならそっちの方が楽だし早いとは思う
-
羽生章洋『楽々ERDレッスン』で、RDBMSは情報部門のデータ貴族主義を廃し、ユーザーの手にデータを取り戻し、効果的な(効率的な、ではない)開発を実現するために生まれたとある。
この書籍はそれを実感させる。 -
この本を読むと、SQLを本当に使いこなせれば、確かにあと10年は戦える感じがします。
postgreSQLは10年前からありましたし、そういう意味では、10年前にSQLをモノにできた人は、20年戦えた、ということなのかもしれません。
SQLの話しだけでなく、データベースの話し、データ分析全般の話し、最新キーワードの説明、1冊でかなり広い範囲について基本的な理解をすることができました。
遅ればせながら、やっとSQLの基本的な処理についてかかれた本を読んで、言っていることがわかりかけてきたので、ここから実地練習する動機付けになりました。 -
DWH構築の実践的な本。
-
SQLを使ってデータ分析を行ってみる、という取っ掛かりになる内容の本で、こういった分野に疎い自分にとってはとても勉強になる本だった。
後半のデータ分析基盤をどうやって構築していくか、という本も参考になった。