ビッグデータ分析・活用のためのSQLレシピ データ加工から売上・ユーザー把握、レポーティング等々の各種データ分析まで
- マイナビ出版 (2017年3月27日発売)


- 本 ・本
- / ISBN・EAN: 9784839961268
作品紹介・あらすじ
本書は、著者が普段の業務で実際に作成しているレポートやSQLのコードをより汎用化し、レシピ集としてまとめたものです。「データの加工」「売上の把握」「ユーザーの把握」「Webサイト内のユーザー行動の把握」「異常値の検出」「検索機能の評価」「レコメンド」など、具体的なシーン別に、実践的な手法とノウハウを解説しています。
●読者対象
本書では、アクセス解析等を担当する社内の分析担当者と、実装を行うエンジニアの双方を対象として、下記の情報を提示します。
・データ加工の手法
・分析に使用するSQL
・レポーティング・分析の手法
分析担当者であれば、アクセス解析ツールが提供する指標やフィルタがなくても、それ以上のことを自らで実践できるようになること、エンジニアであれば、分析業務を十分に理解して、分析担当者や経営層に対して、適切な情報提供やレポート提出、そして助言できるようになることを、目指しています。
●構成
1 ビッグデータ時代に求められる分析力とは
2 本書で扱うツールとデータ群
3 データ加工のためのSQL
4 売上を把握するためのデータ抽出
5 ユーザーを把握するためのデータ抽出
6 Webサイトでの行動を把握するためのデータ抽出
7 データ活用の精度を高めるための分析術
8 データを武器にするための分析術
9 知識に留めず行動を起こす
Chapter1~2は導入部で、Chapter1は基本を解説し、Chapter2で本書で扱うデータやミドルウェアについて説明しています。
Chapter3~8では、具体的なSQLを用いたコード例とともに、ビッグデータ活用の手法について紹介します。
Chapter3では基礎的なSQLの記述やデータ加工の手法について解説し、続くChapter4~8でデータ活用における具体的なシーン別に実践的な「分析手法」と「SQL」を解説しています。
Chapter9ではまとめとして、本書の提供する内容が知識で留まらないよう、データの活用の事例やヒントを紹介します。
●本書で扱うミドルウェア
PostgreSQL、Apache Hive、Amazon Redshift、Google BigQuery、SparkSQLで動作確認を行っています。
感想・レビュー・書評
-
独学マンだったので多少勉強になった。GPTに聞くにも検索するにも、まずは何ができるか知らないといけないので大事。とはいえ大体は使ったことある内容だったので新知識は少なめ。SQL自体がシンプルなのでそんなもんかもしれない。。
詳細をみるコメント0件をすべて表示 -
webサイトのアクセスログ解析やマーケティングの分析手法を取り上げてながら実際のSQLまで落とし込む方法が書かれていたり、レコメンドなどのプロダクト開発に関連するSQLもあり幅広い事例とセットでSQLが書かれているのが良かった。
一方でSQLは自分で考えて自分で書かないと本当の意味で理解できないと思うので、この本を読んだだけで実践で使えるスキルが身につくというよりはこの本で知識をインプットして、実際に自分でSQLを書いて手を動かしなが学んでいくのが理想的かなと感じた。 -
ある(2018/09/26)
-
Chap1 ビックデータ時代に求められる分析力とは
Chap2 本書で扱うツールとデータ群
ほぼ有名どころのDBはすべて押さえてある。
PostgreSQLとSparkSQLがあるのがありがたい。
Chap3 データ加工のためのSQL
この辺は基本的なデータ処理でよくまとまっていて業務に生かせそうな感じでした。3-2-6 IPアドレスを扱うでPostgreSQLにはこんな機能まであるのは驚きでした。
Chap4 売上を把握するためのデータ抽出
時系列データの扱いは頻発するので助かる。
Chap5 ユーザーを把握するためのデータ抽出
Chap6 Webサイトでの行動を把握するためのデータ抽出
Chap7 データ活用の精度を高めるための分析術
コードの長さが大変であるがDBでここまでできるとは思わなかった。処理するデータ量が多すぎて他のストレージに移動させることも1時間以上かかることもあるのでDB内で全てできるのは非常にありがたい。 -
SQLでここまでできるんだなという感想。
普段ほとんどMySQLを使っているので、ウィンドウ関数には縁がなかった。
集計はSQLの結果を何らかのプログラム言語で処理するものだと考えていたけど、SQLをもっと活用するのも面白いかもしれない。
著者プロフィール
加嵜長門の作品





