AWSではじめるデータレイク: クラウドによる統合型データリポジトリ構築入門

  • テッキーメディア
3.90
  • (2)
  • (5)
  • (3)
  • (0)
  • (0)
本棚登録 : 66
感想 : 2
  • Amazon.co.jp ・本 (377ページ)
  • / ISBN・EAN: 9784910313016

作品紹介・あらすじ

「データレイク」は、大量データ分析/生成データの活用を視野に入れた新しいデータストアのかたちです。従来のデータベース/データウェアハウスの範囲に収まらない多様なデータを大量に保管し、高度な統計分析や機械学習に役立つ情報基盤を作ることが可能です。
本書ではデータレイクの概念や特徴、必要とされる機能などを基本から解説し、さらにAmazonが運営するパブリッククラウドサービスAWS(Amazon Web Services)で実現する方法を解説します。
従来では想定しえなかった大量のデータを確実に保管するため、データレイクの世界ではクラウドのようなサービス型インフラストラクチャの活用が注目されます。さらにAWSではオブジェクトストレージS3上のデータを直接分析するAmazon Athena、データウェアハウスのAmazon Redshift、機械学習を実現するAmazon SageMakerなど、データレイクを支えるさまざまな仕組みが存在します。
本書ではそれらの活用の指針を解説するとともに、後半ではシステムの構築例を具体的に解説していきます。ビジネスデータ分析とログなどの生成データ分析を例に、システム構築の流れを詳しく紹介し、機械学習や統計分析をビジネスの現場で活かせる仕組みの技術的なヒントを数多く提供します。

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • AWS DASの勉強の為に手に取った
    2章までしか読んでないが、ハンズオンがとても良くサービスの概要を学ぶのにとても役に立った

  • AWSを用いた分析環境作りを行う上での教科書
    考え方やベストプラクティスが参考になる

    ●基本的なデータの流れ
    ①各部署やツールに散在しているデータ
    ②データレイク(真のデータ・生データの保管)
    ③DWH(目的を満たす分析データの格納)
    ④データマート(BIに食わせる前のデータ)

    ・②→③が目的志向で加工した(でも最小粒度)のデータの格納がキモ。事業目的は変化するので難易度が高い。

全2件中 1 - 2件を表示

著者プロフィール

秋田県出身の宮城県在住。女性向け漫画から少年漫画まで幅広い絵柄で活躍中。代表作に「訳あり魔導士は静かに暮らしたい」(原作:榎木ユウ、アルファポリス、全2巻)「出雲のあやかしホテルに就職します」(原作:硝子町玻璃、双葉社/モンスターコミックスf、全2巻)などがある。

「2021年 『元獣医の令嬢は婚約破棄されましたが、もふもふたちに大人気です!』 で使われていた紹介文から引用しています。」

上原誠の作品

AWSではじめるデータレイク: クラウドによる統合型データリポジトリ構築入門を本棚に登録しているひと

ツイートする
×