SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

制作 : 澤田 武男  関根 達夫  細川 一茂  矢吹 大輔  Betsy Beyer  Chris Jones  Jennifer Petoff  Niall Richard Murphy  Sky株式会社 玉川 竜司 
  • オライリージャパン
4.33
  • (6)
  • (4)
  • (2)
  • (0)
  • (0)
本棚登録 : 108
レビュー : 4
  • Amazon.co.jp ・本 (590ページ)
  • / ISBN・EAN: 9784873117911

作品紹介・あらすじ

大規模なサイトを運用・構築していくための手法「SRE」について詳述!
Google社内で発展した、大規模なサイトを運用・構築していくための手法「サイト リライアビリティ エンジニアリング」について、様々な場面での実践的なストーリーを紹介します。

感想・レビュー・書評

並び替え
表示形式
表示件数
  • 濃い。分厚い。サービス運用という側面でここまで網羅的にまとめた本ってこれまでなかったんではなかろうか。内容的には、従来のいわゆる「運用」とも異なるわけではあるが。全部が全部でなくていいので、取り入れられるところから実践してみたい。

  • かなりのページ数で内容的にも重厚、
    だが開発者、運用者、企画者問わずITに関わる人間にはぜひ通読することを薦める。

    ものすごくかいつまんでいうと、エンジニアリングによって可用性を高めようという話だが
    それを実現するためにはエンジニアリング以外の側面、すなわち文化の醸成などが必要になる。また、エンジニア自身が発生したオンコールさえも明日への資産と考えるマインドチェンジも必須。
    そういったことを伝えるためにはこの分厚さが必要だったんだろう。

  • 勤務先で(ほぼ)毎週読書会を開き、半年ほどかけて読了。複数人集まってワイワイ議論していたので、1人でもくもくと読む以上に内容への理解が深まったと思う。

    全部をエイヤッと始めることはムリだけど、メトリクスの収集・可視化やSLO, SLI, SLA の設定、ポストモーテムなど真似できるところから真似していこう。

  • すさまじくカバー範囲が広い

    ・クラスタ管理システム (Borg)
    ・サービスレベル策定
    ・モニタリング
    ・時系列データベース
    ・ビルド/デプロイ/リリース
    ・テスト
    ・リファクタリング
    ・ディサスタリカバリ
    ・ジョブのスケジュール (cron)
    etc.

    以前Kubernetesを触ってみて、あまりに複雑で、一体どんなシステムの運用に使うんだと思っていた。
    この本の内容を読んで、Kubernetes(Borg)が必要とされるシナリオが少し理解できた。

    それでもまだ一般エンジニアには早すぎる。

全4件中 1 - 4件を表示

この本を読んでいる人は、こんな本も本棚に登録しています。

有効な左矢印 無効な左矢印
エリック・リース
宮下 剛輔
Kelsey H...
有効な右矢印 無効な右矢印

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチームを本棚に登録しているひと

ツイートする