みんなのレビューページ
みんなの感想・レビュー・書評
(34レビュー)
私は社内SEを初めて1年ちょっとの新米SEですが、社内で使うシステムやプログラムを作るようになり、システムを作る際にダウンのことまで考える必要性を感じて読んでみました。
まだシステムのことやプログラミングの知識は少ない私ですが、非常に分かりやすく、楽しく最後まで読めました。
一口にダウンと言っても色々な原因があることが分かりました。
時々再度して、自分のシステムがダウンを起こさないようにしたいと思います。
実際に現場で起こった障害を元に、原因や対応等について解説。
システムに詳しくない人でも分かるように平易な表現をしている。
主に銀行ATMなどの大規模な仕組み、メインフレームを取り上げている。
実際の業務に携わる上では「役には立たない」。
システムを開発・運用・保守していく上での基本はわかる。
システムダウンの原因が、実際に起きた障害に例をあげながら紹介されている。わかりやすくまとまっているので、システムダウンまでの一連の流れをテンポよく読み進められた。
頭の片隅において、いざという時の引き出しにしたい。
システムがダウンする理由: ソフトウェアバグ、データベースデッドロック、OS・ミドルウェアの不具合、ハードウェアの故障、パラメータ設定ミス、人的な操作ミス、などなど。
システム基盤の構築や運用に携わって、(今現在)8年になります。後輩や協力会社の育成が課題です。自分自身が作業自体になかなか関われないため、ほぼ未経験の担当者に手取り足取り指導できない状況にあります。そんな中、経験なり知識を少しでも身につけさせるための副読本を探しており、この本を見つけました。 内容は主に、システムダウンの原因を4つのジャンルに分け、その原因ごとの事例を元にしたケーススタディが... 続きを読む »
私も一応管理者みたいなことをやってるので、「システムダウン」なんてあまり嬉しくない事態だが、それでも起こる、そして起きてほしくない時に限って起こる。 この本では、ダウンの原因を、ソフトウェアの不具合、性能・容量不足、設定操作ミス、不慮の事故、の4つに切り分けて、それぞれの事例を分析している。 もちろんこれらが複合して起こるケースもあり、対応を難しくしている。 基本的な姿勢としては、ダウンを100%防ぐのは不可能、ということを前提に、どうすればダウンをできるだけ減らせるか、起こってしまったときの被害をできるだけ減らせるか、ということを考察する。 解説もわかりやすく、得るところの多い内容だった。
過去のシステム障害の事例を元に、
技術的なミス、人為的ミス等、
色々なパターンで障害が発生することを教えてくれます。
この本を読めば、
高度なシステムでも絶対と言う言葉は無く、
システム障害は、起こるべくして起こっていると言うことがわかると思います。
システムエンジニアを目指す人は、
これからどんな仕事をするかの一面を垣間見ることが出来るので、
一度読んでおくべきだと思います。
ダウンしない完全なシステムはない、と繰り返し訴えつつ、様々な障害事例が紹介されています。保守エンジニアは共感できる部分が沢山ありそうですよ。
しかし、よくもまあここまで障害事例を集めたなあ、と関心します。素晴らしい。これまで自分が味わった障害はほとんど網羅されてるんじゃないかな、とさえ思う。
20分くらいで流し読みしましたが、予想外に楽しめ?ました。
1つ気になって、強く実感したこと。
『ソフトウェア障害に2重化は通用せず。』
2重化にも何通りかあるとはいえ、バージョンなど一緒にしていたら、同じ問題が起きるので確かにソフトウェアの2重化にはならないですね。
同一バージョンでのHA構成、ちょっと考え直したほうがよくない?メリデメリは色々あれど、検討と改善要望の余地はあるはず。
【読者】 主に若手~中堅のITシステムの運用担当者および開発担当者だが、利用者にとっても有益 【目的】 ダウンの要因やメカニズムを理解し、ダウンの削減と迅速な復旧に資する 【一押】 システム設計から運用までをシステムダウンの観点から事例や図を使いわかりやすく解説している 【概要】 ダウンの原因は大きく分けて4つある。①ソフトウェア、OS、ミドルウェアの不具合、②ハード、ネットワー... 続きを読む »
基本的な内容だけど、様々なシステムトラブル事例・パターンが書かれているので、再確認できる。また、自分の知らないパターンにも気づかされる。たしかに、結果論では「なんで、そんな単純なミスをするんだ」とか「基本中の基本で、あり得ない」等と言えるけど、実際には様々な要因が重なってトラブルが発生するよね…。
記述は基本レベルが丁寧に書かれている。これをベースにアンチパターンとか実装例とかで勉強会やったら新人教育に(自分にも)よい感じ。情報システムの品質保証とかテストをやっている人も読んでおいてほしいな
システム運用って何?ダウンって何で起こるの?
そんな疑問に答えてくれる本です。
この本はシステムダウン事例を、原因別(アプリ、OS・ミドルウェア、キャパシティ、環境設定、作業ミス、ハード故障、災害等)に分類して解説しています。
実際にあった事例を解説しているので、身近に感じられるし内容がわかりやすいです。
私みたいな素人でも読みやすいと感じたのは、 専門用語を簡単に説明してとっかかりやすくしてくれているから。 このシリーズ、他にも基礎的なものを説明してくれているものがあるようなので、 次はそっちを読んでみたいと思う! 「ダウン」の発生原因 ・ダウンを防ぐための例外処理にバグがあった ・信頼性を高めるためにシステム構成を複雑にしたことが被害の拡大につながった システムの「ダ... 続きを読む »
システムがダウンしたとき、早急に原因を突き止め、再発防止の手を打つためにはどうしたらいいのでしょうか? 『日経コンピュータ』の記者が、過去数年間にわたって実際に起きたダウンの事例を取り上げ、その原因と実態について体系的にまとめました。アプリケーションやソフトの不具合、OS、ミドルウェアの不具合、性能・容量不足、環境設定や変更のミスなど、さまざまな原因でダウンした事例が紹介されています。
(開架和書架 007.61/O)
全体を通して読みやすく図解が多いので、技術職以外でも読みやすい。
某大手銀行の統合時のシステムダウンなど、内部の人間しか知らない様な内容を、システム概要からしっかり解説しているので、システム事故撲滅のための失敗事例共有としては非常にためになった。
銀行系システムばかりなので、汎用機での事例がほとんどだが、
DBのデッドロックの解説は、とても分かり易くどんなシステムでも十分役に立つ。
またシステムダウンの意味を定義して分類しているのは、
本書ならではの解説で、現場で使える。
システム管理者なら必ず一度呼んだ方が良い。
失敗事例の共有は下記の様なサイトもある。
http://shippai.jst.go.jp/fkd/Search
感想は以下。
![第3回 ブクログ大賞[2012]](/ad/1201/award_booklog200_65.gif)

