1
/
5

【TechBlog】AWS障害をより広い範囲で把握するために

はじめに

こんにちは、SREチームの金澤です。

です。弊社はintdashというIoTプラットフォームを展開しています。そのサーバサイドであるintdash Serverはクラウドインフラを用いた構築が多く、その一つがAmazon Web Service(AWS)です。

パブリッククラウドを使用する上で気をつけたい点の一つとして障害の把握が挙げられます。サービス障害の要因確認として役立ち、その内容をもとに今後のプロアクティブな対策を検討する助けにもなります。また大規模の障害の場合はお客様が把握されている可能性も高く、いただいたご質問にスムーズな回答を差し上げる一助にもなります。素早く把握していることに越したことはありません。

そのような体制を目指すべくまずは、

  • 障害情報を一か所に集約する
  • 影響を受けない障害内容についても通知を受ける

上記が必要と定め検討を開始しました。この記事ではAWSサービスの障害通知方法の検討とツールを利用した通知システムの構築についてご紹介します。

目次

  1. はじめに
  2. 障害情報の把握
  3. PHD利用時の課題
  4. shd notifierの利用
  5. 結果
  6. まとめ

続きは、弊社のテックブログからご覧ください!


--

株式会社アプトポッド's job postings

AWS

Weekly ranking

Show other rankings