
awsの運用をしていくときには保守が必要ということがよく言われています。サーバーを利用するときには多岐にわたる業務があって分類が行われていますが、完全な統一的見解がないのも確かです。ここではawsの運用やサーバーの管理において必要な保守の意味を説明し、そのために必要な基本業務について代表的な三つを紹介します。
awsの運用における保守とは
awsはアマゾンウェブサービスのことで基本的にはクラウドサーバーと、そのサーバー上で利用できるサービスやアプリの統合的なサービスです。ユーザーは利用を申し込むとawsが管理しているクラウドサーバーの一部の領域を使えるようになり、その領域にインスタンスなどを作成して運用していくことになります。
利用を始める段階ではインスタンスを作ってOSを用意してアプリを実装する、ユーザーアカウントを作成して従業員が簡単に利用できるようにする、セキュリティーを整えて情報漏洩やサイバー攻撃に備えるなどといった対応が必要です。
それを終えてからは運用をしていくのが基本になり、常に快適に使えるようにすることを目指していくことになります。awsの運用段階に入ったときには保守が必要になります。保守とはawsに割り当てられている領域や作成したインスタンス、その中に用意したアプリなどにおいて障害が発生したときに対応するのが主な業務です。
サーバーやシステムに問題があったときに元の状態に戻すことを指します。また、広い意味では障害が発生した後、原因を究明して再発を防ぐことも含みます。突然業務システムが動かなくなってしまうと仕事ができなくなってしまい、業務に支障が生じるのは明らかでしょう。
それを速やかに回復に導くのが保守の主な役割で、業務を継続できるようにするための要となっています。
保守の基本になる監視業務
保守の基本業務として一つ目に挙げられるのが監視です。サーバー監視は保守の中でも最も重要とされている部分で業務量もかなり多くなっています。awsのサーバーやインスタンス、アプリなどの稼働状況を常に確認して情報を集約し、管理していくのが基本的な作業内容です。
そして、その情報に基づいて障害が発生している場合や、発生が懸念される場合には改善を行います。現場からのクレームによって障害が発生していることが発覚し、その原因を特定するために集約管理している情報を参照するということも少なくありません。
基本的には障害発生を未然に防ぐことが求められる業務で、常に状況を監視してサーバーを調整したり、リソースの配分を変更したりすることが必要です。監視業務の半分以上は自動化が可能なもので、大半の職場では自動監視が取り入れられています。
稼働状況に関するメトリクスを確認して情報を集めていく作業やリソース配分の変更に関する対応については、条件さえきちんと決めてしまえば自動処理ができます。そのため、自動処理をするための方法を策定したり、自動対応ではカバーしきれなかった障害に適宜対応するのが監視の主要業務となっている場合がほとんどです。
awsではサーバー監視ツールなどを提供しているので自動化を進めやすいことから、今までは24時間有人監視をしていた現場でもawsに切り替えた時点で無人でも対応できるようにしている傾向があります。
保守に欠かせないバックアップとリストア
保守の基本業務の二つ目はバックアップとリストアです。大きな障害が発生してしまうといかにして平常通りに利用できるサーバーを復旧するかが大きな課題になります。その際の基本的なアプローチとしてリストアがあり、直近の安定して利用することができていた状況のバックアップをそのままサーバーに適用することで支障なく運用できる状態に戻すことを指します。
リストアをすると最近の更新内容については全て失われてしまうことになりますが、頻繁にバックアップを取っていれば被害は最小限に留めることが可能です。バックアップは監視と同様に自動化が進められているので、スケジュールを組んで実施することもできます。
ただ、バックアップもサーバー負荷になることに加え、データの通信によって費用も発生するのでサーバーの利用状況を見ながら無駄をゼロに近づけてバックアップを取ることが求められます。また、バックアップするデータ量が多いとそれだけたくさんのストレージが必要になることは否めません。
それがコストの増加にもつながるため、取捨選択をすることも保守において欠かせない点になってきているのが現状です。
awsの保守ではawsの状況確認も必要
サーバーの保守では監視、バックアップとリストアができていれば問題ない場合もありますが、awsのようなクラウドサーバーの場合にはawsの状況確認も基本業務です。運用していると動作が思わしくないのに、いくら監視によって集めてきたデータを見ても悪いところが何もないということもあります。
このようなときにaws側でサーバーメンテナンスをしていてパフォーマンスが低下していることもないわけではありません。awsの状況確認をすることで、いつからいつまではパフォーマンスが低下するので大きなデータ通信などは避けるようにというアナウンスをすることができます。
このような対応をすることで障害発生のリスクも低減されるでしょう。
実際の運用は保守が大半を占める
awsのサーバーの運用を実際に行うときの業務割合は大半が保守になるのが一般的です。awsでは可変性のあるサーバーを提供しているのが特徴で、容量超過によるサーバー停止などのトラブルは起こりにくいのは確かです。
しかし、容量を超過してしまうとコストもかさんでしまうため、実際には運用または保守の業務の中にリソースの適正配分、適正使用が含まれることになります。保守における監視では常にこの状況を確認していることから、現場では監視業務の一環として盛り込まれるのが通例です。
awsの運用の中で業務負担が大きいのは保守の中の監視なので、基本的には監視を重視することが必要です。
監視に注力する運用をしていこう

awsの運用ではサーバーやアプリなどの障害発生に対応して元通りに使える状態にする保守の業務が大きな役割を果たします。保守の中でも監視が最も大きな比重を持っていて、適切な監視ができるかどうかが運用効率にもコストにも大きな影響があるのが一般的です。
awsを利用する際には運用の中でも保守、特に監視に重点を置くようにしましょう。
関連リンク「AWS監視・運用 マネージドクラウド | CloudCREW | GMOクラウド株式会社」https://managed.gmocloud.com/managed