お客様の課題
- 複数ある社内サービスの稼働状況の可視化を別々の方法で一部手動も交えて行なっているため、定量的な稼働状況や効果を即時把握できていなかった。
- 各サービスで運用ルールが統一化されておらず、共通の効果測定が難しかった。
対応と結果
- Amazon Managed Grafana を活用し、サービスの稼働状況や効果を一元的に管理・可視化。即座に各社内サービスの状況を把握し、SLO と効果測定の管理が容易に。
アイレット株式会社(以下、アイレット)は、社内サービスの稼働状況や効果を一元管理し可視化するダッシュボードを開発しました。本プロジェクトの背景にある課題や目的、具体的な開発内容をご紹介します。
サービスの稼働状況や効果を一元管理・可視化すべく、複数の BI ツールを検討した上で、Amazon Managed Grafana を採用
アイレットの MSP(マネージドサービスプロバイダ)チームでは、業務の自動化・効率化を実現する社内サービスを開発・運用し、その数は20以上に及びます。
従来、これらの社内サービスの稼働状況や効果を定量的に確認する場合は、サービスごとにスクリプトを用いたり、メトリクスやログを参照したりと都度、手動で集計していました。そのため、定量的な数値をすぐに把握することが難しい、ルールが統一されておらず運用コストがかかるという課題がありました。
そこで MSP 開発チームでは、各サービスの稼働状況や効果を一元的に管理・可視化する手段として、Amazon Managed Grafana を活用したダッシュボードの開発に着手しました。
Amazon Managed Grafana とは、Grafana Labs が開発したオープンソース分析プラットフォームをベースにしたフルマネージドサービスです。豊富なデータソースからの可視化に対応し、ダッシュボードの共有やアラート送信機能など、システム運用に必要な機能を多く備えています。パネルを用いた視認性の高いデータ分析・可視化が可能で、パネルの配置を自由に変更できるなど、カスタマイズ性の高さも備えています。MSP 開発 チームでは複数の BI ツールを比較検討した上で、これらの理由から Amazon Managed Grafana を採用しました。
ダッシュボードをカスタマイズし、各サービスの「SLO」「効果」「導入率」を一覧表示。インシデント発生時の原因特定や各サービスの効果測定を効率化
今回はマルチアカウント構成を採用しました。ダッシュボード用に AWS アカウントを新たに用意し Amazon Managed Grafana 環境を構築。そこから社内サービスをホストしている各 AWS アカウントに接続し、分析用の Athena や CloudWatch に対してダッシュボードからクエリを投げています。
社内サービスの多くは業務を自動化する役割を担っており、期待通りのサービス提供ができているかを表す SLO(%)のほか、工数削減の程度や各サービスの導入率・利用率など、知りたい情報が多くありました。Amazon Managed Grafana はダッシュボードにパネルを自由に追加・配置することができるため、1枚のダッシュボードに各サービスの「SLO」「効果」「導入率」を並べ、確認できるようにしました。また、サービスごとの詳細情報については個別のダッシュボードを作成し管理・可視化することで、ユースケースに沿って知りたい情報をサービス提供者・利用者が把握できるようにしています。
サービス利用者は、自分が利用しているサービスの稼働状況やパフォーマンス指標をリアルタイムで確認できるため、業務計画やサービス利用の効率化を図ることが可能となります。また、サービスごとに不規則だった確認方法や基準などの運用ルールも統一できました。
これらの対応の結果、各サービスの状況把握や効果測定が容易に可能となり、サービス提供目線でのオブサーバビリティ向上を実現しています。
今後もアイレットはデータとテクノロジー、技術力を掛け合わせた業務改善を推進し、お客様のビジネス成長や価値創出に貢献してまいります。
(使用プロダクト)
- AWS IAM Identity Center
- Amazon Managed Grafana
- Amazon Athena
- Amazon S3
- Amazon CloudWatch
- Amazon CloudWatch Metrics
- Amazon CloudWatch Logs
- Amazon CloudWatch Synthetics
Credit
クライアントアイレット株式会社