お客様の課題
- 既存監視製品から Datadog への移行を検討していたが、社内に十分な知見がなかった。
- 監視リソースの設定が煩雑になっており、現行の監視設計を見直す必要があった。
- インフラレイヤーだけでなく、アプリケーションレイヤーも含めたオブザーバビリティの強化が求められていた。
対応と結果
- 既存製品から Datadog へ全面移行し、AWS 環境に分散していた100台以上のシステムリソースを一元管理可能に。
- APM 導入と共に、可視化ダッシュボードの作成・整備を実施。
- ログ監視や Synthetics の導入検討・一部実装を通じて可視化レベルを段階的に向上。
- 監視モニターの構成を Terraform により IaC 化し、設定の標準化・再利用性向上・構成ミス防止を実現。新規環境への迅速な展開も可能に。
株式会社エナリス様は、AWS 環境で稼働する業務システムにおける既存監視ツールを Datadog へ全面的に移行しました。本プロジェクトにおいて、アイレットは内製化に向けて設計・導入・運用まで一貫して伴走支援し、100 台以上のシステムリソースを Datadog 上で一元的に可視化できる基盤を構築しました。
監視ツール移行とオブザーバビリティ強化が課題に。Datadog を活用した設計見直しと可視化の段階的拡張に取り組む
株式会社エナリス様(以下、エナリス様)は、電力事業者や自治体向けにエネルギー需給管理や電力取引支援などのサービスを提供するエネルギーエージェント企業。再生可能エネルギーの利活用推進や地域分散型エネルギー社会の実現に向けて、最先端の ICT とノウハウを融合させたサービス開発を行なっており、長期運用を見据えた堅牢なシステム構築にも注力しています。
同社では旧来の監視ツールを長年運用してきたものの、設定の肥大化や構成の複雑化により、システム状況を把握しづらい状態となっていました。これにより、以下の課題が表面化していました。
- 監視設定の複雑化 – 閾値や通知設定を含めたパラメーターが非構造的に増加し、整理が困難となっていた。
- 観測対象の分断 – インフラメトリクスは取得できていたが、アプリケーションの挙動やログとの相関が取りづらく、原因分析に時間がかかっていた。
また、既存の監視ツールから Datadog への移行を検討したものの、社内に十分な知見がなく構築・運用に懸念を抱えていました。
こうした背景を受けて、アイレットは Datadog の機能を段階的に移行するプロジェクトを立ち上げ、現行環境の棚卸しから監視設計の見直し、導入、運用支援までを一貫して実施しました。
Datadog の多機能モジュールを段階導入。メトリクスストリーム/API ポーリングの併用でコストとリアルタイム性を両立
まずは、メトリクス監視を目的に、Datadog の機能であるメトリクスストリームと API ポーリング の両方式を比較検証しながら、インフラメトリクスを Datadog に統合。監視対象に応じて方式を切り分け、コストとリアルタイム性のバランスを確保しました。
次に、APM(Application Performance Monitoring) を導入し、Java や .NET アプリケーションにおける処理時間・エラー・外部連携状況などのトレースデータを収集。APM のフレームグラフを活用することで、サービス間の依存関係やボトルネックの可視化が可能となり、障害原因の特定と対応スピードの向上に寄与しました。なお、環境ごとに起動方式や構成が異なるため、環境変数の設定やライブラリの適用方法を調整しながら導入を行ないました。
さらに一部のシステムでは、リソース監視に加えて Live Process 機能を段階的に導入。稼働中のプロセス情報(プロセス名、実行ユーザ、CPU/メモリ使用量など)をエージェント経由でリアルタイムに取得できる機能で、追加の保守不要でプロセスの死活監視を実現しています。
これにより、突発的なリソース逼迫の兆候を捉えやすくなった他、お客様固有のプロセス(シェルスクリプトによる実行プロセスなど)も可視化できるようになり、運用監視の精度が向上しました。
また、Terraform でモニターを IaC (Infrastructure as Code)化し、標準化と再利用性を向上。さらに、コード管理により設定ミスや人的エラーを防ぎ、モニターの一貫性と再現性を確保しています。
Datadog による監視基盤の高度化で、運用改善と対応速度を両立
今回の取り組みにより、インフラからアプリケーションレイヤーまでを横断した統合的な可視化が可能となりました。Datadog の特長であるメトリクス・ログ・トレースの相関分析機能を活用することで、従来は個別に追跡していた情報を1つの画面で俯瞰でき、障害につながり得るサインをプロアクティブに把握できる環境の構築支援を実施しました。
特に、APM(Application Performance Monitoring)機能のフレームグラフでは、各処理のレイテンシやエラー発生ポイントを可視化できるため、ボトルネックの特定や改善余地の洗い出しに大きく貢献しました。また、ログ監視や Live Process 機能と連携させることで、アプリケーション内部の動作だけでなく、システム全体の健全性もリアルタイムに把握できるようになっています。
アイレットは今後も、お客様が直面する監視運用の課題に対し、弊社が培ってきた豊富な知見を活かしながら内製化をご支援してまいります。さらに、単なるインフラ監視にとどまらず、継続的な改善を実現するオブザーバビリティ基盤の構築にも取り組んでまいります。
(使用プロダクト)
- ・Datadog
- メトリクス監視:メトリクスストリーム、API ポーリング
- プロセス監視:Live Process Monitoring
- アプリケーション監視:Application Performance Monitoring
- 可視化 / 通知:Monitor
- 相関分析:Host Maps、Dashboard List、Widgets
- 外形監視:Synthetics
- リソース管理:Infrastructure List、Resource Catalog
- ・Terraform
Credit
クライアント株式会社エナリス