高度な監視システムによるダウンタイム90%削減への実践

FinTech企業において、インシデントを70%、システムダウン時間を90%削減し、復旧時間を改善することに貢献しました

SUMMARY

お客様紹介

シドニーに拠点を置く大手Fintech企業で、長期金融市場におけるサービスを提供し、基幹取引を円滑に進めています。

課題

お客様の監視・記録システムでは、巨大なITインフラを全体的に把握することができず、頻繁なダウンタイム、メンテナンスの遅れ、SLAへの影響を引き起こしていました。

効果

Aokumoは、クラウドネイティブの監視・ログ・アラートシステムを導入し、お客様の問題解決の迅速化とデジタル運用の改善を支援しました。

企業名

業界

金融サービス

企業Webリンク

導入サービス

高度な監視システムによるダウンタイム90%削減への実践

FinTech企業において、インシデントを70%、システムダウン時間を90%削減し、復旧時間を改善することに貢献しました

企業名

Industry

金融サービス

企業Webリンク

Featured Services

SUMMARY

お客様紹介

シドニーに拠点を置く大手Fintech企業で、長期金融市場におけるサービスを提供し、基幹取引を円滑に進めています。

課題

お客様の監視・記録システムでは、巨大なITインフラを全体的に把握することができず、頻繁なダウンタイム、メンテナンスの遅れ、SLAへの影響を引き起こしていました。

効果

Aokumoは、クラウドネイティブの監視・ログ・アラートシステムを導入し、お客様の問題解決の迅速化とデジタル運用の改善を支援しました。

8

X

インシデントレスポンスの迅速化

70

%

インシデントの削減

90

%

システムダウン時間の短縮

70

%

回復力の強化

Use case

事例詳細

お客様は、毎日何千もの金融取引を処理しており、これらのトランザクションを遅延なく、SLAに従って完了する必要がありました。しかし、従来の監視、ロギング、アラートシステムが原因で、頻繁に発生するインシデント、ダウンタイム、ビジネス損失に直面していました。

システムの可用性と事業継続性を確保するために、レガシーな監視・ログシステムをクラウド・ネイティブな技術での変革を希望しており、また、インシデント発生時に先手を打って迅速に復旧するために、リアルタイムのアラートシステムを必要としていました。

Aokumoは最新の監視・ログ技術を導入し、お客様のSLA、システムの安定性、耐障害性の向上を支援しました。

Before

既存の監視・記録ツールでは、関連するデータポイントをすべて取得することができず、問題の特定やシステムの現状を確立することが困難であった。

監視は第三者機関に委託しており、コストがかかっていた。

レガシーツールが完全な可視性を提供する上で非効率であるため、復旧に時間がかかっていた。

システムおよびインフラに関する全体像の欠如と、信頼性の低いアラート通知の遅延が、ビジネスSLAに影響を与えていた。

After

多次元データを取得し、リアルタイムに可視化するPrometheusを導入することで、効果的なモニタリングが可能となった。

AWSが管理するElasticsearchを使用してELKスタックを実装し、リアルタイムモニタリングによるインタラクティブなログ解析を実現した。

トランザクションのトレースと監視を行うJaegerとOpenSearchのデータを可視化するKibanaを統合した。

エラーや例外が発生した場合、システム全体で設定可能なエスカレーションフローにより、リアルタイムにアラートが発出可能となった。

サービス導入後の効果

8

X

インシデントレスポンスの迅速化

ログ分析、最大限のカバレッジ、リアルタイムアラートにより、インシデントレスポンス時間を大幅に短縮。

70

%

インシデントの削減

プロアクティブな監視と改善により、予期しないイベントやインシデントを70%以上削減。

90

%

システムダウン時間の短縮

リアルタイムかつプロアクティブなアラートにより、ダウンタイムのリスクは大幅に軽減。

70

%

回復力の強化

自動化と包括的なインシデントレポートの活用により、デバッグとバグフィックスにかかる時間を短縮。

Tools & Technologies

Aokumo leverages several Amazon services

Amazon Elasticsearch Service

- A fully managed service that makes it easy to deploy, operate, and scale Elasticsearch at scale with zero downtime.

Amazon CloudWatch

- An AWS service designed to help users monitor the performance and health of their AWS resources and applications.

Amazon S3

- A highly scalable, fast, and durable solution for any data type object-level storage accessed anywhere via the Internet through the Amazon Console and S3 API.

ELK Stack

- A package of open source technologies for collecting, searching, analyzing, and visualizing large data volumes generated by diverse data sources.

Prometheus

- An open-source monitoring and alerting solution for microservices and containers that provides flexible queries and real-time notifications.

Grafana

- An open-source dashboard visualization tool that allows users to ingest data from many data sources, query this data and display it on beautiful, customizable charts for easy analysis.

Jaeger

- An open-source software for tracing transactions between distributed services used to monitor and troubleshoot complex microservices environments.