Pocket

皆さんお久しぶりです!1ヶ月ぶりのブログとなってしまいましたが、本日はなかなか面白いモニタリングツールを発見しました。

きっかけはXでの呟きからなのですが、メタップスホールディングスさんがSaaS向けイベントログの一元監視サービス「srest(スレスト)」をリリースされました。非常に気になっていたので使ってみようかなと思っていたところ!開発メンバーが「お初ですが、飲みいきましょう!」と誘われたので、いざ新大久保へ!

メンバーはセールス担当@changgyo_soさん、新卒でマーケ担当 @iso_channel君、SREのマネージャー @sre_yamakitaさんと共に韓国料理を食べてきました。ポッサムが旨すぎる!そして皆さん超面白い方で盛り上がりが止まらない状態が続きました。韓国大好きマンな私にとって韓国の話をしたいところですが!

早速「srest」について概要や所感についてまとめていきたいと思います。


「srest」とは

https://srest.io/
https://meet.metaps.com/entry/2024/02/14/173113

  • インフラの健康状態をリアルタイムで可視化
    • SLOをダッシュボードで確認
    • インフラ全体を瞬時に把握し、オブザーバビリティの実現を補助
  • インフラ監視を担うエンジニアの日常業務を効率化
    • イベントログを収集し一覧で表示
    • まとめてプロジェクトを確認できるのと煩雑しにくくなる
  • イベントログの保存で情報共有が活発化
    • ダッシュボードで具体的なアラート条件を設定可能
    • Slackやメールで通知される

  • 料金
    • 7月まで無料で利用可能(それ以降の金額は調整中)
  • 連携できるサービス
    • Datadog
    • PagerDuty
    • Sentry
    • AWS
      • CloudWatch
      • ECS
      • GuardDuty
      • Health
      • Inspector
      • Security Hub

普段、インフラ管理を担当しているSREにとって、監視やモニタリングは欠かせない業務です。しかし、DatadogやAWSのイベントログなど、複数のSaaSを横断して監視する作業は非常に時間がかかり、イベントログの見落としが生じやすく、その結果対応が遅れてしまうことがあります。

また、SREをこれから推進しようとする際、モニタリングから始めるケースでも、必要な知見が不足していたり、SREの人材確保が難しく、十分な工数が取れない場合があります。そうした中、「srest」を利用すれば、これらの課題を自動で一元化し、解決してくれるサービスとなっています。

※以下メタップスさんの調査でも紹介されています。

複数ツールを跨ぐ監視業務の課題、「イベントログの確認に時間がかかる」が約7割で最多~インフラ/SREエンジニアに調査~

あまりイメージが湧かない!と思うかもしれないので、まずはダッシュボードを見ていきましょう。

※今回テストアカウントを作成していただきました!


導入方法

https://docs.srest.io/introduction/event


Dashboard

ダッシュボードは非常にシンプルなUIで構成されています。Datadogで設定された「SLO」が表示され、連携するだけで自動的に可視化されます。もちろん、各アプリケーションやサービスのログをカスタマイズして表示することも可能です。続いて、Datadogのアプリケーション欄を詳しく見ていきましょう。


Datadog

Datadogでは設定したアラートの一覧が表示されます。これにより、各プロダクトで注視すべきイベントを簡単に確認できるだけでなく、プロダクト別のイベント件数を円グラフで視覚化することが可能です。この機能により、どのサービスでアラートが最も多く発生しているのかを一目で把握できます。

PagerDutyやSentryも同様なので割愛しますが、次はAWS関連のイベントログを見ていきましょう。


Amazon ECS

ECSではコンテナの異常停止を示す「Essential container in task exited」といったイベントログを確認することができます。多くの場合、コンテナのCPUやメモリ使用状況を監視していても、イベントログの監視を見落としてしまうことがあります。原因調査を早期に発見できるのはいいですね。


Amazon GuardDuty

GuardDutyはCloudTrailなどのデータソースから収集した情報を分析して、アカウントの乗っ取り、データの漏洩、不正な動作など、様々なセキュリティ脅威を識別することができます。一覧では警告の優先度を絞り込む機能があるため、どの警告に対応すべきか判断しやすくなります

Amazon Inspector ECR Image

Inspectorを利用したECSコンテナイメージのスキャンでは、GuardDutyと同様にセキュリティ上の優先度を設定し、CVE(Common Vulnerabilities and Exposures)に対応する脆弱性IDが確認できます。CVEの詳細ページへ直接リンクできれば便利ですね。


AWS Security Hub

Security HubはGuardDutyやInspectorと同様にセキュリティ基準に基づいたベストプラクティスのチェックを確認できます。一覧化されていることでAWS環境がセキュリティの観点からどのように構成されているかを簡単に把握でき、必要な対策ができそうですね。


まとめ

「srest」を利用することで、各アプリケーションやAWSとの連携により、ダッシュボードの設定に要する手間を省くことができる点が大きな利点だと感じました。さらに、連携したサービスが一元化されているため、複数のSaaSを横断しての運用が不要になるのと、イベントログを見逃すことなく迅速に対応できそうです。

個人的には今後、様々なサービスへの連携と蓄積されたデータを分析し、セキュリティのアプローチなども実現できればサービスの魅力はさらに高まると思いました。

今後のアップデートに期待します!無料期間は7月までとなりますので、気になった方はメタップスホールディングスさん繋げるのでぜひ!

Pocket

カテゴリー: AWSMonitoringSREsrest

adachin

1989年生まれのSRE。ホスティングから大規模なアドテクなどのインフラエンジニアとして携わる。現在はサービスの信頼性向上、DevOps、可用性、レイテンシ、パフォーマンス、モニタリング、オブザーバビリティ、緊急対応、AWS/Azureでのインフラ構築、Docker開発環境の提供、Kubernetes保守、インフラコード化、新技術の検証、リファクタリング、セキュリティ強化などを担当している。個人事業主では数社サーバー保守とベンチャー企業のSREインフラコンサルティングやMENTAで未経験者にインフラのコーチング/コミュニティの運用を実施している。また、「脆弱性スキャナVuls」のOSS活動もしており、自称エバンジェリスト/技術広報/テクニカルサポート/コントリビュータでもある。

0件のコメント

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください