PTT推薦

[心得] 自動化監控網站運行服務 - Gatus

看板Soft_Job標題[心得] 自動化監控網站運行服務 - Gatus作者
appleboy46
(小惡魔)
時間推噓 8 推:8 噓:0 →:3

部落格: https://bit.ly/docker-gatus
影片: https://www.youtube.com/watch?v=Fdgp3NpsPIs

## 前言

不知道大家在部署網站後,怎麼明確讓大家清楚知道現在網站的運行狀況,就像 GitHub就是提供整體運行的網頁,監控常用的操作指令,像是 Git Operations, Webhooks 或
GitHub Actions 等服務狀況。讓開發者遇到問題的時候,可以即時查看現在狀態做出相對應動作。而類似這樣的線上服務很多,像是 Atlassian 的 Statuspage 或 PingPong
等,更多免費服務可以直接參考 awesome-status-pages。而本篇要介紹一套開源軟體
Gatus,它是用 Go 語言撰寫出來的,非常輕量。

## 什麼是 Gatus

Gatus 提供一個輕量的監控服務健康網頁,讓開發者透過簡單的 HTTP, ICMP, TCP 等
Protocol 來監控服務狀況,並且根據網頁回應的 Status Code 或 Response time 及
Body 內容來決定網站是否健康,如果發生異常,可以設定不同的 Alert 像是 Slack,
Email, Teams, Discord 或 Telegram 等常用的即時軟體。可以參考此連結看看
Dashboard 實際狀況。

## 為什麼選擇 Gatus

> Why would I use Gatus when I can just use Prometheus, Alertmanager,
Cloudwatch or even Splunk?

第一點各位開發者可以想看看,如何監控整個服務的狀況,而不是等到客戶遇到問題,你才知道狀況的發生。而 Gatus 可以從客戶角度對每個功能進行配置檢查,團隊可以根據重要的服務或接口進行監控,即時數據整理,才可以讓團隊比客戶更早知道狀況。

第二點團隊可以想看看,如果從 Prometheus 開始入手,是不是門檻過高,團隊真的有多餘的時間跟人力可以做到完整的監控,用 Prometheus + Alert 到 Grafana 監控頁面,需要花費不少時間跟人力才能完成,而這些指標,真的是客戶想看到的嗎?以及是否可以正確收到警報,這些配置都需要層層關卡,而 Gatus 透過簡單的設定,讓團隊可以快速監控整個服務,即時的通知設定,都可以在幾個小時內完成。

## 心得

我選擇此套原因就是簡單設定跟方便部署,除了監控網站服務之外,測試團隊其實可以拿這套,去寫大量的測試監控所有服務及效能,光是這點就可以替團隊省下不少時間做測試。另外每個服務還可以看到 response time 結果。

中間省略一段安裝及使用說明,詳細可以參考部落格: https://bit.ly/docker-gatus

--
AppleBoy Blog: http://blog.wu-boy.com

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.254.168.131 (臺灣)
PTT 網址

safe03/27 09:52老闆最在意的免費要嗨賴起來呀

ss8651twtw03/27 11:06實用推

ptta03/27 15:22感謝分享

OrzOGC03/27 15:27免錢的最貴啊

jamo03/27 18:02免費真的最貴~

BignoZe03/27 18:24免錢的最貴不是這樣用的啦XD

roccqqck03/27 22:09實用

Esh03/28 00:07目前用Zabbix達到同樣目的

superpandal03/28 01:48現在一堆人賴以爲生的都是免費的 經驗有延續值得 沒

superpandal03/28 01:50有遇到了被就轟炸 XD

s5150703/31 21:01推分享