运维平台 v1.1.0 发布|监控能力全面升级

私有部署  收藏
3 / 286

这次更新有什么亮点?

我们这次对监控能力做了大幅增强,重点包括:

  • ✅ ​多渠道告警:支持通过邮件、企业微信、钉钉、WebHook 等多种方式发送告警通知,确保不会错过任何重要信息。
  • ✅ ​灵活告警规则:基于 PromQL 语法,你可以自定义告警规则,比如设置 CPU 使用率超过 90% 时触发告警。
  • ✅ ​告警管理优化:新增告警静默功能,可以暂时屏蔽不必要的告警,避免打扰。

技术架构是什么?

平台采用行业领先的监控技术栈构建:

  • 数据采集:基于 Prometheus v3,负责高效收集和存储监控数据。
  • 数据展示:基于 Grafana v11,提供直观的监控图表和告警管理界面。
  • 告警规则:支持 PromQL 查询语言,可以灵活定义各种复杂的告警条件。

功能一览

为了方便你快速上手,我们准备了详细的配置指南:

截图示例

告警规则列表

image.png

告警通知效果

企业微信群机器人

image.png

钉钉群机器人

image.png

邮件

image.png

Webhook

以 HAP 工作流 Webhook 为例,接收告警消息写入工作表

image.png

欢迎使用反馈

如果你在使用过程中遇到问题或有任何建议,欢迎在下方进行反馈。