01. 背景介绍对于企业的生产环境而言,监控与报警不可或缺的,完善的监控与及时的报警和自动化处理,可以帮助企业快速定位并解决问题,从而减少经济损失。腾讯云事件总线(EventBridge)是一款安全、稳定、高效的无服务器事件管理平台。事件中心的事件总线可以接收来自您自己的应用程序、软件即服务(SaaS)和腾讯云服务的实时事件及相关数据流,通过集成消息推送和 SCF 云函数,实现告警信息的实时通知和自动化处理。本文以服务器异常为例,为您介绍当云服务器产生告警事件后,如何基于 EventBridge 事件总线和 SCF 云函数,实现告警消息的实时推送和硬盘快照的自动回滚,完成自动化运维架构的快速搭建。02. 架构设计整体架构设计如图,从图上可以看出,当云服务器某台机器出现异常告警, CVM 会自动产生告警事件并主动推送给 EB,经过 EB 绑定的告警规则筛选后,完成到通知渠道的消息触达及时通知到用户,同时触发云函数,以调用 API 的方式完成硬盘快照的快速回滚,保证业务及时恢复。03. 基本步骤登录云函数控制台新建云函数,通过调用 API 的方式,完成服务器故障后自动处理流程的函数代码编写云服务器关机接口:https://cloud.tencent.com/document/product/213/15743快照回滚接口:https://cloud.tencent.com/document/product/362/15643登录 EventBridge 控制台,配置告警规则以「云服务器运行异常」事件告警配置为例,您可以选择指定的事件告警类型,也可以选择全部告警事件,详细事件匹配规则请参见 管理事件规则配置推送目标为了满足自动化处理和消息推送两部分能力,对于上述规则,我们需要同时配置消息推送和云函数两个投递目标消息推送:通过配置消息推送,将您的告警事件推送至指定的消息接收渠道,完成用户及时触达。云函数投递:触发方式选择「云函数(SCF)」–「已有函数」,选择刚刚已部署好的云函数进行绑定告警链路测试配置完成后,回到事件集控制台,选择刚刚已绑定的事件集,单击发送事件,可以选择已绑定的事件规则模版,单击发送进行测试,如果同时收到了推送消息并自动进行回滚,即可确认您的业务故障自动化运维架构已完成搭建。注:测试模版里只展示 data 字段里的内容,其它字段已固定,无法自定义修改。识别下方 二维码,进入「事件总线」交流群
本文出自快速备案,转载时请注明出处及相应链接。