智能联动第三方告警中心,完美实现故障响应全闭环

2023-12-05

前言

我们曾讨论完善的告警策略是整个数据监控系统的重要组成部分(参见《 机智的告警策略,完善监控系统的重要一环 》),介绍了如何配置告警通知以及场景示例,帮助用户及时更多潜在的故障和问题,有效地保障系统稳定运行和持续优化。为了实现故障发现、告警、处理的全闭环,我们可以利用 Webhook 或者本地 DataFlux Func 联动第三方告警响应中心,建立一个自动化的故障处理流程,提高系统的稳定性和可靠性。本文将介绍在观测云中如何配置 Webhook 和本地 DataFlux Func 连接第三方系统,从而发送告警通知到用户。

Webhook 自定义告警通知

当您需要通过 Webhook 自定义来配置告警通知对象时,可以在观测云的 监控 > 通知对象管理 > 新建通知对象 ,选择 Webhook 自定义 并填写 URL 地址。

告警通知细节

观测云的 HTTP 告警通知为【固定格式的 POST 请求】,请求体格式为 application/json ,您可以参考以下请求详情示例:

POST {填写的 Webhook 地址}
Content-Type: application/json

{
    "timestamp"               : 1625638440,
    "df_status"               : "warning",
    "df_event_id"             : "event-xxxxxxxxxx",
    "df_title"                : "web001 存在问题",
    "df_message"              : "web001 存在问题、nCPU 使用率大于 90\n 内存使用率大于 90",
    "df_dimension_tags"       : "{\"host\":\"web001\"}",
    "df_monitor_id"           : "monitor_xxxxxxxxxx",
    "df_monitor_name"         : "异常检测名",
    "df_monitor_checker_id"   : "rul_xxxxxxxxxx",
    "df_monitor_checker_name" : "异常检测项目名",
    "df_monitor_checker_value": "99",
    "df_event_link"           : "https://console.guance.com/keyevents/monitorChart?xxxxxxxxxx",
    "df_workspace_uuid"       : "wksp_xxxxxxxxxx",
    "df_workspace_name"       : "我的工作空间",
    "Result"                  : 99,
    "... 其他更多字段": "略",

    // 以下为旧版字段
    "date"          : 1625638440,
    "workspace_uuid": "wksp_xxxxxxxxxx",
    "workspace_name": "我的工作空间",
}

具体的字段说明,参见: 事件 - 观测云文档
一般来说,对接第三方消息平台时,只需要用到 df_title df_message 两个字段即可。

对接方式

观测云为您提供两种监控告警通知对象 「Webhook 自定义」的对接方式: 直接对接 DataFlux Func 中转对接 。根据您的实际情况,您可以自由选择并配置。

直接对接

在观测云中,支持用户配置 Webhook 自定义告警通知对象,以便在发生异常事件告警时,向用户指定的 URL 发送 HTTP 请求,实现告警信息的的传递,以便用户能够及时对故障进行响应和处理。直接对接方式即在观测云 监控 > 通知对象管理 的「Webhook 自定义」中直接填写客户系统/第三方系统 URL,这样观测云就能够将异常事件请求详情直接发送到第三方系统的告警响应中心。需要注意的是,采用这种方式需要客户系统/第三方系统能够处理观测云发出的上述类型请求;否则需要以下方式 DataFlux Func 作为“接口转换器”对接客户系统或第三方系统。

DataFlux Func 中转对接

我们都知道 Webhook 在传递数据或通知时发出的请求是有固定格式的。因此,一旦客户系统或第三方系统无法满足观测云的「Webhook 自定义」方式发出的 HTTP 请求格式需求(即上文所述告警通知细节),如请求体为 XML、String 或其他格式,我们就需要 DataFlux Func 即观测云开发集成的一款集函数开发、管理、执行为一体的平台,只需简单配置及编辑脚本即可实现告警通知的对接。

所以,在观测云产生事件时,将自动向本地 DataFlux Func 的授权链接发送固定格式的 HTTP 请求,再由 DataFlux Func 中编写的脚本向第三方告警响应中心发送请求。这样,用户就可以有更多第三方系统的选择来自定义告警通知对象,让故障响应变的更加及时和便捷。

当然,采用这种方式不仅需要合适的网络环境,还需要您了解基础 Python 开发知识以及 DataFlux Func 的使用方法(参见: https://func.guance.com/doc/intro-guide/)。

实际场景示例

由于某用户告警短信平台的接受请求格式与观测云「Webhook 自定义」发出的 HTTP 请求格式不同,需要利用 DataFlux Func 中转对接来发送观测云监控器异常事件的告警通知到其告警短信平台。

假设用户的告警短信平台调用方式如下:

GET http://some-domain/send-sms?to=13000000000&msg=短信正文

那么,结合上文所述的「告警通知细节」的内容,即可写出以下脚本:

import requests

SMS_API = 'http://some-domain/send-sms'

@DFF.API('Webhook 对接')
def webhook_accept(**event):
    print(f'事件数据:{event}')

    params = {
        'to' : '13000000000',
        'msg': event.get('df_title') or '您在观测云有新事件',
    }
    r = requests.get(SMS_API, params=params, timeout=3)
    print(f'接口返回:{r.status_code} {r.text}')

    return r.status_code, r.text

在 DataFlux Func 完成脚本发布后,我们就可以在 管理>授权链接 中为函数添加授权链接。

创建授权链接后,在授权链接的「示例」中,复制「POST 简化形式请求」中的 URL 地址(以 /simplified 结尾)。

转到观测云 ,将 URL 地址填入通知对象管理中的「Webhook 自定义」即可。

完成以上操作,用户就可以在观测云产生事件时,及时收到告警通知。根据不同的等级的异常情况,快速响应并处理故障,有效的保障用户系统的稳定运行。

结语

Webhook 作为基于 HTTP 的回调函数,有效地实现服务器之间的实时数据传输和通知。在观测云中,您不仅可以直接设置「Webhook 自定义」通知对象,也结合观测云开发集成的 DataFlux Func,快速实现与第三方告警响应中心的联动,避免错过重要异常情况信息,从而实现故障发现、告警和处理的全闭环,帮助企业将系统动荡遏制在摇篮里!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

智能联动第三方告警中心,完美实现故障响应全闭环 的相关文章

  • 腾讯音乐后台开发(面试官太狗了) 一面 二面

    双非二本 互联网大厂游戏校招入职体验 转眼已经入职我手工作快六个月啦 加上提前入职实习了六个月 已经算是一年工作经验了hhh 但任然有一种自己还是学生的错觉 加上前几天看完周杰伦上海演唱会散场之后去 题解 快速求和反应训练 新思路 先给佬磕
  • @6666666666666轩闻

    6666666666666轩闻 看到请回复 无聊 牛客425068585号 425068585 秋招选offer 坐标辽a 工商和农行哪个好 求建议 选择哪一个offer PK offer选一下 offer 客户经理岗位这两个怎么选 除了洛
  • PyCharm添加Anaconda虚拟环境

    使用pycharm添加anaconda虚拟环境时 找到anaconda的安装目录 选择文件condabin里面的conda bat 然后点击ok继续操作即可
  • 基于Go语言实现简易Web应用

    目录 前言 Go语言特点 写在使用Go语言实现Web应用前面 创建Web服务器 声明一个结构体操作 加入中间件的使用 使用静态文件服务器 最后 前言 在编程语言中 近几年问世的几个新语言都是非常不错的 比如Go Python Rust等等
  • 反馈:打造优质产品的必备利器

    在当今快速发展的科技时代 我们越来越强调创新和快速迭代 然而 在这样的环境下 许多公司在开发新产品或功能时 却忽略了其中最重要的一步 充分了解和满足用户的需求 而要做到这一点 就需要我们利用一种强大的工具 反馈 反馈是一种用来获取或提供一个
  • 冤哥y佬和他的happy茶(2023年四川大学腾讯杯新生赛E题の吐槽)

    第一次发帖 希望大佬们能解答 小弟是今年大二的双非计算机专业学生 在前面一年多里面有效的学习时间学的基本上都是前后端开发 现在是把重心放在了后端的开发上面 最近学校和腾讯云有个校企合作的小项 题解 X形图案 include
  • 基于腾讯云手把手教你搭建网站

    目录 前言 前期准备工作 具体搭建网站 番外篇 网站开发及优化 结束语 前言 在当今数字化时代浪潮之下 作为开发者拥有一个属于自己的网站是非常有必要的 也是展示个人形象 打造影响力和给别人提供服务的重要途径 网站不仅可以作为打造自己影响力的
  • Python从入门到项目实践!神仙级python入门教程(非常详细),从零基础入门到精通,从看这篇开始!

    内容简介 Python 从入门到项目实践 一书从入门学习者的角度出发 通过简洁有趣的语言 丰富多彩的实例 挑战大脑的任务 贴近开发实战的项目 循序渐进地让读者在实践中学习 在实践中提升实际开发能力 全书共分7 篇 基础篇 进阶篇 高级篇 框
  • CnosDB有主复制演进历程

    分布式存储系统的复杂性涉及数据容灾备份 一致性 高并发请求和大容量存储等问题 本文结合CnosDB在分布式环境下的演化历程 分享如何将分布式理论应用于实际生产 以及不同实现方式的优缺点和应用场景 分布式系统架构模式 分布式存储系统下按照数据
  • Python教程:从零基础到编程高手

    Python 一门简洁而强大的编程语言 吸引着越来越多的初学者 本文将为你提供一份Python教程 带领你从零基础开始 逐步掌握这门语言 最终成为一名Python编程高手 第一部分 Python入门指南 首先 我们将介绍Python的基础知
  • 中移物联网山东地区有收到offer的朋友嘛

    题解 计算用户的平均次日留存率 SELECT COUNT DISTINCT q2 device id q2 date COUNT DISTINCT q1 device id q1 date 题解 小乐乐找最大数 include
  • 超越其它所有SOTA!Drive-WM:与现有端到端规划兼容的第一个自动驾驶世界模型!...

    点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 gt gt 点击进入 自动驾驶之心 世界模型 技术交流群 论文作者 汽车人 编辑 自动驾驶之心 最近世界模型的工作好多 今天分享一个与现有端到端规划模型兼容的驾驶世界模
  • 【vue3】elementplus日期组件英文转中文

    vue3 elementplus日期组件英文转中文 1 在main js或者main ts中加入 即可解决 import ElementPlus from element plus import element plus dist inde
  • 自定义软件APP定制开发的优势|企业网站小程序搭建

    自定义软件APP定制开发的优势 企业网站小程序搭建 随着科技的不断进步和智能手机的普及 移动应用程序 APP 成为了人们生活中必不可少的一部分 对于企业来说 拥有一个自定义的APP可以带来很多优势 本文将介绍自定义软件APP定制开发的一些优
  • CnosDB FDW:打通一扇通往PostgreSQL世界的大门

    本文档提供了下载 安装和使用 CnosDB FDW 的简要说明 请根据您的实际需求和环境对文档进行调整 概述 CnosDB FDW 是一个用于在 PostgreSQL 数据库中访问 CnosDB 数据库的外部数据包装器 Foreign Da
  • 艾瑞:央国企数字化升级,低代码首选得帆云!

    中国权威咨询机构艾瑞咨询最新发布了 2023年央国企数字化升级研究报告 THE NEW RESEARCH 报告认为 央国企作为中国特色社会主义的重要物质基础和政治基础 肩负着推动经济发展和增强社会价值的重要责任 必须在数字化升级中发挥引领作
  • 事件代理如何使用?

    事件代理是一种机制 用于处理动态添加的元素或大量元素的事件绑定 通过将事件绑定到它们的父元素上 可以统一处理子元素的事件 以提高性能和代码简洁度 在jQuery中 可以使用on 方法来实现事件代理 on 方法接受两个参数 事件类型和处理函数

随机推荐

  • 巧借C++算法实现冒泡排序算法

    目录 引言 冒泡排序原理 具体实现步骤 示例代码 时间复杂度和稳定性 优化可能性 结束语 引言 作为计算机专业出身的开发者 以及从事软件开发相关的小伙伴 想必对C 语言并不陌生 它是一门非常厉害的编程语言 不仅是基于程序底层的语言 而且是一
  • 命令行客户端MySQL如何使用

    MySQL是一种常用的关系型数据库管理系统 它提供了命令行客户端来与数据库进行交互 以下是使用命令行客户端MySQL的基本步骤 打开命令行终端 如Windows的命令提示符或Mac的终端 输入以下命令来连接到MySQL服务器 mysql u
  • 自动驾驶轨迹/行为/运动/交通预测综述论文总结

    作者 eyesighting 编辑 汽车人 原文链接 https zhuanlan zhihu com p 664213622 点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 点击进入 自动驾驶之心 轨迹预测 技术交
  • Java入门:二.安装Apache Tomcat(非必须)

    前言 如果不需要使用Web服务器功能 只使用Java开发 那则不需要安装Tomcat 在安装Tomcat前 需完成java环境搭建 参见 Java入门 一 开发环境搭建 安装java jdk CSDN博客 一 下载Tomcat 下载地址 A
  • 容器与集群——通过deployment 创建pod以及Java Web应用的容器化发布

    一 通过deployment 创建pod 1 1 编写yaml文件 1 2 安装pod 创建 kubectl create f dp nginx yaml 查看Deployment信息 1 3 查看相关信息 查看pod信息 kubecel
  • 头歌—Hive的安装与配置

    第1关 Hive的安装与配置 在修改 conf 下面的 hive site xml 文件这里 题目给的信息是错误的 正确的内容如下
  • 【已解决】为什么Word文档里有部分内容无法编辑?

    小伙伴们是否遇到过这样的情况 打开Word文档进行编辑 发现部分内容可正常编辑 另外一部分内容却无法编辑 这是怎么回事 又要如何解决呢 出现以上情况 一般是Word文档被设置了 限制保护 使其部分内容被锁定 无法进行修改编辑 我们可以在文档
  • Python入门实战 | 第二期(input输入语句和if判断语句)

    本期继续给大家推荐Python的语法讲解 Python作为深度学习的必备工具 也是PHM初学者的必备技能 之前发表了初学者必看 Python入门语法讲解与实战 一 这期主要是介绍Python的input输入语句和判断语句 目录 一 inpu
  • SMT贴片加工组装工艺的可靠性

    随着电子产品的广泛应用 电子产品的可靠性已成为一个重中之重的问题 大多应用场合都要求电子产品的性能必须稳定 可靠并且能够安全的运行 在航空航天 军事 通信 金融 监控等领域 如果电子系统发生故障会对其造成很大的损失 电子产品种类复杂 由材料
  • 油气罐防雷和化工防雷综合解决方案

    油气罐防雷和化工防雷是化工企业安全生产的重要内容 涉及到化工装置 储罐 管道 电气设施等多个方面 地凯科技 将介绍油气罐防雷和化工防雷的方案和应用方案 以期为化工企业提供一些参考 油气罐防雷 油气罐是储存可燃易爆物质的设施 一旦遭受雷击 可
  • JavaScript对象的创建方式有几种?

    在JavaScript中 有多种方式可以创建对象 包括以下几种 对象字面量 Object Literals 这是创建对象最简单的方式 使用花括号 来定义对象 通过键值对的方式来定义对象的属性和方法 let person name John
  • 拼图软件合成照片有推荐吗?探索热门拼图软件

    嘿伙计 你知道吗 最近我发现了一个超级好玩的拼图软件 简直就是我网上冲浪的新宠啊 我得给你分享一下我在这个软件上的使用体验感 简直是让我笑翻了 拼图的时候 你可以像变魔术一样通过手指滑动 缩放 旋转 将碎片们拼接起来 就像魔法一样 一块块碎
  • linux下安装nginx

    第一步 压缩包 准备压缩包 最好准备一个稳定的版本 下载地址 我这边选用的是1 24 0双版本号 第二步 解压 在相对应的目录下 执行命令 tar zxvf nginx 1 18 0 tar gz 第三步 配置 编译 推荐使用 config
  • [原创][4]探究C#多线程开发细节-“初步体验ManualResetEvent类带来的同步效果“

    简介 常用网名 猪头三 出生日期 1981 XX XX 个人网站 80x86汇编小站 https www x86asm org 编程生涯 2001年 至今 共22年 职业生涯 20年 开发语言 C C 80x86ASM PHP Perl O
  • 得帆云助力容百科技构建CRM系统,实现LTC全流程管理

    宁波容百新能源科技股份有限公司 宁波容百新能源科技股份有限公司 以下简称 容百科技 于2014年9月建立 是高科技新能源材料行业的 跨国型集团公司 专业从事锂电池正极材料的研发 生产和销售 于2019年登陆 上交所科创板 成为科创板 首批
  • Visual C++(VC)6.0-可视化软件编程开发工具 最新安装教程

    今天大成给大家分享的是 Visual C VC 6 0 可视化软件编程开发工具 安全无毒 无广告捆绑 运行稳定 快来下载体验吧 资源介绍 支持 Windows系统 Visual C 6 0是一个功能强大具有集成开发环境的可视化软件编程开发工
  • 如何做好小红书?9条小红书运营起号心得(必读)

    关于小红书运营细节和方法 总结了以下9条起号心得 希望给近期新手们一些经验借鉴 一 出现一条爆文后的策略 当账号新发的一篇笔记流量起飞了 不要急于发布新内容 先让爆文的流量消耗殆尽 等流量开始减少时再发布新笔记 同时 将新笔记置顶 这样访问
  • Linux下Redis安装及配置

    首先下载redis安装包 地址 这里我使用的是7 0版本的 将文件上传至linux上 此处不再多叙述 不会操作的 建议使用ftp 第一步 解压压缩包 tar zxvf redis 7 0 14 tar gz 第二步 移动redis存放目录
  • 测试基础知识

    常见测试分类 按测试阶段划分 单元测试 针对程序源码进行测试 国内是开发自测 集成测试 又称接口测试 针对模块间的访问地址进行测试 系统测试 对整个系统进行测试 包括功能 兼容性 文档等 验收测试 分为内测和公测 按代码可见度划分 黑盒测试
  • 智能联动第三方告警中心,完美实现故障响应全闭环

    前言 我们曾讨论完善的告警策略是整个数据监控系统的重要组成部分 参见 机智的告警策略 完善监控系统的重要一环 介绍了如何配置告警通知以及场景示例 帮助用户及时更多潜在的故障和问题 有效地保障系统稳定运行和持续优化 为了实现故障发现 告警 处