分布式监控系统——Zabbix(3)配置

2023-11-07

分布式监控系统——Zabbix(3)配置

一、监控项

1.定义一个不带参数的监控项

更新即可,事实上,需要关注的指标有很多种,一一添加进来即可。以上定义的监控项是很简单的,制定一个key即可,但是有些监控项是带有参数的,这样一来,监控项就更有灵活性。

2.定义一个带参数的监控项

  • []就是需要参数的意思,里面的值即为参数。
  • <>为不可省略的。

例:if表示是接口名;表示是哪种模式,包括但不限于:packets(包)、bytes(字节)、errors(错误)、dropped(丢包)、overuns等等(上述内容通过ifconfig查看)。

设置一个监控值:

通过命令行来查看:

查看网页的显示情况:

3.删除监控项

如果有一个监控项,用不上了,就可以删除掉。但是如果你直接删除的话,默认数据是会留下的,所以要先清楚数据,然后再删除,具体步骤如下:

4.监控项存储的值

对于监控项的值,老一点的版本只有以下三种方式:

  1. AS is:不对数据做任何处理(存储为原始值)。
  2. Delta:(simple change变化),本次采样减去前一次采样的值的结果。
  3. Delta:(speed per second速率),本次采样减去前一次采样的值,再除以经过的时长。

在3.4版本之后有了更多的表现形式:

二、触发器

1.简介

当采集的值定义完了以后,就可以来定义触发器了。触发器的定义是:界定某特定的item采集到的数据的非合理区间或非合理状态。通常为逻辑表达式。逻辑表达式(阈值):通常用于定义数据的不合理区间,其结果如下:

  • OK(不符合条件):正常状态——》较老的zabbix版本叫FALSE。
  • PROBLEM(符合条件):非正常状态——》较老的zabbix版本叫TRUE。

评定采样数值是否为合理区间的比较稳妥的方法是一一根据最后N次的平均值来判定结果;这个最后N次通常有两种定义方式:

  • 最近N分钟所得结果的平均值
  • 最近N次所得结果的平均值

触发器存在可调用的函数:

函数 描述
nodata() 是否采集到数据,采集不到则为异常
last() 最近几次
date() 时间,返回当前时间,格式YYYYMMDD
time() 返回当前时间,格式HHMMSS
now() 返回距离Epoch(1970年1月1日00:00:00UTC)时间的秒数
dayofmonth() 返回当前是本月的第几天

注:能用数值保存的就不要使用字符串

2.触发器表达式

基本的触发器表达式格式如下所示

{<server>:<key>.<function>(<parameter>)}<operator><constant>
  • server:主机名称

  • key:主机上关系的响应监控项的key

  • function:评估采集到的数据是否在合理范围内时所使用的函数,其评估过程可以根据采集的数据,当前时间及其他因素进行

  • 目前触发器所支持的函数有avg、change、dayofweek、delta、diff、iregexp、last、max、min、nodata、now、sum等

  • parameter:函数参数;大多数数值函数可以接受秒数为其参数,而如果在数值参数之前使用“#”作为前缀,则表示为最近几次的数值,如sum(300)表示300秒内所有取值之和,而sum(#10)则表示最近10次取值之和

  • 此外,avg、count、last、min和max还支持使用第二个参数,用于完成时间限定;例如max(1h,7d)将返回一周之前的最大值

  • 表达式所支持的运算符及其如下图所示:

3.定义一个触发器

查看一下aaa监控项的值,并以其为标准确定我们的非正常的值:

添加成功后再去最新数据里面查看图形,可以看到里面就有了一根线,就是定义的值:

超过线的即为异常状态,看起来非常直观。现在即使超过了这根线,也仅仅会产生一个触发器时间而不会做其他任何事。因此,需要去定义一个动作(action)

4.触发器的依赖关系

触发器彼此之间可能会存在依赖关系的,一旦某一个触发器被触发了,那么依赖之歌触发器的其余触发器都不需要再报警。

多台主机是通过交换机的网络连接来实现被监控的。如果交换机出了故障,我们的主机自然也无法继续被监控,如果此时,所有主机统统报警,要解决这样的问题,就是定义触发器之间的依赖关系,当交换机挂掉,只有自己报警就可以了,其他的主机就不要再报警了。这样也更易于我们判断真正故障所在。

注意:目前zabbix不能够直接定义主机间的依赖关系,其依赖关系仅能通过触发器来定义。

定义一个依赖关系:打开任意一个触发器,上面就有依赖关系,我们进行定义即可:

触发器可以有多级依赖关系,比如:

5.定义动作(action)

1.简介

  • 需要去基于一个对应的事件为条件来指明该做什么事,一般就是执行远程命令或者发警报。
  • 有一个告警升级的机制,所以,当发现问题的时候,一般是先执行一个远程操作命令,如果能够解决问题,就会发一个恢复操作的讯息给接收人,如果问题依然存在,则会执行发警报的操作,一般默认的警报接收人是当前系统中有的zabbix用户,所以当有人需要收到警报操作的话,我们则需要把它加入我们的定义之中。
  • 每一个用户也应该有一个接收告警信息的方式,即媒介,就像我们接收短信需要有手机号一样。
  • 每一个监控主机,能够传播告警信息的媒介有很多种,就算我们的每一种大的媒介,能够定义出来的实施媒介也有很多种,而对于一个媒介来说,每一个用户都有一个统一的或者不同的接收告警信息的端点,我们称之为目标地或者目的地。

综上为了能够发告警信息

  • 第一,我们要事先定义一个媒介
  • 第二,还要定义这个媒介上用户接收信息的端点(当然,在用户上,也称之为用户的媒介)。

系统内建的媒介类型:

这只是基本的媒介类型,里面还有更多的细分,已Email为例:

而同一个类型也可以定义多个,以Email为例,可以定义一个腾讯的服务器,一个网易的服务器等等。

2.定义一个媒介(media)

以Email为例:

定义后更新就可以了,媒介定义好了还需要让用户接收到邮件:

  • 进入管理——》用户——》Admin——》报警媒介
  • 添加一条进来:

PS:一个用户可以添加多个接收的媒介类型。

3.定义一个动作(action)

动作是在某些特定条件下触发的,比如:某个触发器被触发了,就会触发动作。现在基于redis来定义一个动作。

#在agent端安装并启动redis
[root@node1 ~]# yum -y install redis
[root@node1 ~]# systemctl start redis
[root@node1 ~]# ss -nutlp|grep redis

定义监控项:配置——主机——node1——监控项——创建监控项

填写完毕后添加即可,此时可以查看值:

定义触发器:

手动关闭redis服务来检测一下:

[root@node1 ~]# systemctl stop redis

创建动作:

需要在虚拟机上进行两项操作:

  • 修改sudo配置文件使zabbix用户能够临时拥有管理员权限
  • 修改zabbix配置文件使其允许接收远程命令
[root@node1 ~]# visudo
     91 ## Allow root to run any commands anywhere
     92 root    ALL=(ALL)       ALL
     93 zabbix  ALL=(ALL)       NOPASSWD:ALL	#添加此行
[root@node1 ~]# vim /etc/zabbix/zabbix_agentd.conf 
EnableRemoteCommands=1							#73行取消注释改为1。允许接收远程命令
LogRemoteCommands=1								#82行取消注释改为1。把接收的远程命令记入日志
[root@node1 ~]# systemctl restart zabbix-agent.service

添加了第一步需要做的事情,需要重启服务,如果重启不成功怎么办呢?就需要来添加第二步:

测试(关闭redis):

如上图,提示警告,再看redis服务又被远程命令拉了起来:

END

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

分布式监控系统——Zabbix(3)配置 的相关文章

  • CAN光端机技术指南:工业网络通信的高效解决策略

    在现代工业自动化和车辆网络通信中 CAN光端机 技术扮演着不可或缺的角色 它为控制器局域网 Controller Area Network CAN 提供了高效 稳定的数据传输解决方案 使得在复杂和严苛的工业环境中 数据通信更加可靠和高效 技
  • VPS计算深度解析:如何选择适合你需求的服务器配置

    在当今数字时代 无论是个人用户还是企业 都需要可靠的服务器来托管其网站 应用程序和数据 VPS已经成为一种受欢迎的托管解决方案 因为它提供了稳定性 安全性和性能的理想平衡 但是 在选择适合你需求的VPS服务器配置时 你需要考虑许多因素 本文
  • Linux ls命令

    目录 一 配置项 1 1 ls l 1 2 ls a 1 3 ls lrt 1 4 ls ld 二 案例 2 1 查看指定文件夹下文件的数量
  • 消耗服务器带宽的因素有哪些

    消耗 服务器 带宽的因素有 1 网站布局更改使网站页面大小增加 用户获取数据时会加大带宽的消耗 2 网站访客增加使浏览页面数据增加 从而加大对带宽的消耗 3 网页数量增加导致服务器带宽消耗加快 4 突然引起流量峰值 导致带宽使用量增加 5
  • 15分钟无门槛高效构建服务器性能监控系统!

    服务器监控是每个互联网厂商都重视并且想要尽可能做好的事情 从数据收集 数据处理 数据可视化最终再到实时监控告警 这一系列复杂的流程可能耗费企业大量的人力和时间 以至于某些时候因为其复杂性高无法达到预期的监控效果 而当事故发生时才发现 由于监
  • 进程间通信

    进程间通信 进程间通信介绍 进程间通信目的 数据传输 一个进程需要将它的数据发送给另一个进程 资源共享 多个进程之间共享同样的资源 通知事件 一个进程需要向另一个或一组进程发送消息 通知它 它们 发生了某种事件 如进程终止 时要通知父进程
  • Spark 中 BroadCast 导致的内存溢出(SparkFatalException)

    背景 本文基于 Spark 3 1 1 open jdk 1 8 0 352 目前在排查 Spark 任务的时候 遇到了一个很奇怪的问题 在此记录一下 现象描述 一个 Spark Application Driver端的内存为 5GB 一直
  • Linux 软件安装以及管理

    本篇主要记录常用的软件安装和管理方式 主要是 yum rpm dnf apt pip 大致都是一样的 主要是部分软件提供了解决依赖的功能 内容不包括源码安装 源码安装情况相对比较复杂 后续有时间再补充 约定 案例所用模板软件均为 pytho
  • 如何解读服务器的配置和架构?

    在当今数字化时代 服务器作为企业或组织的重要基础设施 其配置和架构对于保障业务的稳定运行至关重要 如何解读服务器的配置和架构 成为了一个备受关注的话题 本文将围绕服务器配置和架构的解读进行深入探讨 帮助读者更好地理解服务器的性能 扩展性和安
  • spark相关

    提示 文章写完后 目录可以自动生成 如何生成可参考右边的帮助文档 文章目录 前言 一 pandas是什么 二 使用步骤 1 引入库 2 读入数据 总结 前言 提示 这里可以添加本文要记录的大概内容 例如 随着人工智能的不断发展 机器学习这门
  • 【复现】遗传算法求解分布式电源选址定容问题并考虑环境因素研究【IEEE33节点】(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • 如何解决Mybatis-plus与Mybatis不兼容的问题:An attempt was made to call a method that does not exist. The attempt

    博主猫头虎的技术世界 欢迎来到 猫头虎的博客 探索技术的无限可能 专栏链接 精选专栏 面试题大全 面试准备的宝典 IDEA开发秘籍 提升你的IDEA技能 100天精通Golang Go语言学习之旅 领域矩阵 猫头虎技术领域矩阵 深入探索各技
  • VMware 最新版 - 虚拟机安装、激活、Centos安装、XShell 连接虚拟机、网络配置(全流程)

    目录 一 VMware 从安装到使用全流程 1 1 安装和激活 1 2 下载 Centos 镜像 以 7 为例 1 3 创建虚拟机 1 4 网络配置 1 5 验证网络是否可用 一 VMware 从安装到使用全流程 1 1 安装和激活 a 从
  • Linux终端常见用法总结

    熟悉Linux终端的基础用法和常见技巧可以极大提高运维及开发人员的工作效率 笔者结合自身学习实践 总结以下终端用法供同行交流学习 常 见 用 法 1 快捷键 1 1 Alt 在光标位置插入上一次执行命令的最后一个参数 1 2 Ctrl R
  • RF自动化环境安装+自动化实例解析

    RF定义 通用型的 自动测试框架 绝大部分的软件的的自动化系统都可以采用它 特点 测试数据文件 Test Data 对应一个个的测试用例 测试数据文件里面使用的功能小模块叫关键字 由测试库 Test Library Robot Framew
  • Kubernetes (十三) 存储——持久卷-动静态分配

    一 简介 二 NFS持久化存储步骤 静态分配 1 集群外主机用上次nfsdata共享目录中创建用来测试的pv 1 3 目录 用来对三个静态pv 2 创建pv的应用文件 vim pv yaml apiVersion v1 kind Persi
  • ssh:connect to host github.com port 22: Connection timed out

    解决流程 1 将github的端口由22改为443 ssh T p 443 git ssh github com 2 接着输入yes进行确认 The authenticity of host ssh github com 443 192 1
  • 服务器VPS是什么意思?一文了解其含义与重要性

    在今天的数字时代 服务器扮演着至关重要的角色 它们是网站 应用程序和在线业务的基石 但是 你是否听说过VPS 本文将深入探讨什么是服务器VPS 以及为什么它在今天的互联网世界中如此重要 什么是服务器VPS 服务器的基本概念 在我们深入探讨V
  • UI自动化测试之Jenkins配置

    背景 团队下半年的目标之一是实现自动化测试 这里要吐槽一下 之前开发的测试平台了 最初的目的是用来做接口自动化测试和性能测试 但由于各种原因 接口自动化测试那部分功能整个废弃掉了 其中和易用性有很大关系 另外 也和我们公司的接口业务也有关
  • 网工内推 | 上市公司同程、科达,五险一金,年终奖,最高12k*15薪

    01 同程旅行 招聘岗位 网络工程师 职责描述 1 负责职场 门店网络规划 建设 维护 2 负责网络安全及访问控制 上网行为管理和VPN设备的日常运维 3 负责内部相关网络自动化和系统化建设 4 优化与提升网络运行质量 制定应急预案 人员培

随机推荐

  • JavaScript图片转base64格式

    function changeBase64 var imgSrc share png 图片本地路劲 写自己本地图片地址 var image new Image image setAttribute crossOrigin anonymous
  • Docker Compose:Docker Compose部署nacos初始化MySQL

    Docker Compose Docker Compose部署nacos初始化MySQL 找初始化sql文件 nacos初始化mysql schema sql文件内容 docker compose yml 上传到挂载目录 运行docker
  • java常用工具类总结

    1 Java自带工具方法 1 1 List集合拼接成以逗号分隔的字符串 如何把list集合拼接成以逗号分隔的字符串 a b c List
  • 不安装oracle客户端,用plsql连接oracle

    首先安装32位和64位的Oracle客户端 在很多Oracle安装介绍中 都有提到设置2点 一 e 1 环境变量 NLS LANG SIMPLIFIED CHINESE CHINA ZHS16GBK 2 TNS ADMIN D app pr
  • 跨域问题Response to preflight request doesn‘t pass access control check: No ‘Access-Control-Allow-Origin

    场景 前端跟后台联合开发的时候 在局域网内 浏览器访问别人的地址可以获取数据 但是通过接口请求 就会跨域 解决方法 现在是vue项目 用axios请求 前端这边单独解决这个问题 不需要后端处理 第一 找到config index js 设置
  • 蓝牙Mesh开发四 TLSR8258 ble mesh通信测评

    前言 TLSR是由泰凌微电子设计的一款低功耗蓝牙芯片 8258芯片方案已经支持SigMesh协议栈 符合BLE5 0协议规范 跑下Demo来做下SIG Mesh的测试 如有异议 欢迎留言指正 特性 32 Bit RISC V 处理器 最高主
  • 深度学习损失函数之——L1 L2 SmoothL1(范数、损失函数、正则化)

    L1 L2以及Smooth L1是深度学习中常见的3种损失函数 这3个损失函数有各自的优缺点和适用场景 首先给出各个损失函数的数学定义 假设 x x x 为预测值与Ground Truth之间的差值 L1 loss表示预测值和真实值之差的绝
  • Redis查看订阅的模式串详细内容

    问题描述 pubsub channels可以查看Redis中被订阅的频道 channel pubsub numpat可以查看被订阅的模式 pattern 数量 redis cli pubsub numpat integer 3 问题 除了查
  • A,B,C , D, E类地址的划分及子网划分汇总的详解

    一 A类地址 1 A类地址第1字节为网络地址 其它3个字节为主机地址 它的第1个字节的第一位固定为0 2 A类地址范围 1 0 0 1 126 255 255 254 3 A类地址中的私有地址和保留地址 10 X X X是私有地址 所谓的私
  • 联想电脑如何启动BIOS并开启CPU虚拟化功能

    联想电脑如何启动BIOS并开启CPU虚拟化功能 首先 打开设置 gt 系统 gt 更新与安全 gt 恢复 gt 高级启动 gt 立即重新启动 进入后选择疑难解答 再点击高级选项 再在高级选项中选择UEFI固建设置后进入BIOS 进入BIOS
  • C++ 城市路径

    include
  • 全网最新最全的jmeter接口测试,压力测试

    一 前言 jmeter是apache公司基于java开发的一款开源压力测试工具 体积小 功能全 使用方便 是一个比较轻量级的测试工具 使用起来非常简单 因 为jmeter是java开发的 所以运行的时候必须先要安装jdk才可以 jmeter
  • pandas6:DataFrame非值数据(Nan)的处理

    Pandas中有哪些非值数据 1 NaN 是什么 NaN是被遗失的 不属于任何类型 from numpy import NaN nan print nan nan print NaN True print NaN False print N
  • 2023蓝桥杯考前整理

    目录 python接收数据的方法 python内置方法 python字符串方法 python模块 python接收数据的方法 接收一个元素 s input 接收一个字符串 n int input 接收一个整数 接收两个或三个元素 以空格隔开
  • 【软考】-高项-质量管理-子过程ITTO记忆技巧

    质量管理 贵管控 规划质量管理 1 记忆口诀 需求 干系 风险记住清 组织质量体系 策略盈 标杆成本质量流 思维测试 计划留 质量测量指标出 管理计划 记心头 2 故事 在一个叫做 需求城 的地方 有三个重要的公民 需求文件先生 干系人登记
  • Markdown中图片对齐方式及尺寸设置

    在markdown编辑模式下导入图片默认尺寸会很大 不符合预期效果 有时候需要对图片的对齐方式和尺寸大小进行调整 1 直接上传图片的原始效果 添加图片后默认尺寸很大 会占满整个宽度 2 图片尺寸及对齐方式调整 添加图片之后 图片底部 CSD
  • java对于Excel进行快速处理的框架EasyExcel(SpringBoot集成)

    一 EasyExcel介绍 EasyExcel是阿里巴巴开源的一个excel处理框架 以使用简单 节省内存著称 EasyExcel能大大减少占用内存的主要原因是在解析Excel时没有将文件数据一次性全部加载到内存中 而是从磁盘上一行行读取数
  • Anchor-Free based目标检测

    CornerNet 预测左上角和右下角来得到最后的bounding boxes 所以最基本的需要两个feature map表示对应的Corner 称为heatmap top left 和 bottom right 将属于同一个object的
  • C++中template(模版)的使用

    我们在编程的时候总是会遇到一些类似的模块 只是模块中的形参的数据类型不同 导致我们要不断的去更改模块的 这里就涉及到重载的知识点了 例如以下的几种情况 函数1 int max int x int y return x gt y x y 函数
  • 分布式监控系统——Zabbix(3)配置

    文章目录 分布式监控系统 Zabbix 3 配置 一 监控项 1 定义一个不带参数的监控项 2 定义一个带参数的监控项 3 删除监控项 4 监控项存储的值 二 触发器 1 简介 2 触发器表达式 3 定义一个触发器 4 触发器的依赖关系 5