关于监控方案的一点想法供参考

2023-11-02

Author:Skate

Time:2017/12/11


关于监控方案的一点想法供参考

 

 

1.监控目标:

 

监控的直接目标:及时、准确的发现潜在事件,并辅助运维人员处理生产事件,消除生产事件专家和高手与一线员工的区别;

监控的增值目标:通过高度的可视化展示提供整体的运行情况、业务监控服务、趋势分析

 

监控是值班运维的窗口,预警信息要能能告知我们哪个系统、哪个应用、哪个模块、哪个负责人、出了什么问题,可能是什么原因,建议如何应急。

监控还能将一些标准化程度很高的报警自动关闭,并告知值班人员监控做了什么,实现故障自愈。

 

 

2. 以人员角色多维度展示:

一线人员:看预警、看当天趋势,巡检、故障定位、应急处理等

二线人员:看性能趋势,分析数据

业务人员/管理层:看整体应用可用性(可以收关键业务的用户视觉报警,其他不需关心)

 

3.监控解决的问题:

发现问题:通过监控最快的发现问题

定位问题:复杂的架构环境下,辅助快速定位问题

应急解决问题:定位问题后,需要应急恢复,监控可以帮助人工或自动恢复

分析问题:建立各种模型、分析模型、可视化的展示分析数据

 

4.监控的内容总结:

基础监控:如服务器、OS等各方面的性能,包括:CPU、MEM、IO、宕机等

应用系统监控:从多种类型、多模块存活性,性能、系统运行逻辑进行监控

主要包括:

Ø  端口、服务的存活性,进程个数、进程重启状态、dump事件等;

Ø  方法监控,针对服务内部的方法(方法响应、次数、可用率等)进行监控

业务监控:从业务层面按业务进行全流程监控,对业务数据、业务功能进行监控,实时收集业务数据进行配置监控

 

基础监控、应用监控和业务监控错误可以说明系统有错误需要处理,但是如果都正常就不能说明系统是正常的,我们需要有用户视觉的角度来监控,

只有这个才是最正确的,比如下几种情况可以不用及时或半夜起来处理

 

a) 如果程序架构是做了可用性保证的,一个服务挂了,用户视角的监控没有报警,说明对用户没有影响,如果此时凌晨收到报警,也是不需要马上起床来处理的

b) 用户是在全国各地进行访问的,很有可能某个地域的网络出问题,此时只有在全国布点的用户视角监控才能发现

 

实施用户视角的监控方法

(1)使用接入层的接口监控,只是,不对每一个web-server的站点ip实施监控,而是对nginx反向代理层实施监控

(2)引入第三方监控

 

 

5.监控常见问题

误报:当有告警时,可以多次、多路径验证

漏报:可以多方位监控,多IDC分别独立部署监控系统,再加上第三方等来解决

多报;可以通过重定监控基线、汇总、聚合等方法,实现比较难

全业务流程监控手段不够丰富:可以通过日志,应用程序埋点、用户反馈来解决

 

 

6.监控数据的消费场景

监控数据可以用于资源的扩容建议、应用系统的运行情况了解等,也是运维自动化的纽带





 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

关于监控方案的一点想法供参考 的相关文章

  • 前端面试之道

    小册介绍 如果需要用一句话来介绍这本小册的话 一年磨一剑 应该是最好的答案了 为什么这样说呢 在出小册之前 我收集了大量的一线大厂面试题 通过大数据统计出了近百个常考知识点 然后根据这些知识点写成了这本小册 这本小册可以说是一线互联网大厂的

随机推荐

  • Win7封装全过程

    安装操作系统是个漫长而无聊的过程 我们个人安装原版系统都要花费半小时以上的时间 想象一下 一个500 1000 上万人的公司要是按这种方式装的话要花费多少时间 人力 物力 还好 系统制造商早就考虑到了这一点 有自己的应对之策 这就是操作系统
  • P10.编程生成Excel内图表

    P10 编程生成Excel内图表 md 插入图片 openpyxl插入图片 openpyxl drawing image sheet add image 例 from openpyxl drawing image import Image
  • Chapter Two : Python 语言基础、运算符与表达式、程序的控制结构合集

    目录 一 Python 语言基础 1 Python 语法规则 2 关键字与标识符 3 变量 4 基本数据类型 5 输入与输出 二 运算符与表达式 1 算术运算符 2 赋值运算符 3 比较 关系 运算符 4 逻辑运算符 5 位运算符 6 赋值
  • 2023华为OD统一考试(B卷)题库清单(按算法分类),如果你时间紧迫,就按这个刷

    目录 专栏导读 华为OD机试算法题太多了 知识点繁杂 如何刷题更有效率呢 一 逻辑分析 二 数据结构 1 线性表 数组 双指针 2 map与list 3 优先队列 4 滑动窗口 5 二叉树 6 并查集 7 栈 三 算法 1 基础算法 贪心算
  • xml文件报错Unable to resolve column ‘xxx‘

    项目场景 问题描述 我在使用mybatis的逆向工程时生成的xml文件报错Unable to resolve column xxx 原因分析 需要连接到数据库 解决方案 点击右侧 填写数据库信息 点击测试 报错的话点击下放Set time
  • shell 格式化输出密码

    格式化输出 etc passwd 效果如下 root zabbix server day6 awk F BEGIN print 用户名 UID 家目录 print 1 3 6 etc passwd 用户名 UID 家目录 root 0 ro
  • Unity 移动方法总结

    Unity移动方法总结 在Unity3D中 有多重方式可以改变物体的坐标 实现移动的目的 其本质是每帧改变物体的position 通过Transform组件移动物体 Transform组件用于描述物体在空间中的状态 它包括位置 positi
  • transformers库的使用【二】tokenizer的使用,模型的保存自定义

    使用标记器 tokenizer 在之前提到过 标记器 tokenizer 是用来对文本进行预处理的一个工具 首先 标记器会把输入的文档进行分割 将一个句子分成单个的word 或者词语的一部分 或者是标点符号 这些进行分割以后的到的单个的wo
  • C——编译预处理

    编译预处理 1 宏定义 2 文件包含 3 条件编译 C语言提供的预处理 在编译之前进行 主要有三种 宏定义 文件包含和条件编译 预处理命令不是C语句 不用加分号 1 宏定义 形式 define 宏名 替换文本 define 宏名 参数 替换
  • Python元组、列表、字典、字符串常用方法超详细总结!!!

    文章目录 1 列表 list 1 1 len 1 2 max 和min 1 3 reverse 1 4 sort 1 5 clear 1 6 remove 1 7 insert 和pop 2 元组 tuple 2 1 len 2 2 cou
  • test2这篇博客的目的是test我做的小程序,请勿打开

    这篇博客的目的是test我做的小程序 请勿打开
  • SpringBoot多数据源动态切换,不影响业务逻辑正常运行,服务高可用

    SpringBoot多数据源动态切换 不影响业务逻辑正常运行 服务高可用 本文使用Spring Boot 2 4 10版本和MyBatis实现多数据源动态切换 当主库MySQL宕机后自动切换到容灾PostgreSQL数据库 数据库及数据表示
  • Altium Designer -- EMC/EMI电路设计经验

    一 基本概念 参看 电磁兼容原理及应用 讲的相当的不错 随着科学技术的不断发展 各种电气和电子设备已广泛应用于国民经济的各个部门以及人们的日常生活中 电气和电子设备在正常运行的同时 也往外发射有用或无用的电磁能量 这些能量会影响其它设备的正
  • 【React】dva-cli建立脚手架后引用css 无效

    用dva cli作为脚手架建立工程后 开始尝试编写页面 然后立马发现一个坑爹的问题 在我less文件里面写了一个class 比如 MainHead 但是编译出来之后发现css文件里面变成了 MainHead xuaz 多了一个后缀 坑爹嘛这
  • JavaScript 预解析(面试经常问)

    文章目录 预解析 预解析 解析器运行 JS 分为哪两步 预解析 执行代码 预解析 js 引擎会把 js里面所有 var 还有 function 提前到当前作用域的最前面 执行代码 从上到下执行 预解析分为 变量预解析 变量提升 和函数预解析
  • 数字图像处理第一二章

    什么是数字图像处理 数字图像处理是指借助于数 计算机来处理数字图像 当x y和灰度值f是有限的离散数值时 称该图像为数字图像 一幅图像可定义为一个二维函数f x y 其中x和y是空间 平面 坐标 而在任一对空间坐标 x y 处的幅值f称为图
  • infix 关键字

    infix适用于有单个参数的扩展函数 如果一个函数使用了infix 关键字 接收者和函数之间的点操作 以及参数的一对括号可以省略 fun String printWithDefault0 default String print this
  • 动态路由协议BGP配置实战

    1 边界网关协议BGP BGP是自治系统路由协议 用于AS间交换路由信息 通常使用在运营商 运营商之间或是企业 运营商之间 目前广为使用的是BGP 4 支持CIDR BGP协议使用TCP179端口传输 同一AS的路由之间传输的协议称为IBG
  • 在HAL库中NVIC中断配置

    中断优先级分组配置 void HAL NVIC SetPriorityGrouping uint32 t PriorityGroup 配置函数 define IS NVIC PRIORITY GROUP GROUP GROUP NVIC P
  • 关于监控方案的一点想法供参考

    Author Skate Time 2017 12 11 关于监控方案的一点想法供参考 1 监控目标 监控的直接目标 及时 准确的发现潜在事件 并辅助运维人员处理生产事件 消除生产事件专家和高手与一线员工的区别 监控的增值目标 通过高度的可