OpenStack企业云平台监控实践

2023-05-16

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

摘要:
《OpenStack企业云平台架构与实践》结合作者亲身经历的各类OpenStack的咨询、规划和实施经验,从理论和工程角度,讲述如何将OpenStack变成企业可靠的、托管企业各类生产环境的云平台的方方面面。本文节选自第8章。
性能监控

对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。

Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。

图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
195450ps8gnt8jhhtcsnaj.png


图1  Ganglia的Overview界面

图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。

195516nfbeuvhcc8uzhe1i.png

图2  Ganglia的聚合视图和节点视图

图3是CPU详细监控项目。

195536pvvkv9vov2hyztil.png

图3  Ganglia的CPU监控

图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。

195645wnuos06v0duo2a8n.png
图4  Ganglia监控虚拟机内存

服务与资源监控

Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。

图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。


195715btioht7z9nsn9s9o.png
图5  Nagios的连接视图

另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。

另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。

图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。


195824mzbx2b3zi0ll3xza.png
图6  Nagios的主机视图

图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。


195848vg5o6p9k2ppzb8c6.png
图7  Nagois的服务监控视图

对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。


消息中间件监控

消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。

图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。

195937g7u6be0cc6ruc8cg.png

图8  RabbitMQ的Overview视图

图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。

195958t933dxxadxn44xhn.png

图9  RabbitMQ的连接视图

图10展示了消息中间件的通道视图。

200056gqjkejrh6chm3joj.png

图10  RabbitMQ的通道视图

图11展示了消息中间件的交换(Exchange)视图。

200114zmvmofggdrkdvwob.png

图11  RabbitMQ的交换视图

图12展示了消息中间件的队列视图,并包括了统计信息。


200131b4rncnnvcchjecyh.png
图12  RabbitMQ的队列视图

图13是管理员视图,可以修改密码、增加用户等。

200233ifz4jacsici4vs12.png

图13  RabbitMQ的管理员视图

日志分析

OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。

LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。

图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。

200256jcga138ch3cf53gf.png

图14  LogStash的Overview视图

图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。

200349pl0gm0mlleeoc7kz.png

图15  LogStash的消息视图

图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。

200450zouc6cudsgj6dds5.png

图16  LogStash的消息过滤视图

#############################
本文节选自 《OpenStack企业云平台架构与实践》第8章第8节,由电子工业出版社,2014年11月出版。

作者简介
张小斌,苏宁北京研发中心云计算研发部负责人,拥有15年丰富的计算机软件设计、开发和管理经验,主要著作有《黑客分析与防范技术》和《计算机网络安全工具》(国内最早的网络安全书籍)。曾在朗讯贝尔实验室和硅谷Terawave等公司工作多年;在HP担任解决方案架构师;在赛门铁克任主任工程师,研发存储备份软件,曾参与公司全球“Cutting Edge”技术大会并做技术报告;在北电网络、Websense、TrustGo分别担任技术经理、研发经理和研发总监职位,曾负责邮件安全、移动安全、移动互联网搜索引擎等的研发管理工作;在VMware和IBM的云计算部门负责云计算产品的架构设计和解决方案等工作。

转载于:https://my.oschina.net/u/2285247/blog/1589776

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

OpenStack企业云平台监控实践 的相关文章

  • Pecemaker+Corosync+Haproxy高可用Openstack集群实战

    一 DRBD简介 DRBD的全称为 Distributed Replicated Block Device DRBD 分布式块设备复制 DRBD是由内核模块和相关脚本而构成 用以构建高可用性的集群 其实现方式是通过网络来镜像整个设备 它允许
  • Openstack云平台脚本部署之Aodh告警服务配置(十三)

    目录 一 简介 二 部署脚本 三 参考文档 四 源码 五 系列文章 一 简介 Openstack告警服务Aodh负责当收集的数据度量或事件超过所设定的阈值时 会出发报警 从Liberty 版本后从Ceilometer 中拆分出来 独立为单独
  • 私有云平台管理

    更改主机名 controller hostnamectl set hostname controller compute hostnamectl set hostname compute 更改hosts文件 vi etc hosts 插入以
  • OpenStack H版发布

    根据官方发布的消息 OpenStack 2013 2 代号Havana 最终版已经发布 除了增加OpenStack Metering Ceilometer 和OpenStack Orchestration Heat 两个新组件外 还完成了4
  • OpenStack的部署(六)------Neutron项目

    目录 一 CT控制节点 1 创建数据库neutron 并进行授权 2 创建用户 服务并赋权 3 注册API 4 安装提供者网络 桥接 并修改相关配置文件 5 重启相关服务 二 C1 C2计算节点操作 1 部署neutron服务 2 配置Li
  • kolla-ansible部署openstack+opendaylight

    1 环境准备 准备三台机器 分别作为OpenStack的controller和compute节点 OpenDayLight节点 另外把controller作为本次的部署节点 其中controller和compute节点各两张网卡 odl节点
  • OpenStack--部署认证服务keystone

    官方安装文档 https docs openstack org ocata zh CN install guide rdo index html 1 keystone数据库配置 1 创建数据库 root linux host4 mysql
  • Learning OpenStack Keystone

    Author 海峰 http weibo com 344736086 http yanheven github io http blog csdn net yanheven1 这周重新学习整理了OpenStack Keystone里面的知识
  • No package openstack-keystone available.Nothing to do

    root controller yum repos d yum y install openstack keystone httpd mod wsgi python openstackclient memcached python memc
  • 查看OpenStack的版本

    show openstack version root localhost openstack version openstack 4 0 2 Using openstack version will only give you the v
  • ML2 Plugin框架说明

    在H版本中 ML2 Plugin被添加意图取代所有的Core Plugin 它采用了更加灵活的结构进行实现 下图即为ML2 Plugin的实现框架 作为一个Core Plugin ML2自然会实现network subnet port三种核
  • OpenStack--实现内外网结构

    类似于阿里云 ECS 主机的内外网 双网卡不通网段 的结构 最终实现内外网区分隔离 https www aliyun com product ecs utm medium text utm source baidu utm campaign
  • openstack创建域、项目、用户、角色报错

    报错出现 An unexpected error prevented the server from fulfilling your request HTTP 500 1 创建项目service openstack project crea
  • openstack实战之使用sysprep工具封装windows7镜像

    openstack实战之使用sysprep工具封装windows7镜像 在openstack云平台环境下 使用sysprep封装windows7系统主要目的是清理虚拟机的SID 避免使用同一windows7镜像克隆出的虚拟机出现相同的SID
  • 基于openstack的免费云计算平台使用方法总结(IBM power架构 、支持docker)

    声明 此文档只做学习交流使用 请勿用作其他商业用途 author 朝阳 tony E mail linzhaolover 163 com Create Date 2015 3 6 13 55 38 Friday Last Change 20
  • openstack平台搭建笔记(容器云)

    openstack平台搭建笔记 容器云 一 根据要求准备好配置环境 节点IP 角色 备注 192 168 100 30 Master Kubernetes 集群 master 节点 Harbor 仓库节点 192 168 100 31 Wo
  • Openstack.Net SDK无法访问带区域的服务

    使用我们自己的硬件 我们安装了带有所有组件的普通 openstack 但是由于区域问题 我在访问除身份之外的服务时遇到问题 使用的代码如下 使用我们创建的管理员帐户和管理员租户进行调用 public static void TestAcce
  • Terraform,如何在现有资源上运行配置程序?

    我的问题与这个 github 帖子类似 https github com hashicorp terraform issues 745 https github com hashicorp terraform issues 745 这也与我
  • 错误:在openstack pike devstack上创建实例时未建立sql_connection参数

    我已经通过以下链接在我的 Ubuntu 16 04 上成功安装了 Openstack Devstack pike https www mirantis com blog how to install openstack on your lo
  • 开放堆栈你好世界

    我想在开放堆栈云上编写一个程序 当我搜索资源时 我找到的只是安装和管理手册 我安装了云 现在如何在其上运行程序 使用消息队列或 blob 存储的示例会很好 有谁知道这方面的好的编程教程吗 当您说 在 Openstack 云上编写程序 时 您

随机推荐

  • 【Python基础】request.post()方法

    00 序言 爬取懂che帝的车型信息时 xff0c 没太整明白request post 里面的参数是干什么用的 xff0c 所以写篇学习笔记提醒一下自己 url 61 39 https www dongchedi com motor bra
  • 老虎证券web端PWA实践总结

    历时两个月 xff0c PWA功能终于在web端稳定落地使用 xff0c 网站 web itiger com 从最新研究到落地上线 xff0c 遇到不少坑 xff1b 开发过程中也参考了不少资料 xff0c 但总有那么几个是没有答案 xff
  • 硬盘inode节点简单介绍

    一 inode是什么 xff1f 理解inode xff0c 要从文件储存说起 文件储存在硬盘上 xff0c 硬盘的最小存储单位叫做 34 扇区 34 xff08 Sector xff09 每个扇区储存512字节 xff08 相当于0 5K
  • NoMachine 远程桌面控制

    它是一个基于企业级对比套装的开源的终端服务器 它允许用户在连接速度缓慢或者窄带宽的情况下 xff0c 对X11会话进行远程访问 NX项目提供一整套的运行库文件以及优化的来自X11 xff0c SMB xff0c IPP xff0c HTTP
  • Angular之路--带你来搭建Webpack 2 + Angular 4项目

    上个月Angular发布了4 0 0版本 xff0c 少年们 xff0c 赶快学起来吧 xff0c 这篇文章带领大家搭建一个简单的Angular应用 xff0c 会尽量详细的把每个点都解释到 首先我选择了用webpack2来作为打包工具 x
  • C- unsigned :1之位域分析

    1 首先回忆结构体 我们都知道定义一个结构体可以这样的方式定义 struct Point float x float y point 等价于 struct Point point 除此之外 如果不想声明结构体 只想定义结构体的话 还可以这样
  • ShareSDK自定义UI的方法

    说明 xff1a 我们的分享菜单可以修改背景 xff0c 里面的图标以及文字 xff0c 颜色等 xff0c 另外可以自己自定义UI xff0c 用自己的方法写界面 xff0c 写好了之后可以调用我们以下无UI的分享方法 xff0c 另外我
  • HttpServletRequest & HttpServletResponse 中 Body 的获取

    为什么80 的码农都做不了架构师 xff1f gt gt gt 获取 HttpServletRequest 中的请求体 HttpServletRequest getInputStream 获取到请求的输入流 xff0c 从该输入流中可以读取
  • 图像学习之如何理解方向梯度直方图(Histogram Of Gradient)

    特征描述子 Feature Descriptor 特征描述子就是图像的表示 xff0c 抽取了有用的信息 xff0c 丢掉了不相关的信息 通常特征描述子会把一个w h 3 宽高3 xff0c 3个channel 的图像转换成一个长度为n的向
  • SQL查询语句练习题27道

    练习环境为 xff1a XP 43 SQL2000 数据库 练习使用的数据库为 xff1a 学生管理数据库 数据库下载地址为 http download csdn net download friendan 4648150 说明 这是我在学
  • 使用IDEA社区版如何创建SpringBoot项目?

    Spring Boot 就是 Spring 框架的脚 架 xff0c 它就是为了快速开发 Spring 框架 诞 的 首先谈谈SpringBoot的优点 xff1a 1 快速集成框架 xff0c Spring Boot 提供了启动添加依赖的
  • 从零转行数据分析的亲身经历

    作者 xff1a xiaoyu 微信公众号 xff1a Python数据科学 知乎 xff1a python数据分析师 快两周没更新了 xff0c 先跟大家说一下抱歉 最近生活上确实有点忙 xff0c 不过后续将恢复正常 今天和大家聊一个非
  • NodeBB搭建,维护,discuz!数据迁移

    为什么选择了NodeBB 无法回答 NodeBB官方Github NodeBB中文论坛 NodeBB官方文档 NodeBB中文文档 安装 此处的方式是Docker安装部署 https hub docker com r nodebb dock
  • _vimrc

    为什么80 的码农都做不了架构师 xff1f gt gt gt code 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34
  • ubuntu编译qemu报错:‘ERROR: pixman >= 0.21.8 not present.’

    在ubuntu14 04中用源码方式编译安装qemu时 xff0c 执行 configure步骤提示错误 xff1a configure ERROR pixman gt 61 0 21 8 not present Your options
  • mysql my.conf 配置_Mysql my.conf配置说明

    MySQL配置文件my cnf 例子最详细翻译 可以保存做笔记用 BEGIN CONFIG INFO DESCR 4GB RAM 只使用InnoDB ACID 少量的连接 队列负载大 TYPE SYSTEM END CONFIG INFO
  • [译]使用 Rust 编写快速安全的原生 Node.js 模块

    原文地址 xff1a Writing fast and safe native Node js modules with Rust原文作者 xff1a Peter Czibik译文出自 xff1a 掘金翻译计划本文永久链接 xff1a gi
  • Discuz搭建论坛报错:advice_mysqli_connect

    环境说明 xff1a Ubuntu 12 04 3 四块硬盘RAID5 半个月前由于内部办公服务器由于RAID5两块盘出现问题 xff0c 导致部分数据丢失 xff0c 好在SVN数据是实时备份 xff0c 否则就真的哭了 xff0c 由于
  • c语言通讯录程序线性表,数据结构(C语言)课设1——单位员工通讯录管理系统(线性表应用)...

    数据结构 C语言 课设1 单位员工通讯录管理系统 线性表应用 题目要求 xff1a 为某个单位建立一个员工通讯录管理系统 xff0c 可以方便查询每一个员工的手机号 及电子邮箱 其功能包括通讯录链表的建立 员工通讯信息的查询 修改 插入与删
  • OpenStack企业云平台监控实践

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 摘要 xff1a OpenStack企业云平台架构与实践 结合作者亲身经历的各类OpenStack的咨询 规划和实施经验 xff0c 从理论和工程角度 xff0c 讲述如何