实录分享 | IBM马达：Kubernetes/Swarm on Mesos

2023-05-16

4月17日，Mesos爱好者在北京P2联合创业办公社迎来了第四次Mesos User Group约会，下面是来自IBM马达的分享实录。

作者介绍：马达，IBM 高级软件工程师，Kubernetes/Mesos代码贡献者。

很高兴参加这次活动，之前我一直从事分布式计算；从硕士阶段就开始在做分布式资源的调度及优化这一块，当时是基于Globus做跨机群的资源调度。毕业时加入了百度，后来进入了Platform Computing公司；Platform Computing是一家有着20多年分布式经验的公司；2012年Platform Computing被IBM收购，现在做为IBM一个子部门继续从事分布式相关的工作。凭借我们在分布式方面非常丰富的经验，我们在与分布式相关的开源项目都有比较多的贡献，这次主要讲与Mesos， Kubernetes，Swarm相关，还有其它团队在做Spark相关的项目。我会介绍一下Kubernetes和Swarm与Mesos的集成；比如说在公司的选型上谈一下我自己的想法，大家可以一起交流，如果有一些其他的想法，大家也可以一起讨论。

图片描述

我先简单介绍一下这三个产品，然后讲一讲为什么要把Kubernetes和Swarm集成到Mesos上；然后介绍一些集成的细节，后面还有一些遇到的Challenge。最后，我们已经有一款自己的产品，叫EGO，和Mesos比较像。后续会逐渐将我们的经验及想法贡献到社区，我们做的主要是资源的调度，提高云和集群中资源的使用效率。

图片描述

首先介绍一下三个产品；Kubernetes是Google推出的，参考Google Borg的开源实现，现在支持它的有红帽、惠普、华为等企业。Swarm是Docker下的项目，Swarm的目标是100%兼容Docker API，现在已经达到90%多；有些API在分布式环境中比较难处理，后面会有介绍。Mesos是这次演讲的重点，Mesos由Mesosphere公司来支持，第二大的commiter是Twitter，第三大的社区贡献者是IBM。IBM上个季度贡献了200多代码。Mesos主要是为了将资源抽象出来，尤其是CPU这些资源抽象出来，使整个集群看起来就像一台机器；用户只要关心他使用什么样的资源就可以了，这是Mesos的作用，也就是进行资源的调度和编排，提高整个资源的使用率，减少IO，最终降低开发和运维的成本。

我原来在百度的时候，百度的运维团队非常庞大，研发要给他写一个脚本，也就是上线步骤，告诉他第一步怎么办，第二步怎么办，第三步怎么办，运维人员按照这个脚本来执行。业务上线以后，通知研发检查有没有问题。现在跟原来的同事聊，有了很大的变化，很多东西都有自动化的脚本，包括资源的利用，大概需要什么样的资源，它会自动的支撑脚本。Mesos就是做这件事，把整个资源的运维用机器做起来，减少手动。

图片描述

说一下为什么集成到Mesos上，Kubernetes和Swarm最主要的目标是Container，我们希望对资源可以共享，比如说双十一，会有峰值的时候；系统在平时会有一个估值，提供基本的服务资源；剩下的机器做一些线下的分析。Mesos为这样的需求提供了一种解决方案。

“Auto-Scaling”和“不依赖于特殊网络”；这两种个原因说服力不强：网络自己用脚本就可以做了，Auto-Scaling用脚本也差不多；主要优势还是资源共享，在DCOS上资源共享相对来说比较重要。现在大部分的公司还在专注于网络和存储，可以将容器连接进来并可以访问共享数据；但是过一段时间你会发现，网络和存储不是大的问题以后，大家会关心资源的利用率；如果10台机器的资源利用率提高10%，带来的好处并不明显，但如果是1万台机器能提高10%的利用率，那集群相当于多了1000台机，带来的效果还是很明显的。

图片描述

这是Kubernetes在Mesos的一个结构图，Kubernetes最左边这个地方就是Kubernetes自己本身的一些Master的东西，其实在Master最主要的是资源调度Scheduler这一块，Scheduler的资源是Mesos Master分出来的，所以在Kubernetes对Mesos来说只是其中的一个framework，Kubernetes和Spark可以共享资源。Kubernetes提供的CloudProvide很多，它可以跟其他的云厂商可以进行集成。在调度资源里面，Kubernetes还会遵循现有的调度策略。但是有一个问题，就是Scheduler在计算的时候，分配的资源只是基于Mesos给它的东西，比如Mesos分给Scheduler机器A，但是可能机器B上有一个更优的资源，它其实是拿不到的。

Scheduler拿到资源以后还是通过Mesos来启动计算节点，Kubernetes的Master相当于Mesos的一个Framework。这个计算节点的executor其实这个做的还是蛮不错的。在Kubernetes 中提供了一个Kubelet的库用于容器的管理，这个集成项目把Kubernetes和mesos的Executor做了集成，两边做的都是蛮好的。最开始以为是Slave再去起一个Kubernetes 的 Agent，那样计算节点的开销会很大。现在的解决方案相当于是把Kubernetes集中到Mesos的Executor。Kubernetes On Mesos，自己做了Executor，改了Scheduler，基本上还保持了Kubernetes原有的功能，对原来的支持还是蛮不错的。
图片描述

集成的问题，其实从总体架构来看，大家都是提供了集成的方法，但彼此的集成方案很难统一。而且在概念和功能上也有很大的区别，比如说Namespace和Quota，这是Kubernetes自己的功能，这两个彼此的资源都看不到。但是这个集成方案中，他并没有映射到Mesos自己的Role，整个Kubernetes映射成一个Role，这个Role能拿到多少Quota，就是Kubernetes 的资源。

另外就是刚才说的关于Optimistic Offer、Revocable resources。所谓资源共享，是Mesos上的一个Framework可以把自己不用的资源借出去，但是当我要的时候，我应该可以把资源抢占回来。而且当资源被抢占的时候需要给出一定的时间进行清理。Optimistic Offer现在会直接把资源抢回来，而且没有一个接口通知相应的作业进行后续的清理工作。比如说我要删某一个进程我应该告诉你怎么删，我要做一些东西。Kubernetes没有对Revocable resources做这些相应的处理。

另外，Mesos自己对Revocable Resources的支持力度也不是特别大。现在支持一种Revocable Resource：当机器分出去的Resources，但是没有用，也可以做Revocable resources。现在和Committer交流，我们经常提这个功能，他们并没有意识到资源的使用率对整个集群有多重要。集成的时候，Unified Container，把镜像下下来去解析。作为Unified Container，它并没有提供API, Kubernetes要用Docker的API完成这些工作，如果想把这些引到你的Unified Container，就意味着你的Unified Container要支持Docker的API,这对Mesos来说是很重要的。Docker的API最大问题是并没有一个统一的标准，它的镜像是可以下载下来的执行，但是Docker本身的API没有标准，Mesos的Unified Container要去兼容它的API是一件很繁重的工作。

另外就是Persistent Volume，Mesos自己提供了Persistent Volume，这个作业在机器上重启以后，这个资源所使用的文件会被留下来；如果没有Persistent Volume，则沙箱里的数据都会被删掉，这一块并没有跟Kubernetes自己的Persistent Volume集成在一块，Kubernetes自己的Persistent Volume做的事情是把Volume做成一种资源，比如说是1G或者2G，然后可以请求和作用这些资源；其实跟Mesos的功能是从想法上是完全一致的。但这里有一个效率的问题，Kubernetes自己Persistent Volume能够拿到全局所有的资源，但是如果基于Mesos的话，只能拿到Mesos固定的一些资源，所以这个Kubernetes只能基于不是最优集成拿到最好。其实最主要的大家都有自己的概念和想法，是没有一个人去做两边的集成，大家都认为应该跟随，到底谁应该跟随谁。

图片描述

Swarm相对来说还简单一点，Swarm对于资源还好，最开始的时候其实Swarm他会去发一个请求，这个请求还是自己Mesos的系统，他会自己做一个Schedule，告诉Master。因为Swarm运行Docker UPS，有一个路径，所以这个东西资源分配给Swarm Cluster，这个资源分到Swarm，资源分到这，Swarm会告诉他在哪一台机器上，然后Swarm会连这台机器上的Container。再取那个信息，整个的过程是达到Swarm拿到这个机器以后会告诉Master，Run就基于Mesos自己对Docker的支持。透过这个信息也会告诉你连这个Docker，把这个信息盖了，这个集成会比较简单一点。

Swarm这一块相对来说做的稍微好一些，它会抽象成一个集群，它跟Mesos相对来说关系比较好的。但是Swarm本身的功能相对来说比较少，需要依赖于Docker，才能搭一个大的环境。集成的时候，我们有相似的这些东西，也有相似的问题，尤其是Docker API，比如说我先推一个，等我Run的时候，如果那个资源一直留在那儿的时候，这个资源一直留着，因为也不知道什么时候开始，不知道什么时候把容器起起来，这个CPU有可能闲了两天，还是用Mesos其他的功能来弥补。后面有Role和Quota，Swarm在很早的时候不支持Role，Swarm提供了基于Mesos的Role的支持。

现在Mesos和Swarm有一个集成，你经常会看到Kubernetes发一个新的版本，Mesos过两天就说我支持这个版本，最明显的是Kubernetes 1.1，Mesos马上跳出来说我支持1.1了。而Kubernetes最近发了1.2，但是Mesos却没有动静了。

Swarm最新版本我记不住了，Swarm现在还是以Docker为主。其实后面Unified Container对它来说是比较麻烦的一件事情。刚才我们说了Swarm会连机器，如果你用Unifed Container，最后Swarm就没有办法集成。我个人猜，过一段时间Mesos如果这个集成还再继续往前走，Docker Executor有可能会跟Swarm集成放在一块去，不用Unifed Container。其实Kubernetes、Swarm这些都是依赖于Docker镜像做出来的。这一块现在有压力，现在没有一个人跳出来说这个事情到底应该怎么办。

Pesistent Volume包括有一些Role，不知道它后续想怎么去做这些新的东西，因为Swarm现在它们的集成也不是特别的安全。

Challenges这部分，对新的东西的集成，其实这种集成现在跟的特别紧。包括像Security是集成的挑战。Mesos告诉你自己想做什么样的Security就去做，你加一个用户或者改一个权限的话，它俩的集成这一块现在其实还在调查之中，自己玩一玩还好。

Multi-Tenant我刚才也说的，该怎么做决定，尤其是多层级的资源调度。比如说有一个部门，这个部门下面有三个人，每个人用到的资源我们也是在这里做，其实这种role就是一层，如果是三级部门去做这种资源分配还是很好做的。集成我们现在两个在一起做，Mesos我们会推这些资源容器，Kubernetes这一块现在是还在做的一个事情。新的集成这个只能说有新功能找新的解决方案，按案例来做。另外，集成的时候，大家都会用到Kubernetes有自己的UI，这些都是社区的，都是分开的。所以你做Monitoring要自己去做，包括集成的时候，把它的信息全都抓起来观察整个集群的信息，不能单看一个，要把所有的东西全抓住，分析整个系统资源和环境资源，是不是使用率最高的，就是说有没有错误，或者说不是按照小范围来分的。这些都是Mesosphere自己来做的。现在在社区里面其实主要支持这张PPT的上面这三个。

图片描述
IBM我们自己在做分布相关的产品，我们做了Mesos on EGO，在资源调度、分配、共享等方面有很大的优势。我们在做了Mesos on EGO以后，我们会有一个统一的资源管理系统提供资源计划，资源抢占等；其实我们在EGO里面其实已经做出来了。还有资源的分配，我们原来做企业级的产品，当时最大的客户应该有300多个Role来进行资源的分配和共享。我们现在做这种Policy，我们自己的产品跟Mesos集成，另外一个也会做一些相关的通用的功能。我主要讲的内容就是这么多。谢谢大家！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

实录分享 | IBM马达：Kubernetes/Swarm on Mesos 的相关文章

Up Board介绍及上手体验

Up Board是Intel联合华硕制作的一块性能强悍的卡片电脑外观如下 xff1a 性能参数如下 xff1a CPU为Intel 凌动z8350系列处理器 xff0c 最高频率可达1 92Ghz xff0c 内核GPU是400核心显卡
卫语句减少if else的层数

概述卫语句是一种写代码的经验为了减少if else的层数为了提高可读性 xff0c 进而利于维护案例现在做一个需求 xff0c 判断一个人是否满足招聘要求 xff0c 招聘要求 xff1a 30岁以下的中国男性体重100kg以下
ROS自定义msg、srv, 编译时找不到相关头文件

在我们拥有多个package的时候 xff0c 我们定义了一个消息或者服务 xff0c 并在代码中使用了这个消息或者服务如果是单独编译这个包 xff0c 编译通过但是如果是多个包一起编译 xff0c 就会出现找不到相关头文件的错误原
zz (2006- 11-30更新：ISWC2006论文集已上传)本版相关资源 (入门指南，资料软件，网址列表，会议期刊)!...

原文连接 http bbs w3china org dispbbs asp boardID 61 2 amp ID 61 25 入门材料注 xff1a 没有链接的文件 xff0c 请前往论坛 FTP xff08 地址用户名密码请看全站置顶
怎么安装winubuntu双系统_双系统中如何重装ubuntu系统图文教程

今天Win7之家小编就给大家介绍一种双系统中如何重装ubuntu系统图文教程 xff0c 大家之前也是有问过小编双系统中如何重装ubuntu系统 xff0c 但是小编没有及时回答 xff0c 现在小编就给大家介绍双系统中如何重装ubuntu
远程 sshd提示：Server unexpectedly closed network connection

远程sshd提示 xff1a Server unexpectedly closed network connection 重启后服务器效果也一样 xff0c 经过一段时间连接后 xff0c 终于连上远程了之后新建一个远程连接 xff0c
ubuntu如何跑arm程序

1 首先确定一间配置好arm linux 交叉编译器 xff0c 可以使用arm linux gcc 2 看示例代码hello c include lt stdio h gt int add int a int b int c 61 a 4
事件引入和本质

前言继上一篇委托后 xff0c 我们继续来探讨事件 xff0c 因为委托和事件有着不可分割的关系通过本文 xff0c 相信你会对事件有更深刻的认识和理解 xff0c 不信 xff0c 你看 xff01 概念用event 关键字使您可以
onlstm时间复杂度_CNN-LSTM | 一种融合卫星-雨量站降水数据的时空深度融合模型

1 xff0c 不同模型的降水融合性能表2 2001 2005年全国796个气象站不同降水校正模型的RMSE RB MAE和CC 如表2所示 xff0c 将4种模型结果与原TRMM数据进行了定量比较 xff0c RMSE和MAE值越小表明
app 后端技术

app 后端技术一直以来工作的方向是web server xff0c 对app server没有什么了解虽然没有接触过移动app开发 xff0c 但对app后端技术还是挺有探索欲望的 xff0c app应用和web应用在前端的用户习惯不
GSM Hacking：使用BladeRF、树莓派、YatesBTS搭建便携式GSM基站

每次看到黑客在网上发布的那些GSM技术相关文章我都十分惊讶然而在没有Software Defined Radios SDRs 之前 xff0c 玩GSM并不便宜 xff0c 除此之外想要好好玩你得下大功夫拓展阅读 GSM BTS Hac
开发新产品的三个验证阶段（EVT/DVT/PVT）

1 EVT Engineering Validation Test 是针对工程原型机的验证 xff0c 对象很可能是一大块开发板 xff0c 或是很多块开发板 xff1b 关键是要有足够时间和样品通常 xff0c 如果是新平台 xff0c
大麦盒子显示服务器超时,大麦盒子卡顿怎么办？这几个方法可以快速解决

原标题 xff1a 大麦盒子卡顿怎么办 xff1f 这几个方法可以快速解决根据研究表明 xff0c 目前家庭当中电视的使用时间依然在缓慢上升 xff0c 很多家庭会选购一款电视盒子 xff0c 让看电视的体验得到提升 xff0c 但网上很
【转载】跨域请求出现preflight request失败的问题的解决

本文转载自 xff1a https developer aliyun com article 753657 简介 xff1a 问题出现这两天在项目联调过程中突然前端同学报告出现CORS跨域问题无法访问刚听到很奇怪 xff0c 因为已经在
什么是FSK制式?什么是DTMF制式？

目前国内来电显示制式有FSK DTMF xff08 双音频 xff09 两种 xff0c 普通推广的是FSK 来电显示又称主叫号码显示 xff08 Calling Identity Delivery xff09 分为两种 xff1a 一
【IntelliJ IDEA】idea显示工具栏

idea显示工具栏在view gt 勾选对应按钮即可
Windows Server 2016 路由和远程访问

本次实验是将Windows Server 2016 配置成一个路由器 xff0c 为此网络上的客户端和服务器启用多重协议LAN到LAN xff0c LAN到WAN xff0c 虚拟专用网络和网络地址转换路由服务使用路由和远程访问需配置下列
如何理解Apache License, Version 2.0（整理）

如何理解Apache License Version 2 0 xff08 整理 xff09 问题 xff1a 最近看到apache发布了2 0版本的License 而且微软也以此发布了部分源代码我对OpenSource不是特熟 xff0c
网页视频流m3u8/ts视频下载

现在很多视频网站播放流视频 xff0c 都不是采用mp4 xff0f flv文件直接播放 xff0c 而是采用m3u8 ts这种方式播放简单说就是 xff0c 网站后台把视频切片成成百上千个xx ts文件 xff0c 一般10秒一个 xf
Windchill的JSP页面跳转到Ext页面的分析

今天花了一天时间 xff0c 看了一块代码 xff0c 低效但是不得不看懂具体内容是这样的 xff1a Windchill中按钮菜单栏嵌入了一个菜单项 xff0c 点击它会触发弹出一个新的浏览器页面 xff0c 相当于弹框 xff0c 让

随机推荐

C++类的定义和声明怎么写

C 43 43 语言可以看成是C语言的扩展和改进 xff0c 相对于C语言 xff0c C 43 43 语言主要是增添了面向对象的特性类 xff08 Class xff09 则是C 43 43 面向对象编程的实现方式无论是何种编程语言
jmeter-常用性能指标分析

概述我们在用jmeter做性能测试的时候 xff0c 有一些关键性的性能指标需要去分析但是由于开源工具本身的局限性 xff0c 这些指标在工具中的命名极易对我们造成混淆所以我们需要对这些指标一一进行剖析指标分析响应时间 xff1a
讨论76 怎么查一下我机器的内存？AIX环境

oracle大型数据库系统在AIX unix上的实战详解讨论76 怎么查一下我机器的内存 xff1f AIX环境一个读者来信问勒令一个简单问题 xff1a 怎么查一下我机器的内存 xff1f AIX环境问题 xff0c 我这里借用or
数组

数据类型数组名 61 new 数据类型元素个数或数组长度数组中最小的索引是 0 xff0c 最大的索引是数组的长度 1 获得数组的长度 xff0c 提供了一个 length属性 xff0c 在程序中可以通过数组名 length 的
静态方法不需要有对象，可以使用类名调用

Public static void printData 表明此类方法为类方法 xff08 静态方法 xff09 静态方法不需要有对象 xff0c 可以使用类名调用静态方法中不允许访问类的非静态成员 xff0c 包括成员的变量和方法 xf
matlab练习程序（曲面拟合）

这里用到的还是最小二乘方法 xff0c 和上一次这篇文章原理差不多就是首先构造最小二乘函数 xff0c 然后对每一个系数计算偏导 xff0c 构造矩阵乘法形式 xff0c 最后解方程组比如有一个二次曲面 xff1a z 61 ax 2
高铁在高速运行时的电力是如何提供的？

高铁在高速运行时的电力是如何提供的 xff1f 铁路机车是个庞大的家族 xff0c 高铁只是这个大家庭的一个新成员 xff0c 如果要连篇累牍赘述其他车辆 xff0c 恐怕这个答案是写不下的 xff0c 故本文针对高速铁路进行讨论一高铁
RS232通信协议详解

通信协议所谓通信协议是指通信双方的一种约定约定包括对数据格式同步方式传送速度传送步骤检纠错方式以及控制字符定义等问题做出统一规定 xff0c 通信双方必须共同遵守因此 xff0c 也叫做通信控制规程 xff0c 或称传输控制规
学习C/C++的电子书大全

2019独角兽企业重金招聘Python工程师标准 gt gt gt 在学习C 43 43 的经典书籍这篇文章中 xff0c 列出了C C 43 43 的经典书籍 xff1a C 43 43 Primer 第 5 版中文版英文版 Ef
做Android开发的你还为找工作迷茫吗？通过直观的年薪来调准你的方向

最近仍然有不少同学在找工作 xff0c 跳槽现在跳槽不是一个好时机可以看到现在的岗位明显减少了很多公司都在赶今年的项目交付 xff0c 新的项目还没有规划好 xff0c 新一轮的融资也还没有到时间很多在职的同学都在等到拿到年终奖再跳
协议栈是什么

1 协议栈是什么简介协议栈 xff0c 英语名称为Protocol stack xff0c 又称协议堆叠 xff0c 是计算机网络协议套件的一个具体的软件实现协议套件中的一个协议通常是只为一个目的而设计的 xff0c 这样可以使得设计
给linux杀杀毒吧

linux是非常先进的 xff0c 但是没有绝对的安全所以来杀杀毒吧 xff1a ClamAV是一个在命令行下查毒软件 xff0c 因为它不将杀毒作为主要功能 xff0c 默认只能查出您计算机内的病毒 xff0c 但是无法清除 xff0c
服务器编程的语言,服务器编程语言的配置与CMS系统

做过 1 服务器编程函数禁用找到 disable functions 61 该选项可以设置哪些服务器编程函数是禁止使用的服务器编程中有一些函数的风险性还是相当大的可以直接执行一些CentOS系统级脚本命令如果允许这些函数执行当服务器
Linux中断与进程切换,结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程...

64 实验环境 OS Linux cj virtual machine 5 3 0 51 generic 虚拟机 QEMU 内核版本 5 3 4 调式方法 GDB PS xff1a 调试环境安装请看上一篇博客汇编级理解Linux系统调用 f
【FreeRTOS】栈生长方向 portSTACK_GROWTH

FreeRTOS新建任务时 xTaskCreate 函数有这样一段注释 span class token comment 代码已简化 span span class token comment If the stack grows down
十大畅销【操作系统类】书籍，说说你看过哪本

鸟哥的Linux 私房菜深入理解计算机系统 Linux内核设计与实现 UNIX操作系统设计操作系统是控制其他程序运行 xff0c 管理系统资源并为用户提供操作界面的系统软件的集合操作系统 xff08 英语 xff1b Operatin
HP 阵列卡错误代码

POST Error Messages The RAID Controller produces diagnostic error messages at reboot Many of these Power On Self Test PO
我的2013 --那些划过生命线的人和事(大二.上)

那些划过生命线的人和事大二上又一次大清早被红马甲查赶出被窝 xff0c 让哥光着屁股就跑到隔壁宿舍去了 xff0c 真心恨死他们这是一篇最早写于 2013 11 26 日的日志 xff0c 通过后来不断地增删改 xff0c 来总结
git提交到一半关闭时

一 xff1a 出现问题最近写东西 xff0c 在提交代码时 xff0c 突然出现一大推文件忘记加 gitignore文件了 xff0c 导致所有的安装依赖也都上传了所以 xff0c 点击了关闭按钮 xff0c 当下一次提交时 xff
实录分享 | IBM马达：Kubernetes/Swarm on Mesos

4月17日 xff0c Mesos爱好者在北京P2联合创业办公社迎来了第四次Mesos User Group约会 xff0c 下面是来自IBM马达的分享实录作者介绍 xff1a 马达 xff0c IBM 高级软件工程师 xff0c Kub

实录分享 | IBM马达：Kubernetes/Swarm on Mesos

实录分享 | IBM马达：Kubernetes/Swarm on Mesos 的相关文章

随机推荐

热门标签