Apache Eagle:实时安全监控方案

2023-10-27

 

  2016-03-27  朱洁  hadoop技术学习

EagleeBay开源的一个分布式实时安全监控方案。通过离线训练模型集合实时流引擎监控,能立即监测出对敏感数据的访问或恶意的操作,并立即采取应对的措施。下图是Eagle的架构。



 

 

Eagle的数据行为监控方案可用于如下几类典型场景:

  1. 监控Hadoop中的数据访问流量

  2. 检测非法入侵和违反安全规则的行为

  3. 检测并防止敏感数据丢失和访问

  4. 实现基于策略的实时检测和预警

  5. 实现基于用户行为模式的异常数据行为检测

     

 

Eagle特点

  • 高实时: 我们充分理解安全监控中高度实时和快速反应的重要性,因此设计Eagle之初,我们竭尽可能地确保能在亚秒级别时间内产生告警,一旦综合多种因素确订为危险操作,立即采取措施阻止非法行为。

  • 可伸缩:eBay     Eagle 被部署在多个大型Hadoop集群上,这些集群拥有数百PB的数据,每天有8亿以上的数据访问时间,因此Eagle必须具有处理海量实时数据的高度可伸缩能力。

  • 简单易用:可用性也是Eagle产品的核心设计原则之一。通过EagleSandbox,使用者仅需数分钟便可以设置好环境并开始尝试。为了使得用户体验尽可能简单,我们内置了许多很好的例子,只需简单地点击几步鼠标,便可以轻松地完成策略地创建和添加。

  • 用户ProfileEagle 内置提供基于机器学习算法对Hadoop中用户行为习惯建立用户Profile的功能。我们提供多种默认的机器学习算法供你选择用于针对不同HDFS特征集进行建模,通过历史行为模型,Eagle可以实时地检测异常用户行为并产生预警。

     

 

Eagle框架

Eagle核心框架提供实时监控系统开发过程中所需要的大部分重要基础组件,例如:

轻量级分布式流处理框架:DAG为基础模型对通用流处理范式进行抽象,在开发期用户只需基于DSL API定义监控程序的流式处理逻辑,运行期再选择实际物理执行环境,默认支持单进程和Storm,同时也支持对于其他执行环境的扩展,比如Spark Streaming 或者 Flink等。

实时流聚合引擎:提供简单易用的实时流聚合规则定义语法,元数据驱动,动态部署,实现线性扩展的实时监控数据流聚合。

分布式Policy引擎:分布式实时预警规则执行引擎,提供类SQL的描述性规则定义语法以及机器学习自动等多种扩展,支持预警规则的动态加载和分区。

存储和查询框架:通用监控数据存储框架,可用于存储和查询日志,指标,警报,事件等多种类型数据,默认支持HBase,并针对HBase进行多种优化和扩展,比如coprocesser,二级索引以及分区等,也支持其他存储类型的扩展比如RDBMS等,并提供通用的ORM, REST API以及易用强大的类SQL查询语法。

可定制化监控报表:提供类Notebook的交互式实时可视化分析,也支持进一步选取部分图标,并定义布局保存为dashboard以供分享或者持续监控。

 

Eagle 针对不同的应用场景提供多种上层应用,例如

Eagle JPA: 实时监控Hadoop 或者 Spark等平台上的作业当前和历史执行状态,提供多维度不同粒度的性能分析,支持多种异常预警和性能警告,比如作业运行时间过长,读写过慢,数据倾斜,失败任务比率过多等,可有效在作业无法满足SLA之前提供预警和性能建议,同时结合机器学习模型,基于任务分布或指标变化等协同预测任务或者服务器节点等可能潜在的异常,并集成Remediation系统对系统进行自动修复。

Eagle DAM实时监控用户行为,以保证数据安全,支持HDFS, HIVE等不同数据类型,提供简单高效的数据流接入Plugin,支持简单规则定义语法,结合机器学习算法对用户行为建模(User Profiling),自动探测异常用户行为,可集成Dataguides等对敏感数据进行监控,也可集成Apache Ranger等对异常用户行为进行限制。

此外,Eagle 支持以AmbariPlugin等方式方便地安装和集成到现有集群中,并提供友好的用户界面进行管理。

 

Eagle是机器学习结合流计算应用的很好的案例,大家可以关注下。   

 

 
 

微信扫一扫
关注该公众号

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Apache Eagle:实时安全监控方案 的相关文章

随机推荐

  • MySQL实现删除重复数据行仅保留一行

    首先创建测试环境 创建数据库表并加入数据 接下来研究如何做到删除重读的数据行并且仅保留第一条id最小的记录 首先需要知道哪一列是重复的 所以首先筛选出重复的列 select email from user group by email ha
  • 数据库创建函数_达梦数据库创建UUID函数

    数据库创建函数 达梦数据库创建UUID函数 接触达梦数据库有一段时间了 整理了一些资料 今天分享一下达梦数据UUID自定义函数 UUID函数定义 很多数据库都有提供UUID函数 可是接触达梦数据库后 发现达梦数据库并没有UUID函数定义 不
  • C#对txt文件进行读写操作

    C 中对txt文件进行读写操作包括两种方式 一种是基于FileInfo类 调用该类的Read方法 但是该方法读出来的数据是byte格式 需要对其进行解码 将相应的字节数转换为字符 而C 中System Text引用就包含的解码的方法 相应代
  • Nginx做代理时X-Forwarded-For信息头的处理

    如今利用nginx做负载均衡的实例已经很多了 针对不同的应用场合 还有很多需要注意的地方 本文要说的就是在通过CDN 后到达nginx做负载均衡时请求头中的X Forwarded For项到底发生了什么变化 下图为简单的web架构图 先来看
  • MySQL笔记——数据库与数据表(内附例子)

    目录 创建数据库 查看数据库 查看所有数据库 查看数据库使用的字符编码 修改数据库 删除数据库 选择 打开 数据库 创建数据表 基础创建 用select查询的结果创建数据表 将表2复制给表1 修改数据表 增加列 修改列 修改字段名称 修改字
  • “字节一年,人间三年!”

    关注后回复 进群 拉你进程序员交流群 大家好 我在网上冲浪的时候看到一个问题 图片 看到这个问题的时候我就想起了在江湖上流传已久的一句话 字节一年 人间三年 然后我看到了这个问题下的一个高赞回答 分享给了我一位曾经在字节工作过接近三年时间的
  • 新系统申请软件著作权详细操作说明

    关于其他问题 请参见之前的文章 1 软件著作权申请时源程序 文档和其他文件的编写说明 本文主要对源程序 文档和其他文件的格式进行说明 2 计算机软件著作权申请表中开发运行环境 技术特点等项目的编写指南 本文主要对申请表中主要功能 技术特点
  • FPGA学习日记(七)HDMI图像数据传输

    一 实现目标 将像素数据通过HDMI传输 在显示器上显示 二 数据流传输 HDMI常采用TMDS传输 上升沿复位 方式 1 通过三个通道分别可传入8位的rgb视频信号 2位的控制信号 4位的音频信号或其他数据信号 其中行场同步信号在blue
  • 小猴coderush优秀奖

    12月20日那个周末非常忙 本来不想让妞参加学而思小猴的code rush 但我自己看了介绍视频后 发现这个竞赛系统很有意思 小猴子想尽办法吃香蕉 我特别看重了这对c 里 循环 的练习 而且整个练习的过程还是很有趣和有成就感的 所以就让妞报
  • 嵌入式系统开发与应用——基于视觉的机器人SLAM入门实践1

    嵌入式系统开发与应用 基于视觉的机器人SLAM入门实践1 一 OpenCV的安装与配置 1 下载OpenCV3 4 1并解压到ubuntu相应目录上 2 下载安装依赖库和编译工具cmake 1 更新ubuntu软件 2 安装cmake 3
  • 使用vue开发,图文页面,实现点击图片可以预览

    在某个有文字 图片 按钮等元素的页面 比如像各种APP的新闻页面 其中 实现用户点击图片可以预览图片 点击其它元素不会预览 使用 vant 的 ImagePreview 组件实现预览图片 实现效果如下图 main js 引入 ImagePr
  • 调制深度(modulation depth)

    调制深度 也叫调制度 modulation depth 指的是调制波的幅度与载波幅度的比值 常用百分数表示 即 p t A m t cos 2 pi f t 则 md peak m t A 或者 md pmax pmin pmax pmin
  • JAVA-企业微信-自建应用H5的应用配置

    用公司下的企业微信账号登录企业微信服务商后台 https open work weixin qq com 在应用管理页面 进入已创建的应用并配置应用主页 接下来 在底部的网页授权及JS SDK 配置可信域名和回调域名 这个怎么校验的 我有篇
  • defaults write 权限修复$ cd ~/Library/Containers/com.apple.mail $ ls ls: cannot open directory '.': Op

    This may be caused by permissions On Mojave Mail is blocked from apps by default In Bash you will see this by default cd
  • 尚硅谷java项目<云尚办公系统>超详细(三)角色管理前端环境搭建

    一 前端框架 1 vue element admin vue element admin是基于element ui 的一套后台管理系统集成方案 功能 https panjiachen github io vue element admin
  • 深入理解C++中的mutable关键字

    mutalbe的中文意思是 可变的 易变的 跟constant 既C 中的const 是反义词 在C 中 mutable也是为了突破const的限制而设置的 被mutable修饰的变量 将永远处于可变的状态 即使在一个const函数中 我们
  • element-ui -- 照片墙

    一 介绍 element ui提供了上传照片的组件 el upload能够给用户提供上传照片的服务 照片墙是指能够向服务器上传一组照片 二 基础使用
  • PHP基于Web的subversion用户管理系统(源代码+论文)

    本系统主要是基于Web的subversion系统的用户管理系统 在开源软件世界 并行版本系统 cvs 一直是版本控制长久以来的唯一选择 但是 和其它许多工具一样 cvs开始显露出衰老的迹象 而subversion 正是以cvs继任者的面目出
  • 华为mate10开机android,华为Mate 10双清教程

    Android手机使用一段时间后 因为一些APP产生的垃圾及部分软件之间的不兼容 会造成Android手机越用越慢 使用Android系统的华为mate10也不例外 如果你的mate10使用一段时间后 速度明显变慢了 不放将手机内的资料备份
  • Apache Eagle:实时安全监控方案

    原创 2016 03 27 朱洁 hadoop技术学习 Eagle是eBay开源的一个分布式实时安全监控方案 通过离线训练模型集合实时流引擎监控 能立即监测出对敏感数据的访问或恶意的操作 并立即采取应对的措施 下图是Eagle的架构 Eag