为 Flume-ng 编写自定义 HTTPSource 处理程序

2024-05-06

是否有任何资源可以帮助我为 Flume-ng 的 HTTPSource 编写自定义处理程序。我阅读了文档，其中有一个 Json 示例处理程序，但我想知道是否有人需要编写一个处理程序来从 XML 消息正文创建 Flume 事件。 HttpSource 现在在 Flume-ng 1.3.1 中可用，但我们需要处理程序来解释我们的数据。

Thanks.

你看过吗JSONHandler 源码 https://git-wip-us.apache.org/repos/asf?p=flume.git;a=blob;f=flume-ng-core/src/main/java/org/apache/flume/source/http/JSONHandler.java;h=197f66a827058af2a4e5d76c1dbfb82a3504c683;hb=HEAD？ XMLHandler 的唯一区别是使用一些 XML 反序列化器而不是 Gson。

你只需要转换类似的东西：

<dataList>
  <data>
     ...
  </data>
  <data>
     ...
  </data>      
</dataList>

进入列表简单事件> （或者引入您自己的 HTTPEvent，就像 Flume 开发人员所做的那样JSON事件 https://git-wip-us.apache.org/repos/asf?p=flume.git;a=blob;f=flume-ng-sdk/src/main/java/org/apache/flume/event/JSONEvent.java;h=5c6c0d40702c5b2502a528cf1827066646234a76;hb=HEAD，如果您需要处理不同的编码）。这些事件的主体将包含您的<data>..</data>块为字符串的字节表示 http://docs.oracle.com/javase/6/docs/api/java/lang/String.html#getBytes%28java.lang.String%29.

我不建议在 Flume 中实现解析这些事件的任何额外业务逻辑，因为业务规则往往会经常变化，而 Flume 作为基础设施软件应该是稳定的。

最后，将代码打包到 jar 中，将该 jar 放入 Flume 的 lib 目录中（对于 Cloudera 的 rpm 发行版，为 /usr/lib/flume-ng/lib ），在 Flume.conf 中将 HTTPSource 的“handler”属性指定为“com. vicky.flume.source.http.XMLHandler”（或类似的东西），重新启动代理即可。

希望这可以帮助。将很高兴回答您的问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

flume

为 Flume-ng 编写自定义 HTTPSource 处理程序的相关文章

记flume部署过程中遇到的问题以及解决方法（持续更新）

项目需求是将线上服务器生成的日志信息实时导入kafka xff0c 采用agent和collector分层传输 xff0c app的数据通过thrift传给agent xff0c agent通过avro sink将数据发给collector
Flume基础知识(个人总结)

声明 1 本文为我的个人复习总结并非那种从零基础开始普及知识内容详细全面言辞官方的文章 2 由于是个人总结所以用最精简的话语来写文章 3 若有错误不当之处请指出概述 Flume用于离线日志的采集与传输 Agent 单台机器a1
Flume EmbeddedAgent

flume flume 二次开发对EmbeddedAgent的简易改造动态控制agent 实现启动关闭等功能模块结构如下所示 flume parent github地址 1 用途 1 1 本地调试对flume不是特别熟悉的开发者
几十条业务线日志系统如何收集处理？

在互联网迅猛发展的今天各大厂发挥十八般武艺的收集用户的各种信息甚至包括点击的位置我们也经常发现自己刚搜完一个东西再打开网页时每个小广告都会出现与之相关联的商品或信息在感叹智能的同时不惊想什么时候泄露的行踪许多公司的业务平台每天
Flume系统搭建和使用的一些经验总结-搭建篇

对于很多公司来说日志的收集和集中管理是一个必然要经历的阶段我们公司在经历了一拖再拖之后终于不得不开始搭建日志收集系统了对于日志收集系统我们的首选就是Flume 为何这么坚决呢难道没有其他工具能做个这个事情么当然有不过考虑到
flume采集log4j日志到kafka

简单测试项目 1 新建Java项目结构如下测试类FlumeTest代码如下 package com demo flume import org apache log4j Logger public class FlumeTest priv
Flume 数据流监控——Ganglia的安装与部署

1 Ganglia的安装 1 安装 dhttpd 服务与 php yasin hadoop102 flume sudo yum y install httpd php 2 安装其他依赖 atguigu hadoop102 flume sud
自定义flume拦截器-实现了多种功能

1 自定义拦截器实现说明 1 实现interceptor接口并实现其方法接口完全限定名为 org apache flume interceptor Interceptor 2 自定义拦截器内部添加静态内部类实现Builder接口并实
大数据组件-Flume集群环境的启动与验证

大数据学习记录篇持续更新中个人主页 beixi 本文章收录于专栏点击传送大数据学习持续更新中感谢各位前辈朋友们支持学习上一篇文章写到了Flume集群环境的安装这篇文章接着上篇文章延伸Flume集群环境的启动与验证如果Flu
flume实验

1 上传flume ng 1 5 0 cdh5 3 6 tar gz 至 opt modules cdh 并解压 2 编辑 conf flume env sh export JAVA HOME usr java jdk1 7 0 79 3
Flume 学习

开始启动flume的学习 todo
Flume-ng 拖尾文件

我试图了解如何使用 Flume ng 尾部文件以便可以将数据推送到 HDFS 中在第一个实例中我设置了一个简单的conf文件 tail1 sources source1 tail1 sinks sink1 tail1 channels
Flume HDFS Sink 在 HDFS 上生成大量小文件

我有一个使用 Flume 向 HDFS 发送 log4j 消息的玩具设置我无法配置 hdfs 接收器以避免出现许多小文件我以为我可以配置 hdfs 接收器在每次文件大小达到 10mb 时创建一个新文件但它仍然创建大约 1 5KB 的文
在接收器发生故障后，如何强制 Flume-NG 处理积压的事件？

我正在尝试设置 Flume NG 从一组服务器主要运行 Tomcat 实例和 Apache Httpd 收集各种日志并将它们转储到 5 节点 Hadoop 集群上的 HDFS 中设置如下所示每个应用程序服务器将相关日志跟踪到一个执行
Flume - 整个文件可以被视为 Flume 中的一个事件吗？

我有一个用例需要将目录中的文件提取到 HDFS 中作为 POC 我在 Flume 中使用了简单的目录假脱机其中我指定了源接收器和通道并且它工作得很好缺点是我必须为进入不同文件夹的多种文件类型维护多个目录以便更好地控制文件大小和
由于 JAR 冲突，无法运行 Flume

我已经手动安装了 Flume 和 Hadoop 我的意思是不是 CDH 并且我正在尝试运行 twitterexample https github com cloudera cdh twitter example来自Cloudera In
使用具有正斜杠的密钥连接到 s3 接收器时出现无效主机名错误

我有一个forward slash在 aws 密钥中当我尝试连接到 s3 接收器时 Caused by java lang IllegalArgumentException Invalid hostname in URI s3 xxxx
运行 fatjar 时无法加载 log4j2

我正在开发一个使用 log4j2 日志记录的项目在 intellij 中开发时一切正常并且日志记录按预期完成 log4j2 xml 通过在启动时通过 intellij 设置传递给 jvm 的 java 属性进行链接但是一旦我尝试运行
并行读取 Flume spoolDir

由于我不允许在产品服务器上设置 Flume 因此我必须下载日志将它们放入 Flume spoolDir 中并有一个接收器从通道中使用并写入 Cassandra 一切正常但是由于 spoolDir 中有很多日志文件并且当前设置一次仅
如何有效地将数据从 Kafka 移动到 Impala 表？

以下是当前流程的步骤 Flafka http blog cloudera com blog 2014 11 flafka apache flume meets apache kafka for event processing 将日志写入

随机推荐

如何在 Java Swing 中创建右键单击上下文菜单？

我目前正在通过实例化一个新的来创建右键单击上下文菜单JMenu右键单击并将其位置设置为鼠标的位置有更好的方法吗您可能正在手动调用setVisible true 在菜单上这可能会导致菜单中出现一些令人讨厌的错误行为 The show C
如何在 R 和 RStudio 中构建 pdf 小插图

我是编写 R 包的新手我正在尝试学习如何为我的包裹制作小插图我创建了一个小插图文件夹其中包含文件 getting started Rmd title WaterML Tutorial author Jiri Kadlec date r
从 IEnumerable 到 MyCollection 的隐式转换

我正在尝试创建一个隐式转换它允许我使用 LINQ 结果直接返回MyCollection public class MyCollection ICollection
没有共同的参考文献，也没有指定；什么也不做

我有一个本地 git 项目我想将其添加到 gitolite 中显然这很难所以我放弃了这个想法我创建了一个新的 gitolite 存储库将其添加到 gitolite admin conf gitolite conf 并提交并推送更改
是否可以将 Mozilla Persona (BrowserID) 与移动应用程序一起使用？

是否有可能easily use Mozilla 角色 http www mozilla org en US persona 浏览器ID https developer mozilla org en BrowserID Why Browser
pyarrow 表到 PyObject* 通过 pybind11

include
使用 MKPolyline 在两个位置之间绘制路径

I am trying to show route between two locations with the help of this http spitzkoff com craig p 136 tutorial They have
Neo4j 在 Cypher 查询运行中仅使用一个核心

当我在 UI 中运行 Cypher 查询时服务器中只有一个核心正在运行查询会卡住或响应非常慢我使用 Neo4j 3 0 7 社区有人知道我可以使用所有核心进行哪些调整吗单个 Cypher 查询仅限于单个线程看到这个tweet h
如果我被冒充，为什么 Win32 API 函数 CredEnumerate() 会返回 ERROR_NOT_FOUND？

我编写了一些示例代码当我在普通用户帐户的上下文中从 Windows 命令提示符调用这些代码时会使用 CredEnumerate 转储所有用户保存的凭据但是我真的希望能够从 SYSTEM 用户上下文执行此操作因此我从 SYSTEM
Android 创建类似 iphone 的渐变

我需要在我的 Android 应用程序中创建类似黑色 iphone 的渐变请查看下图中顶部的黑色渐变怎么做谢谢也许是这样的
python http 客户端卡在 100 continue

我在 python 中有一个简单的 http 服务器它使用 100 continue 实现 PUT class TestHandler SimpleHTTPRequestHandler def do PUT self length int
使用 Adobe PhoneGap + Angular2 时不显示图像（图片和 src）

我使用 cli 创建了一个全新的项目我尝试添加一些图像标签每个标签都有不同类型的来源本地图片网络图片 https来源图片在浏览器上这可以很好地呈现所有内容但是当使用 Adob e PhoneGap 通过 PhoneGap 桌面
单元测试 python 代码，其中 configparser 从配置文件中读取

我是 python 单元测试的新手我学习并进行了示例单元测试其中方法接受输入并返回输出但对于下面提到的代码我有一些疑问如何在unittest中模拟init方法的configparser 路径 config program cfg
GCP 日志浏览器显示日志记录的错误严重级别

我正在 GKE 中运行 java 应用程序并在日志资源管理器中监视日志 Java 应用程序正在将日志写入stdout据我了解 GKE 代理解析它并将其发送到日志资源管理器我发现日志浏览器显示WARN and ERROR具有严重性的消息IN
JavaScript接口注入漏洞修复

我收到了来自 Google Play 管理中心的警告提示我这一页 https support google com faqs answer 9095419因为我在我的应用程序中使用了 JavaScript 接口并建议两个选项来解决该问题
是否可以让 SQL Server 将排序规则转换为 UTF-8 / UTF-16

在我正在处理的一个项目中我的数据存储在 SQL Server 中并具有排序规则Danish Norwegian CI AS 数据通过 FreeTDS 和 ODBC 输出到将数据作为 UTF 8 处理的 python 一些字符如和编
如何使用Python将RGB565字节数组转换为RGB888字节数组？

根据我的问题RGB888 转 RGB565 https stackoverflow com questions 61519934 how can i use opencv python to convert rgb888 to rgb565
如何设置主窗口的位置和大小（以编程方式）？

我正在使用 OS X 的最新默认项目 10 11 Xcode 7 0 它使用故事板层次结构如下 Window Controller gt View Controller 我想设置窗口的初始位置和框架大小显然用户可以更改它但我希望它以一
jpackage 创建一个挂起的安装程序

我正在尝试使用jpackage为我的 Java 应用程序创建安装程序我上线了使用 OpenJDK 15 0 1 的 Windows 10 我应该能够使用构建安装程序 jpackage input C MyApp main jar MyA
为 Flume-ng 编写自定义 HTTPSource 处理程序

是否有任何资源可以帮助我为 Flume ng 的 HTTPSource 编写自定义处理程序我阅读了文档其中有一个 Json 示例处理程序但我想知道是否有人需要编写一个处理程序来从 XML 消息正文创建 Flume 事件 HttpSou

为 Flume-ng 编写自定义 HTTPSource 处理程序

为 Flume-ng 编写自定义 HTTPSource 处理程序 的相关文章

随机推荐

热门标签

为 Flume-ng 编写自定义 HTTPSource 处理程序的相关文章