在apachecamel中处理大型压缩文件

2024-05-16

我正在尝试获取一个文件.zip从 ftp 服务器压缩并尝试将其存储在 S3 中.gzip使用骆驼压缩。以下是我目前的路线。

from("sftp://username@host/file_path/?password=<password>&noop=true&streamDownload=true")
    .routeId("route_id")
    .setExchangePattern(ExchangePattern.InOut)
    .unmarshal().zipFile()
    .marshal().gzip()
    .to("aws-s3://s3_bucket_name?amazonS3Client=#client");

这对于较小的文件来说效果很好。但我的文件压缩后大小约为 700 MB。对于那个大小的文件我得到OutOfMemoryError for Java heap space
我知道骆驼中有一个流媒体选项（.split(body().tokenize("\n")).streaming()）但我不确定是否可以在流式传输时解组和编组。（我看到类似的解决方案here https://stackoverflow.com/questions/8122748/best-strategy-for-processing-large-csv-files-in-apache-camel但在这种情况下，源文件是纯文本/csv）。
问题的第二部分是将文件流式传输回 S3。我知道多部分上传选项中骆驼AWS http://camel.apache.org/aws-s3.html组件，但似乎要求源是一个文件。我不知道如何实现这一目标。

是否可以在不使用自定义处理器中的 java 代码处理（解压缩然后 gzip 压缩）文件的情况下实现此目的？

环境：骆驼2.19.3, Java 8

Thanks

我用它解决了streamCaching()。所以我会这样做的方式是

from('xyz')
.streamCaching()
.unmarshall().gzip()
.to('abc')
.end()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachecamel

在apachecamel中处理大型压缩文件的相关文章

如何使用 autoStartup=false 启动 Camel 路线

我想使用以下命令来控制我的路线何时启动RoutePolicy 因此我将其定义为autoStartup false
是否可以使用 JavaMail 和 Apache Camel Mail (IMAP) 通过服务帐户连接 Microsoft Exchange 共享邮箱？

我们使用 Apache Camel 通过 IMAP 连接到我们的收件箱 Apache Camel Mail 组件是基于 JavaMail 构建的我们的测试服务器使用 Outlook 和 Office 365 我们使用 Outlook of
如何解决Apache Camel中的“无法创建路由route1异常”？

我对 Apache Camel 概念很陌生我尝试使用 apache Camel API 编写示例代码当我尝试运行代码时出现以下异常谁能帮我解决这个问题缺少依赖库所以我添加了这些库并解决了我的问题
Camel - 将特定参数从路由传递到通用 bean 方法

假设我有一条骆驼路线如下所示 from direct myRoute setHeader someHeader simple some header value beanRef myBean beanMethod 我有一颗豆子cannot
Camel 中的无限循环 - Rabbitmq

我有一个小型服务器路由它从queue in 获取消息并放入queue out 当我输入一条消息时queue in 服务器无限循环运行我想知道我在配置方面缺少什么这看起来是一条非常简单的路线小服务器路由
Camel SFTP - 无法将目录更改为“/”

我需要通过 SFTP 连接到服务器但收到此错误 INFO org apache camel component file remote SftpOperations connect Connected to sftp myserver c
二进制文件到 SQL 数据库 Apache Camel

我需要一些关于使用 Camel 将二进制文件从文件夹加载到 MySQL 数据库的方法的指导基本上我想将 PBX 系统中的语音日志存储到数据库中包含语音日志的目录将是远程目录我设计了一个原型但我不确定这是否真的有效它有效但我对设计
在 Camel-CXF 中将自定义 Soap-Header 设置为 pojo-message

我的 CXF 肥皂头有问题我使用合同优先开发方法建立了一个 cxf 项目我想使用 cxf 组件调用 Web 服务如下所示
使用Camel的spring-rabbitmq组件时如何自动声明交换？

我正在尝试从 Camel 3 x 迁移到 Camel 4 x 版本因此我需要从rabbitmq替换组件spring rabbitmq With rabbitmq我正在使用的组件declare https camel apache org
Camel http4 和 url 编码的密码被解释为单独的参数

我们有一个 Apache Camel 2 13 2 应用程序它使用 http4 与网络服务器通信并使用 NTLM 进行身份验证端点定义为伪 to http4 thegreat server com uri authUsername
替换 Camel v2.16.0 中已弃用的 beanRef()

我们正在从 Camel v2 13 升级到 v2 16 并发现 beanRef 已被标记为已弃用 Apache Camel 推荐的替代替代方案是什么我在 Camel v2 16 0 文档网站上找不到任何有用的东西甚至更新的示例尚不可用
Apache Camel 同时处理两个 csv 文件

我正在尝试处理两个 csv文件并将其数据保存到数据库中我使用的是 java dsl 而不是 spring 为了更好地解释这个场景我正在读两本 csv文件并处理它们以将数据上传到 sql 数据库中我为此执行的步骤是在 servlet
Camel Restlet maxThreads 组件选项

我有个问题 apache Camel 文档指出 camel restlet 组件从 2 10 版本开始可以定义服务请求的最大线程数 http camel apache org restlet html 我该如何指定这个参数这是我制定的
如何让 Spring 连接我的 JmsComponent

我正在编写一个使用 Akka Akka Camel 和 Spring 进行配置的应用程序应用程序需要充当针对各种应用程序服务器的独立 JMS 客户端为此它需要使用 JNDI 设置 JMS 连接工厂我正在用 jBoss 测试这个我对
Akka、SQS 和 Camel 的消费者投票率

我正在做的一个项目需要从SQS读取消息我决定使用Akka来分布式处理这些消息由于 Camel 支持 SQS 并且在 Consumer 类中内置了 Akka 中使用的功能因此我认为最好以这种方式实现端点并读取消息尽管我还没有看到很多人
使用cameltestsupport进行Camel单元测试，模板始终为空

我正在用 Camel 做一个简单的单元测试我想做的就是从文件在资源下读取 JSON 内容将其发送到 Java 类进行验证这是我试图测试的路线无论我做什么模板我用来发送正文 json 始终为空这是我的代码 public cl
如何在 Apache Camel 中定义通过 ref 抛出的异常

必须在 XML 中定义的骆驼路由中抛出异常成立throwExceptionCamel 2 3 中的声明如下所示
WebSphere Camel JMS、spring、taskExecutor、haninging 线程

我正在尝试将 Camel 与 WebSphere 集成除了一件事之外它工作得很好场景如下 JMS WMQ gt 路由转换 gt BEAN 执行 JPA OpenJPA1 2 DB2 提交为了能够插入WAS事务管理器和mangaed
Mina 在 Netbeans 上工作却在 fat-jar 中失败了？

奇怪的问题如果我们创建一个 fat jar 来执行该项目而不是从 Netbeans 中它就会失败有什么线索吗这是一个简单的 apache camel 应用程序它使用 Mina 启动一条路由来接收 HL7 然后使用一个直接应答 AC
Apache Camel - 如何在动态 sftp 端点中设置私钥

使用 Java DSL 我有一个路由可以使用消息标头中设置的文件名轮询 SFTP 服务器中的文件 from direct download pollEnrich simple sftp my host 22 folder username

随机推荐

NHibernate：将 ICriteria 转换为 DetachedCriteria

任何人都知道如何将 ICriteria 转换为 DetachedCriteria 我需要使用现有的 ICriteria 作为子查询的一部分使用 Add Subqueries PropertyIn Name myDetachedCriter
Rails：named_scope、lambda 和块

我认为以下两个是等效的 named scope admin lambda company id conditions gt company id company id named scope admin lambda do company
为什么我无法更改 conda 环境的 Python 版本？

我刚刚成功发出以下命令 conda install python 3 7 2 conda update python 但是当我发出以下命令时 python V 我仍然得到 Python 2 7 10 我不明白为什么有没有办法让这个Cond
Twilio：在通话中开始/停止录音

关于此主题的两个相关问题电话会议主持人可以在通话开始后开始或停止录音吗他们可以多次执行此操作吗如果可以是否会添加到录音中覆盖录音或开始新录音如果您连续两天使用相同的会议室 ID 是否可以从第一天开始添加录音而不是创建新录音 Tw
WiFi 网络变化是否有 NSNotificationCenter 通知？

我想在我的 Cocoa 应用程序中订阅 WiFi 网络更改但我无法找到合适的事件来订阅 WiFi 网络变化是否有 NSNotificationCenter 通知据我所知我会用CoreWLAN https developer apple
如何使用Gson仅从Json反序列化某些特定字段？

我有以下 JSON 字符串 channel bvmt initValues data value instrumentIds TN0007250012 TN0007500010 instruments mnemonic ADWYA marc
用数组或向量实现多维数组

我想使用单个数组或向量实现多维数组可以像通常的多维数组一样访问它例如 a 1 2 3 我陷入困境的是如何实施操作员如果数组的维数为 1 则 a 1 应该返回位于索引 1 处的元素但是如果维数大于一怎么办对于嵌套向量例如 3 维
numpy polyfit 中使用的权重值是多少以及拟合误差是多少

我正在尝试对 numpy 中的某些数据进行线性拟合 Ex 其中 w 是该值的样本数即对于点 x 0 y 0 我只有 1 个测量值该测量值是2 2 但对于这一点 1 1 我有 2 个测量值值为3 5 x np array 0 1 2 3
jupyter 服务器 dfdata.to_clipboard 从远程到本地计算机。如何？

我有一个数据框说dfdata in a 在远程计算机上运行的 jupyter 服务器笔记本我想将远程计算机内存中的数据帧访问到本地计算机例如粘贴dfdata脱颖而出通常当笔记本服务器在本地运行时我这样做dfdata to clip
有人可以告诉我计算机编程如何工作的基础知识吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案是什么让编程语言的所有单词实际上都有作用我的意思是到底发生了什么让计算机知道所有这些词的含义如果我口头告诉我的计算机做某事它不
Android：ANT 构建失败，并显示 google-play-services-lib：“解析为没有项目的 project.properties 文件的路径”

我正在尝试使用 ANT 构建我的应用程序但在包含 google play services lib 库项目后我惨遭失败 Step 1 我在 project properties 文件中设置了对库项目的引用 android library
选择单选按钮时隐藏/显示 3 个文本框

我有 2 个单选按钮选择一个文本框时我想显示 3 个文本框并在选择其他文本框时隐藏它这是代码这是我的 2 个单选按钮
如何在 O(n) 时间内根据 Map 中的整数值相对于其他值随机选择一个键？

如果我们有一个Map
如何使用基于类的视图处理表单（通过 get 或 post）？

我正在尝试学习基于类的视图因为详细信息或列表视图并不那么复杂我有一个搜索表单我只想看看是否发送查询来显示结果这是函数代码不是我的来自 django 书籍 def search page request form SearchFo
在 Asp.Net Core 中手动创建 OData feed，在 Power BI 中使用 feed

我正在尝试手动编写一个用作 OData feed 的 Web Api 我不需要太多功能只需将实体框架中存储的数据导出到 Power BI 等应用程序的能力即可我只需要能够查看因此我计划只实现 GET 请求我目前有一个标准 Web a
R data.table fwrite 到 fread 空间分隔符并清空

我在使用 fread 以作为分隔符和散布的空白值时遇到问题例如这个 dt lt data table 1 5 1 5 1 5 make a simple table dt 3 V2 NA add a blank in the midd
将日期时间显示为 MM/dd/yyyy HH:mm 格式 C#

在数据库中日期时间以 MM dd yyyy HH mm ss 格式存储但是我想以 MM dd yyyy HH mm 格式显示日期时间我通过使用 String Format 进行了尝试 txtCampaignStartDate Tex
Android：如何在布局中放置纯色矩形？

我有一个可以很好地膨胀的relativelayout 我想在顶部添加一个跨越布局宽度的纯色矩形我尝试将以下内容放入我的 xml 中
如何对多行文本中的每一行应用填充？

我已将背景颜色应用于 span 标签也有左和右padding设置在它上面问题是 padding仅适用于左侧开始和右侧结束 span 而不是当文本换行时每行的左侧开始和右侧结束我该如何应用左和右padding to the
在apachecamel中处理大型压缩文件

我正在尝试获取一个文件 zip从 ftp 服务器压缩并尝试将其存储在 S3 中 gzip使用骆驼压缩以下是我目前的路线 from sftp username host file path password

在apachecamel中处理大型压缩文件

在apachecamel中处理大型压缩文件 的相关文章

随机推荐

热门标签

在apachecamel中处理大型压缩文件的相关文章