我想知道在 Talend 中解决以下问题的最佳策略是什么:
- 我需要从存储在名称类似于 (SAMPLE1.DAT、SAMPLE2.DAT、...、SAMPLEX.DAT) 的目录中的一组分隔文件中加载数据
- 目标将是 MySQL 数据库中的一个表
- 我必须立即加载所有数据,因为在此任务之后我需要处理同一个表中的所有记录
我有点困惑,因为我不知道在 Talend 中是否可能。我看到了 tFileInputDelimited 组件,但没有找到解决它的方法。
Thanks
要从一个目录读取多个文件,您可以使用 tFileList 组件。它允许您指定目录和文件名模式。目录中与该模式匹配的所有文件都将被一个接一个地处理。
您需要使用从 tFileList 组件到那些描述您要对每个文件执行的操作的组件的“迭代”链接。在您的情况下,您将从 tFileInputDelimited 组件开始(读取文件)并将其主要输出连接到 tMysqlOutput 组件。默认情况下,MySQL 组件只会将数据附加到现有表中,这样您就可以获得所需的结果。
在 tFileInputDelimited 组件中,您不会使用固定文件名,而是使用 tFileList 组件为每次迭代设置的变量文件名(可以说是循环变量)。该循环变量的名称可以在工作室的“大纲”视图中看到,通常位于左下角。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)