Marklogic:导入 csv 时在文档上创建多个 XML 文件。如何获取根文档 URI 路径?

2024-01-07

我是 Marklogic 的新手,我尝试将 100k 记录的 CSV 文件导入到 Marklogic,导入后,我发现它默认导入到文档数据库。另外,我发现对于每条记录,我都会看到数据库中生成的 XML 文件,其中增量编号附加到我在导入时提到的“documentUri”。例如:documentUri_1.xml。据我了解,创建多个 xml 文件是为了以分布式方式读取数据。

问题: 1. 如何获取该文档的根文档URI?哪个有多个xml文件? 问题:2. 如何将相同的 CSV 文件导入到不同的数据库?
问题:3. 当我使用 xquery 列出数据库中的所有文档时,我得到的是所有所有 xml 文件 URI 而不是 dummy.xml uri?我该如何实现这一目标?

注意:我使用以下命令进行导入:

mlcp.bat import -host localhost -port 8000 -username admin -password admin -input_file_path dummy.csv -mode local -input_file_type delimited_text -uri_id 'dummy.xml'

你能帮我解决这个问题吗?


问题1)不存在“根文档”这样的东西。每个文档都是独立的。但您可以按集合将文档分组在一起(见下文)。

问题 2) 使用-数据库 https://docs.marklogic.com/guide/mlcp/import#id_23879MLCP 选项。

问题 3)我认为您正在寻找 mlcp 选项-文件名作为集合 https://docs.marklogic.com/guide/mlcp/import#id_23879。这将允许您通过以文件命名的集合查找文档。例如,在 XQuery 中:

collection("dummy.csv")
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Marklogic:导入 csv 时在文档上创建多个 XML 文件。如何获取根文档 URI 路径? 的相关文章

  • 如何在不超时的情况下解析大型 CSV 文件?

    我正在尝试解析 50 MB 的 csv 文件 文件本身很好 但我正在尝试解决所涉及的大量超时问题 每个设置上传明智 我可以轻松上传并重新打开文件 但浏览器超时后 我收到 500 内部错误 我的猜测是我可以将文件保存到服务器上 打开它并保留我
  • BIRT 不显示 base64 编码的图像

    我想将图像包含到 BIRT 报告中 图像应由 XML 数据源 base64 编码 给出 但XML数据源不支持Blob数据类型 我找到了一个很好的答案这个 BIRT 问题 https stackoverflow com questions 2
  • Postgres - 如何在插入时自动调用 ST_SetSRID(ST_MakePoint(lng, lat), 4326)?

    我正在使用postGIS 并且我对SQL不是很熟悉 我可以成功插入到我的markers表只要我做这样的事情 伪代码 INSERT INTO markers created by title description lat lng geogr
  • Spark SQL如何读取压缩的csv文件?

    我尝试过使用apispark read csv读取带有扩展名的压缩 csv 文件bz or gzip 有效 但在源代码中我没有找到任何可以声明的选项参数codec type 即使在这个link https github com databr
  • 时间序列数据的键值存储?

    我一直在使用 SQL Server 存储数十万个对象的历史时间序列数据 每天观察大约 100 次 我发现查询 给我时间 t1 和时间 t2 之间对象 XYZ 的所有值 太慢 对于我的需要 慢超过一秒 我按时间戳和对象 ID 建立索引 我考虑
  • Elasticsearch 聚合过滤器

    因为我在谷歌上找不到任何东西 是否可以在elasticsearch中过滤聚合 我正在考虑这样的事情 获取 SOME object X gt 100 的所有对象 提前致谢 编辑 样本数据 我有以下文档结构 docKey 1 value 2 d
  • 总分配超过堆内存的 95.00%(960,285,889 字节)- pyspark 错误

    我用 python 2 7 编写了一个脚本 使用 pyspark 将 csv 转换为 parquet 和其他内容 当我在小数据上运行脚本时 它运行良好 但是当我在更大的数据 250GB 上运行脚本时 我遇到了以下错误 总分配超过堆内存的 9
  • Android - 可绘制形状样式的多种颜色和尺寸

    我试图为我的 TextView 设置圆形背景 因此我创建了如下形状样式 但我需要有多种颜色和多种尺寸 而 textSize 保持不变 所以我需要在样式中设置宽度 高度 以我的理解 图层列表 http developer android co
  • 通过 JDBC 将“daterange”字段值插入 PostgreSQL 表

    我在 PostgreSQL 9 3 有一个表日期范围 http www postgresql org docs 9 3 static rangetypes html字段类型 我可以像使用 JDBC 的字符串一样选择此字段 但无法将其插入表中
  • Linq for xml 解析返回 null 元素

    我的 xml 文件如下所示
  • 如何在 Golang 中将 []byte XML 转换为 JSON 输出

    有没有办法在 Golang 中将 XML byte 转换为 JSON 输出 我有以下功能body is byte但我想在一些操作之后将此 XML 响应转换为 JSON 我试过了Unmarshal in xml打包没有成功 POST func
  • 在c中使用xslt创建xml文件

    我有 5 个不同的键 值对 并且我知道我的 xml 文件应该是什么样子 我怎样才能用它创建一个 xml 文件 1 我总是可以做 printf 不太好 2 我可以使用 xslt 样式表 xsl 文件 来执行此操作吗 而且 我还希望能够进行我刚
  • 使用 silverlight 4 和 c# 创建 CSV 下载

    我正在努力寻找示例或代码 以便能够在 silverlight 中创建 CSV 或文本文件作为可下载链接 我已经在 ASP net 中完成了此操作 但无法找到使用 Silverlight 的方法 我在旋转轮子吗 或者我应该创建一个 ASP 页
  • 如何使用lxml和python更新xml文件?

  • PHP 中的 MongoDB - 如何将项目插入集合中的数组中?

    这必须很容易 但我似乎无法弄清楚 假设我有一个集合users这是集合中的第一项 id ObjectId 4d8653c027d02a6437bc89ca name Oscar Godson email email protected cdn
  • 连接两个表的查询的 SQL Server“FOR XML”输出

    我是 SQL Server 中 FOR XML 功能的新手 我正在使用 SQL Server 2012 我有两个表 Word 和 Word Expansion 样本数据 表 字 WordOID Word 1 PIPE 2 WIRE 表 Wo
  • Scrapy - 持续从数据库中获取要爬取的url

    我想不断地从数据库中获取要爬行的网址 到目前为止 我成功地从基地获取了 url 但我希望我的蜘蛛继续从该基地读取 因为该表将由另一个线程填充 我有一个管道 一旦爬行 工作 就会从表中删除 url 换句话说 我想使用我的数据库作为队列 我尝试
  • 如何解析无效(错误/格式不正确)的 XML?

    目前 我正在开发一项功能 该功能涉及解析从其他产品收到的 XML 我决定针对一些实际的客户数据运行一些测试 看起来其他产品允许用户输入应被视为无效的输入 无论如何 我仍然必须尝试找出解析它的方法 我们正在使用javax xml parser
  • Mysql 中 UNION 子句的替代方案

    我有两张桌子 表 a 表 b table a ID 1 2 3 4 5 7 table b ID 2 3 4 5 6 我必须得到这样的输出而无需UNION命令 ID 1 2 3 4 5 6 7 注意 我有一个联合解决方案 select fr
  • 按钮 - 单击时更改背景颜色

    我的活动中有 8 个按钮 我正在寻找的是 按钮具有默认背景 单击按钮时 背景颜色应更改为其他颜色 这部分非常简单 但是 当我单击任何其他按钮时 第一个按钮的背景颜色应该变回默认颜色 我知道这将使用 选择器状态 来完成 但我不太确定如何实现它

随机推荐

  • 是否可以对联合类型进行更严格的类型检查?

    按照规范第 3 4 节 http www typescriptlang org Content TypeScript 20Language 20Specification pdf 这不会编译 let s string number s fa
  • 读取 PSV(管道分隔)文件或字符串

    我刚刚收到一个数据文件 其扩展名为 psv 经过一番研究后 我不知道如何打开它R 我们可以使用 read table 来读取 psv 文件 read table myfile psv sep header FALSE stringsAsFa
  • Safari 截断按钮内元素的框阴影

    我有一个按钮 里面有一个接收 box shadow 的元素 button padding 0 border 0 margin 0 overflow visible webkit appearance none background whit
  • 无法在 F# 中使用受保护的事件

    假设我们有以下 C 类 public class Class1 protected event EventHandler ProtectedEvent protected virtual void OverrideMe 在F 中使用Prot
  • WCF 禁用反序列化顺序敏感性

    在非 NET 客户端和 NET WCF 服务之间传递序列化对象时 我经常遇到问题 当 WCF 反序列化对象时 它严格依赖于属性的顺序 也就是说 如果我将我的班级定义为 public class Foo public int ID get s
  • GCC 中的元组模板

    我首先在 VS2010 中使用 Microsoft VC 开始使用 C 我最近找到了一些工作 但我一直在使用 RHEL 5 和 GCC 我的代码主要是本机 C 但我注意到一件事 GCC 似乎不承认
  • 为什么这个 CAKeyFrameAnimation 会以零不透明度停止?

    我有这个代码 在值数组的末尾 您可以看到我提供了 0 5 的不透明度 但由于某种原因 当动画停止时 它会再次闪烁 然后使视图完全透明 那里出了什么问题 CALayer layer self layer CAKeyframeAnimation
  • 是否可以在 CSS3 或 Javascript 中将字母映射到圆柱体或球体?

    我看到一张在 CSS3 中映射到圆柱体的图片 我想知道这是否可以用文本来实现 更好的方法是将文本映射到球体 如果纯 CSS 无法实现 Javascript 可能是一种选择 它必须在所有主要浏览器上运行 包括那些没有 webkit 的浏览器
  • SVG 缩放文本以适合容器

    这可能是一个非常简单的问题 但如何让 SVG 中的文本拉伸以适合其容器 我不在乎它是否因拉得太长或太高而看起来很丑 但它需要适合它的容器并且尽可能大 Thanks 如果您真的不关心文本变得难看 以下是如何将未知长度的文本调整为已知宽度的方法
  • 尝试使用 gdata API 将视频上传到 YouTube 时出现“找不到类”错误

    我目前正在编写 Android 应用程序的一部分 以使用 Google Data API 将视频上传到 YouTube 我有来自 Google Code 的最新版本的 API 我基本上复制了他们的示例开发者指南 http code goog
  • 如何在 JOptionPane 上添加文本区域

    目前我有一个JOptionPane 单击按钮后 我正在执行以下行 JOptionPane showInputDialog this Enter your message Messages 2 它会打开一个带有文本框的弹出窗口 此文本框接受大
  • Elasticsearch、Tire 和嵌套查询/与 ActiveRecord 的关联

    我正在使用 ElasticSearch 和 Tire 来索引和搜索一些 ActiveRecord 模型 并且我一直在寻找索引和搜索关联的 正确 方法 我还没有找到最佳实践 所以我想问是否有人有一种他们认为非常有效的方法 作为一个示例设置 这
  • Android OpenGL ES 生成纹理的圆形网格

    我是 Android 上的 OpenGL ES 新手 我有一个关于为代表圆形的纹理生成网格的问题 左边是所需的网格 右边是我的纹理 如何生成左侧的网格 然后按以下方式渲染 triangle1 Centerpoint WhitePoint n
  • 使用 ggplot2 的发散堆积条形图:图例中的因子排序问题

    我正在尝试绘制李克特量表数据发散堆积条形图 with ggplot2 我见过很多解决方案 其中我发现最好的一个是这个多方面的解决方案 https stackoverflow com questions 51201852 faceted ho
  • 使用单个接口注册多个实现

    有没有一种方法可以使用 simple injector 注册由多个具体类实现的单个接口 而不使用模板接口 说我们有 2 节课MyClass1 and Myclass2这两个类都在实现IInterface1 现在使用 simple injec
  • 在 Pandas Dataframe 中查找空或 NaN 条目

    我正在尝试搜索 Pandas Dataframe 以查找其中缺少条目或 NaN 条目的位置 这是我正在使用的数据框 cl id a c d e A1 A2 A3 0 1 0 419279 0 843832 0 530827 text76 1
  • 建立空链接的不同方法?

    除了这些方法之外 还有没有办法制作空链接呢 a href Example a a href Example a a href Example a 我不介意使页面跳转到顶部的某些内容 但我不希望它更改地址栏中的 URL 理想的链接应尽可能类似
  • Android adb 在列表设备和其他命令中挂起

    当我尝试从终端运行 adb 命令时 尤其是adb devices adb kill server and adb start server它挂起 我需要输入CTRL C退出进程 无法将 APK 部署到物理或虚拟设备 有东西阻止了 adb 进
  • 网站在移动浏览器中看起来不正确

    我现在正在构建一个网站 当我在移动浏览器上加载该网站时 一些元素被推到左侧 在右侧留下难看的空白 我的猜测是 大的米色矩形 直接位于导航下方 的宽度大于其下方的包装纸 注意 矩形不包含在包装器内 但是 我尝试了几种不同的方法 但仍然出现右侧
  • Marklogic:导入 csv 时在文档上创建多个 XML 文件。如何获取根文档 URI 路径?

    我是 Marklogic 的新手 我尝试将 100k 记录的 CSV 文件导入到 Marklogic 导入后 我发现它默认导入到文档数据库 另外 我发现对于每条记录 我都会看到数据库中生成的 XML 文件 其中增量编号附加到我在导入时提到的