Spark JDBC 仅返回带有列名的数据帧

2024-05-03

我正在尝试使用 Spark JDBC 连接到 HiveTable，代码如下：

val df = spark.read.format("jdbc").
  option("driver", "org.apache.hive.jdbc.HiveDriver").
  option("user","hive").
  option("password", "").
  option("url", jdbcUrl).
  option("dbTable", tableName).load()

df.show()

但我得到的返回只是一个带有修改后的列名称的空数据框，如下所示：

--------------|---------------|
tableName.uuid|tableName.name |
--------------|---------------|

我尝试以多种方式读取数据框，但结果总是相同。我正在使用 JDBC Hive 驱动程序，并且此 HiveTable 位于 EMR 集群中。该代码也在同一个集群中运行。任何帮助将不胜感激。谢谢你们。

请在选项中设置 fetchsize 它应该起作用。

Dataset<Row> referenceData
            = sparkSession.read()
            .option("fetchsize", "100")
            .format("jdbc")
            .option("url", jdbc.getJdbcURL())
            .option("user", "")
            .option("password", "")
            .option("dbtable", hiveTableName).load();

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

JDBC

hive

Spark JDBC 仅返回带有列名的数据帧的相关文章

逆变方法参数类型

wiki 逆变方法参数类型 https en wikipedia org wiki Covariance and contravariance 28computer science 29 Contravariant method argum
Scala：具有复杂结构的树插入尾递归

我正在 scala 中创建自定义对象树并且我的插入方法引发堆栈溢出因为它不是尾递归但是我不太清楚如何使其尾递归我见过使用累加器变量的相关示例但它们要么是只能相乘和覆盖的整数之类的东西要么是我在适应树时遇到困难的列表这是我
了解 Scala 中的中缀方法调用和缺点运算符(::)

我对 Scala 编程语言相当陌生当我遵循以下网站的讲义时我正在尝试一些萦绕在我脑海中的东西 here http horstmann com sjsu cs152 04 closures1 html 我想我无法真正理解 cons 运算符
插入现有表时出现异常 ORA-00942: 表或视图不存在

当尝试将一批行插入现有表时我遇到了异常 ORA 00942 表或视图不存在我可以确认该表存在于数据库中并且我可以使用 oracle 将数据插入到该表中 sql 开发人员但是当我尝试在java中使用preparedstatement插
使用原始类型模拟案例类

考虑以下类型结构 trait HasId T def id T case class Entity id Long extends HasId Long 比方说我们想在一些测试中模拟实体类 val entityMock mock Enti
使用 scala 从 Spark 中的数组数组中的结构中提取值

我正在使用 scala 将 json 数据读入 Spark 数据帧架构如下 root metadata array nullable true element struct containsNull true playerId strin
对多列应用窗口函数

我想执行窗口函数具体为移动平均值但针对数据帧的所有列我可以这样做 from pyspark sql import SparkSession functions as func df df select func avg df col
使用 Spray-json 解析简单数组

我正在尝试但失败了了解 Spray json 如何将 json feed 转换为对象如果我有一个简单的 key gt value json feed 那么它似乎可以正常工作但是我想要读取的数据出现在如下列表中 name John a
不支持的身份验证令牌，仅当禁用身份验证时才允许 schema='none'：{ schema='none' } - Neo4j 身份验证错误

我正在尝试使用 neo4j spark connector 从 Spark 连接到 Neo4j 当我尝试连接到 Neo4j 时遇到身份验证问题org neo4j driver v1 exceptions AuthenticationExce
Spark 结构化流中具有不同计数的聚合抛出错误

我正在尝试在 Spark 结构化流中获取 Parentgroup childgroup 和 MountingType 组的唯一 id 代码下面的代码抛出错误 withWatermark timestamp 1 minutes val ag
PySpark Yarn 应用程序在 groupBy 上失败

我正在尝试在 Yarn 模式下运行一个处理大量数据的作业 2TB 从谷歌云存储读取管道可以总结如下 sc textFile gs path json map lambda row json loads row map toKvPair g
将 SQL 数据中的一行映射到 Java 对象

我有一个 Java 类其实例字段以及匹配的 setter 方法与 SQL 数据库表的列名相匹配我想优雅地从表中获取一行到 ResultSet 中并将其映射到此类的实例例如我有一个 Student 类其中包含实例字段 FNA
Scala 模式匹配变量绑定

为什么提取器返回时不能以样式绑定变量Option
fetchsize和batchsize对Spark的影响

我想通过以下方式控制 RDB 的读写速度Spark直接但标题已经透露的相关参数似乎不起作用我可以得出这样的结论吗fetchsize and batchsize我的测试方法不起作用或者它们确实会影响阅读和写作方面因为测量结果基于规模是
使用spark phoenix从表中读取rdd分区号为1

当我运行我的火花代码时 val sqlContext spark sqlContext val noact table primaryDataProcessor getTableData sqlContext zookeeper table
Spark：Shuffle Write、Shuffle 溢出（内存）、Shuffle 溢出（磁盘）之间的区别？

我有以下 Spark 工作试图将所有内容保留在内存中 val myOutRDD myInRDD flatMap fp gt val tuple2List ListBuffer String myClass ListBuffer tuple
类型级编程有哪些示例？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我不明白类型级编程是什么意思也无法使用Google找到合适的解释有人可以提供一个演示类型级编程的示例吗范式的解释和或定义将
Scala 特性：val/def 和 require

下面的代码抛出IllegalArgumentException trait T val x Long require x gt 0 object T extends App val y new T val x 42L 而以下情况则不然 tr
如何使用 SparkR 1.6.0 写入 JDBC 源？

使用 SparkR 1 6 0 我可以使用以下代码从 JDBC 源读取数据 jdbc url lt jdbc mysql localhost 3306 dashboard user
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus

随机推荐

基于 Netsuite 令牌的 API 调用中的身份验证不明确

我正在尝试使用基于令牌的身份验证对 Netsuite API 进行 SOAP 调用我有一个从 WDSL 生成的 C 客户端它正在发送以下请求已替换机密
JQuery 文件上传：在 data.submit() 上发送两个请求

我正在尝试使用在我的应用程序中上传视频回形针 and jquery 文件上传 rails 我跟着使用回形针和 jquery 上传文件 https 5minutenpause com blog 2013 09 04 multiple file
Spark scala - 按数组列分组[重复]

这个问题在这里已经有答案了我对 Spark Scala 很陌生感谢你的帮助我有一个数据框 val df Seq a a1 Array x1 x2 a b1 Array x1 a c1 Array x2 c c3 Array x2 a
获得列表并集的最快方法 - Python

有一个 C 比较可以从列表列表中获取列表的并集找到集合并集的最快方法 https stackoverflow com questions 11362002 the fastest way to find union of sets 还有其
当我启动虚拟机时“VT-x 不可用”[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我使用 VMWare 软件创建了一个虚拟机但在启动虚拟机时出现错误它说 VT x 不可用 00 00 03 916 NAT zone nm mbu
iFrame 应用程序。权限请求？

我想在用户首次单击我的 iFrame Facebook 应用程序时请求权限问题是我见过的例子迫使用户单击按钮来加载http www facebook com authorize php http www facebook com auth
Android：加速度传感器中的z值范围在不同设备上不同

我想检测设备是否面朝上不是成角度而是平放在地面上在某些面朝上的设备上 z 值将返回 9 10 之间的值大多数设备然而在 Nexus 7 上对于面朝上 z 值将返回 6 8 之间的值我的代码是 if z value gt 9
Android 工具栏：横向模式下的小标题文本

我正在 Android 上测试新的 Toolbar 和 AppCompat 主题但遇到了问题我的工具栏标题文本在纵向模式下看起来是正常大小的但在横向模式下它变得相当小尽管我没有在代码中执行任何操作来更改标题的文本大小以下是屏幕截图
MongoDB 在转换回 Java 对象时出现“NumberLong/$numberLong”问题

我有一个 json 类似于 Header name TestData contactNumber 8019071740 如果我将其插入到 mongoDB 中它将类似于 id ObjectId 58b7e55097989619e4ddb0b
使用 Chrome TTS 的 SSML

我试图通过强调等方式让 TTS 句子更加清晰我正在使用Chrome TTS API http developer chrome com extensions tts html 这表明它接受SSML 格式的文档 http www w3 or
Java 8 Spliterator 中使用的奇怪循环[重复]

这个问题在这里已经有答案了有谁知道为什么java util Spliterator当循环体为空时实现使用 do while 而不是 while 循环例如实施forEachRemaining is default void forEa
轻量级 Windows 应用程序的最佳开源示例是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Requests/aiohttp：关闭响应对象

我对是否需要感到有点困惑 close 两者中的响应对象requests and aiohttp 请注意这是一个单独的实例方法而不是session close 我说的是响应对象本身 Does Response requests or Cl
MySQL 相当于 ORACLES 的rank()

Oracle 有 2 个函数 rank 和dense rank 我发现它们对于某些应用程序非常有用我现在正在 mysql 中做一些事情想知道他们是否有与这些相同的东西没有什么直接等效的但你可以用一些不是非常有效的自连接来伪造它
模板基类 typedef 和函数有更好的 C++ 语法吗？

我的代码可以在 VC9 Microsoft Visual C 2008 SP1 中正常编译但不能在 GCC 4 2 中编译在 Mac 上如果这很重要的话如果我堆积足够的限定符和关键字我可以强制它在 GCC 中工作但这似乎不对这
返回 Tkinter Treeview iid

我有一个树视图并在其中插入了一些数据如下所示 self tree insert end iid test1 text test a values data1 data2 这将在树视图的末尾添加一个条目其中包含文本 test a 以及列
如何在kafka消费组中动态添加消费者

我应该如何知道何时必须扩展消费者组中的消费者当存在快速生产者时消费者扩大规模的触发因素是什么一种直接的方法是获取消费者延迟这可以计算为提交的偏移量和开始偏移量之间的差值如果最后 n 次计算的延迟正在增加您可以扩大规模反之亦然
在 Objective-C 中选择性加载类

我有模块但没有来自两个不同的人的源代码它们都包含相同的类有没有办法有选择地从模块中加载类以便重复的类不会发生冲突是的我知道这个替代解决方案建议加载和卸载并且宁愿通过有选择地加载类并完成它来完成解决 Objective C 命
C# 如何使用反射调用字段初始值设定项？

假设我有这个 C 课程 public class MyClass int a int b new int 6 现在假设我使用反射发现了这个类并且在查看字段时我发现其中一个是数组类型即 b foreach FieldInfo fieldi
Spark JDBC 仅返回带有列名的数据帧

我正在尝试使用 Spark JDBC 连接到 HiveTable 代码如下 val df spark read format jdbc option driver org apache hive jdbc HiveDriver option

Spark JDBC 仅返回带有列名的数据帧

Spark JDBC 仅返回带有列名的数据帧 的相关文章

随机推荐

热门标签

Spark JDBC 仅返回带有列名的数据帧的相关文章