从 Spark 作业中调用 JDBC 到 impala/hive 并创建表

2023-11-23

我正在尝试在 scala 中编写一个 Spark 作业，该作业将打开与 Impala 的 jdbc 连接，并让我创建一个表并执行其他操作。

我该怎么做呢？任何例子都会有很大的帮助。谢谢你！

val JDBCDriver = "com.cloudera.impala.jdbc41.Driver"
val ConnectionURL = "jdbc:impala://url.server.net:21050/default;auth=noSasl"

Class.forName(JDBCDriver).newInstance
val con = DriverManager.getConnection(ConnectionURL)
val stmt = con.createStatement()
val rs = stmt.executeQuery(query)

val resultSetList = Iterator.continually((rs.next(), rs)).takeWhile(_._1).map(r => {
    getRowFromResultSet(r._2) // (ResultSet) => (spark.sql.Row)
}).toList

sc.parallelize(resultSetList)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

JDBC

apachespark

impala

从 Spark 作业中调用 JDBC 到 impala/hive 并创建表的相关文章

com.mysql.jdbc.Driver 的类未找到异常不是类路径问题

我已经为此工作了几个星期但现在我只是在原地踏步我收到运行时错误在获取连接 com mysql jdbc Driver 时在 class 中未找到类异常连接函数如下 return a MySQL connection to the
插入现有表时出现异常 ORA-00942: 表或视图不存在

当尝试将一批行插入现有表时我遇到了异常 ORA 00942 表或视图不存在我可以确认该表存在于数据库中并且我可以使用 oracle 将数据插入到该表中 sql 开发人员但是当我尝试在java中使用preparedstatement插
Scala Array.apply 有何魔力

来自 scala 2 10 4 的 array scala Array定义为 final class Array T length Int extends java io Serializable with java lang Clonea
在 jdbc 程序中使用时，通过 SQL 客户端插入表中的记录未显示

我使用 SQL 客户端和 JDBC 程序将几行插入到我的表 EMP 中使用 SQL 客户端插入的记录不会显示在 Java 的输出控制台中我正在使用 Java 8 和 oracle 11g 数据库来插入和读取数据库除了通过 SQL 客户
使用 scala 从 Spark 中的数组数组中的结构中提取值

我正在使用 scala 将 json 数据读入 Spark 数据帧架构如下 root metadata array nullable true element struct containsNull true playerId strin
Source.getLines 中的默认参数错误 (Scala 2.8.0 RC1)

假设我运行 Scala 2 8 0 RC1 以下 scala 代码应该打印出文件 c hello txt 的内容 for line lt Source fromPath c hello txt getLines println line 但
Glassfish 4 - JDBC 领域

Glassfish 4 中的密码加密算法和摘要算法有什么区别因为Password加密算法不能为空所以我使用了MD5 Encoding使用了Hex 摘要算法为空因此默认为 SHA 256 但是如果我使用 JAAS 制作一个简单的登录应
不支持的身份验证令牌，仅当禁用身份验证时才允许 schema='none'：{ schema='none' } - Neo4j 身份验证错误

我正在尝试使用 neo4j spark connector 从 Spark 连接到 Neo4j 当我尝试连接到 Neo4j 时遇到身份验证问题org neo4j driver v1 exceptions AuthenticationExce
任务和分区之间有什么关系？

我能说么 Spark任务的数量等于Spark分区的数量吗执行器运行一次执行器内部的批处理等于一个任务吗每个任务只产生一个分区 1 的重复并行度或可以同时运行的任务数量由以下公式设置 Executor实例的数量配置每个执行器的
如何在 Scala 中打印任何内容的列表？

目前我有一个打印整数的方法 def printList args List Int Unit args foreach println 我如何修改它使其足够灵活可以打印任何内容的列表您不需要专用的方法所需的功能已经在集合类中 pri
将 SQL 数据中的一行映射到 Java 对象

我有一个 Java 类其实例字段以及匹配的 setter 方法与 SQL 数据库表的列名相匹配我想优雅地从表中获取一行到 ResultSet 中并将其映射到此类的实例例如我有一个 Student 类其中包含实例字段 FNA
在 Spark 2.1.0 中启用 _metadata 文件

Spark 2 1 0 中保存空 Parquet 文件似乎已损坏因为无法再次读入它们由于模式推断错误我发现从 Spark 2 0 开始写入 parquet 文件时默认禁用写入 metadata 文件但我找不到重新启用此功能的配置设
Scala：如何在超类上实现克隆方法，并在子类中使用它？

我可能会以错误的方式处理这个问题但我想要一个像这样的对象 class MyDataStructure def myClone val clone new MyDataStructure do stuff to make clone the
Scala 模式匹配变量绑定

为什么提取器返回时不能以样式绑定变量Option
如何在Spark结构化流中指定批处理间隔？

我正在使用 Spark 结构化流并遇到问题在 StreamingContext DStreams 中我们可以定义批处理间隔如下所示 from pyspark streaming import StreamingContext ssc
缓存 Slick DBIO 操作

我正在尝试加快 SELECT FROM WHERE name 的速度Play 中的查询类型 Scala 应用程序我正在使用 Play 2 4 Scala 2 11 play slick 1 1 1 包该软件包使用Slick 3 1版本
Spark：Shuffle Write、Shuffle 溢出（内存）、Shuffle 溢出（磁盘）之间的区别？

我有以下 Spark 工作试图将所有内容保留在内存中 val myOutRDD myInRDD flatMap fp gt val tuple2List ListBuffer String myClass ListBuffer tuple
使用 scala 集合 - CanBuildFrom 麻烦

我正在尝试编写一个接受任何类型集合的方法CC 并将其映射到一个新的集合相同的集合类型但不同的元素类型我正在挣扎基本上我正在尝试实施map but 不在集合本身上问题我正在尝试实现一个带有签名的方法它看起来有点像 def map
如何获取 Kafka 偏移量以进行结构化查询以进行手动且可靠的偏移量管理？

Spark 2 2引入了Kafka的结构化流源据我了解它依赖 HDFS 检查点目录来存储偏移量并保证恰好一次消息传递但是旧码头比如https blog cloudera com blog 2017 06 offset manag
分析 sbt 构建

我的 sbt 构建需要很长时间它又大又复杂很难知道从哪里开始清理看起来 sbt 保留了很多关于构建结构的元数据包括相互依赖关系命名任务范围界定等有了所有这些元数据似乎很容易跳入并测量每个不同任务及其范围花费的时间在代码

随机推荐

你能让 TS 从被赋值的值中推断出变量的泛型类型参数吗？

正在接听这个问题解决方案是指定类型参数Map构造函数像这样 const conditions3 ReadonlyMap
JNI 可以支持类路径中的通配符扩展吗？

我有一个通过 JNI 调用 Java 的 C 二进制文件我将 CLASSPATH 设置为 somedir 以获取 somedir 中的所有 jar 当我运行二进制文件时找不到所需的类定义当我跑步时 java that class s
如何找到 int[] 的大小？ [复制]

这个问题在这里已经有答案了 I have int list 1 2 3 如何获得尺寸list 我知道对于 char 数组我们可以使用strlen array 查找尺寸或检查 0 在数组的末尾 I tried sizeof array s
了解 Spark 序列化

在 Spark 中我们如何知道哪些对象在 driver 上实例化哪些对象在 executor 上实例化以及如何确定哪些类需要实现 Serialized 序列化对象意味着将其状态转换为字节流以便字节流可以恢复为对象的副本如果 Jav
何时使用 sys.path.append 以及何时修改 %PYTHONPATH% 就足够了

所以事实证明我在 PYTHONPATH 定义中缺少一个分号但这只让我到目前为止由于某种原因我的脚本无法作为计划任务在 WinXP 上运行直到我明确地将 PYTHONPATH 中的目录添加到脚本顶部问题是我什么时候需要显式地
角度错误：如果在表单标签内使用 ngModel，则必须设置 name 属性或 [duplicate]

这个问题在这里已经有答案了关于该错误还有很多类似的问题和答案如果 ngModel 在表单标签内使用则必须设置 name 属性或者必须在 ngModelOptions 中将表单控件定义为独立解决方案是定义name消息中描述的属性
不同移动设备中的加速度计和陀螺仪精度

我想使用移动设备的传感器加速度计指南针陀螺仪这个问题已经在几个地方讨论过例如 here and here 第一步是确定哪个平台最适合实施此类系统主要的可能性是三星的 Galaxy Galaxy tab 或 iphone ipad
开放式 Java SMB 服务器实现

Java 中是否有 SMB CIFS 服务器的开放实现我能找到的唯一实现是 Alfresco 但它不是开源的一个相关的问题假设没有这样的实现我很惊讶没有一个库提供 SMB 的子集例如用于简单的文件传输我的直觉是实现一个简单的服
C/C++ 严格别名、对象生命周期和现代编译器

我对 C 严格别名规则及其可能的含义感到困惑考虑以下代码 int main int32 t a 5 float f float a f 1 0f int32 t b a Probably not well defined float g
通过自动更改所有函数和变量名称来模糊生产中的反应代码

是否有任何库可以帮助模糊生产的反应构建就像是 const MyComp gt const propa propb useMyfunc return to const xyz gt const yxz zyx zzz return 正确的选
IntelliJ（使用 gradle）：即使已安装也找不到 Kotlin 插件

我正在尝试使用 gradle 构建我的项目但似乎找不到我的 kotlin 插件即使我确实使用从磁盘安装插件添加了它这是我收到的错误无法解析配置 classpath 的所有依赖项找不到 org jetbrains kotlin
将常量值从 _layout.cshtml 传递给 Angular

好的我在 ASP Net SPA 项目的 Layout cshtml 中有一个常量变量我将传递它们以便 Angular 可以访问它们我怎样才能做到这一点例如这是我试图传递的一个值 var lenderValues Html Ac
如何使用phonegap在iOS应用程序中打开网页？

我只想在我的 iOS PhoneGap 应用程序中只有一个视图该视图将是一个网页我怎样才能用特定的网址加载这个唯一的视图我想你是通过 javascript 来做到这一点的如果是的话怎么做我不是 html javascript 脚
ASP.Net 中的数据缓存

我需要从一些参考数据中填充一些下拉框即城市列表国家列表等我需要将其填写在各种网络表格中我认为我们应该在应用程序中缓存这些数据这样我们就不会在每个表单上都访问数据库我是缓存和 ASP Net 的新手请建议我如何做到这一点我总
查找窗口失败 - 2 个 Galaxy Nexus 上同一应用程序的不同行为

我有两部 Galaxy Nexus 手机这些手机具有相同的固件版本 4 0 2 相同的内部版本号相同的内核版本当我使用 Eclipse 将同一个应用程序部署到两部手机时我看到每部手机都有不同的行为在一部手机上一切都按预期进行在
WCF InvalidOperationException：绑定实例已与侦听 URI 关联

我是 WCF 的初学者正在学习 Essential WCF 我在使用 ServiceContract NameSpace 和 Name 时遇到问题当我运行代码时我捕获了以下 InvalidOperationException 但我无法
jQuery的val()方法改变似乎并没有改变DOM

Doing someId val newValue 不改变 DOM 我可以检索这个值 someId val 但是 DOM 中的元素仍然没有 value 属性如何设置输入组件的值并更改 DOM 我在用着jQuery 1 5 1 val do
在 R dplyr 中按计数扩展列

我有一个因子列我想将每个因素分散到一列中然后通过每个 id 出现的该因素的计数来填补空白假设我们有 car lt c a b b b c c a b b b c c type lt c good regular bad good re
适合从扫描条形码 iPhone 应用程序获取产品详细信息的 api？

正在开发示例条形码扫描仪应用程序我使用 ZBar API 扫描产品中的条形码它工作得很好现在希望获得扫描条形码的产品我想从 api 获取产品的以下详细信息 Product Name Product Price Selling fe
从 Spark 作业中调用 JDBC 到 impala/hive 并创建表

我正在尝试在 scala 中编写一个 Spark 作业该作业将打开与 Impala 的 jdbc 连接并让我创建一个表并执行其他操作我该怎么做呢任何例子都会有很大的帮助谢谢你 val JDBCDriver com cloudera

从 Spark 作业中调用 JDBC 到 impala/hive 并创建表

从 Spark 作业中调用 JDBC 到 impala/hive 并创建表 的相关文章

随机推荐

热门标签

从 Spark 作业中调用 JDBC 到 impala/hive 并创建表的相关文章