从 Spark 作业中调用 JDBC 到 impala/hive 并创建表

2023-11-23

我正在尝试在 scala 中编写一个 Spark 作业,该作业将打开与 Impala 的 jdbc 连接,并让我创建一个表并执行其他操作。

我该怎么做呢?任何例子都会有很大的帮助。 谢谢你!


val JDBCDriver = "com.cloudera.impala.jdbc41.Driver"
val ConnectionURL = "jdbc:impala://url.server.net:21050/default;auth=noSasl"

Class.forName(JDBCDriver).newInstance
val con = DriverManager.getConnection(ConnectionURL)
val stmt = con.createStatement()
val rs = stmt.executeQuery(query)

val resultSetList = Iterator.continually((rs.next(), rs)).takeWhile(_._1).map(r => {
    getRowFromResultSet(r._2) // (ResultSet) => (spark.sql.Row)
}).toList

sc.parallelize(resultSetList)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从 Spark 作业中调用 JDBC 到 impala/hive 并创建表 的相关文章

随机推荐