通过Java JDBC连接Hive

2023-11-24

这里有一个问题从 java 连接到 Hive但我的是不同的

我的配置单元在 machine1 上运行，我需要使用在 machine2 上运行的 Java 服务器传递一些查询。据我了解，Hive 有一个 JDBC 接口，用于接收远程查询。我从这里获取了代码 -HiveServer2 客户端

我安装了文章中写的依赖项：

hive-jdbc*.jar
hive-service*.jar
libfb303-0.9.0.jar
libthrift-0.9.0.jar
log4j-1.2.16.jar
slf4j-api-1.6.1.jar
slf4j-log4j12-1.6.1.jar
commons-logging-1.0.4.jar

然而我得到了java.lang.NoClassDefFoundError编译时出错完整错误：

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/conf/Configuration
    at org.apache.hive.jdbc.HiveConnection.createBinaryTransport(HiveConnection.java:393)
    at org.apache.hive.jdbc.HiveConnection.openTransport(HiveConnection.java:187)
    at org.apache.hive.jdbc.HiveConnection.<init>(HiveConnection.java:163)
    at org.apache.hive.jdbc.HiveDriver.connect(HiveDriver.java:105)
    at java.sql.DriverManager.getConnection(DriverManager.java:571)
    at java.sql.DriverManager.getConnection(DriverManager.java:215)
    at com.bidstalk.tools.RawLogsQuerySystem.HiveJdbcClient.main(HiveJdbcClient.java:25)

StackOverflow 上的另一个问题建议在 Maven 中添加 Hadoop API 依赖项 -蜂巢错误

我不明白为什么客户端需要 hadoop API 来连接 Hive。 JDBC 驱动程序不应该不知道底层查询系统吗？我只需要传递一些 SQL 查询？

Edit:我正在使用Cloudera(5.3.1)，我想我需要添加CDH依赖项。 Cloudera实例运行hadoop 2.5.0和HiveServer2

但服务器位于机器 1。在机器上，代码至少应该编译，并且我应该只在运行时遇到问题！

如果你还没有解决这个问题，我已经尝试过了。我需要以下依赖项才能编译和运行：

libthrift-0.9.0-cdh5-2.jar
httpclient-4.2.5.jar
httpcore-4.2.5.jar
commons-logging-1.1.3.jar
hive-common.jar
slf4j-api-1.7.5.jar
hive-metastore.jar
hive-service.jar
hadoop-common.jar
hive-jdbc.jar
guava-11.0.2.jar

Hive 文档可能是针对旧版本/发行版编写的。

您的异常是由于缺少hadoop-common罐子，其中有org.apache.hadoop.conf.Configuration.

希望这可以帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

hive

通过Java JDBC连接Hive 的相关文章

无法在 Windows 10 中启动 Spark Master

我是 Spark 新手我正在尝试手动启动 master 在 Windows 10 中使用 MINGW64 当我这样做时 Downloads spark 1 5 1 bin hadoop2 4 spark 1 5 1 bin hadoop2
公平调度器和容量调度器有什么区别？

我是 Hadoop 世界的新手想了解公平调度程序和容量调度程序之间的区别另外我们什么时候应该使用每一个请简单地回答一下因为我在网上读了很多东西但从中得到的不多公平调度是一种为作业分配资源的方法使得所有作业随着时间的推移平均获得
使用 org.apache.hadoop/* 依赖项离线编译 sbt 时遇到的问题

使用依赖于 org apache hadoop 包的 sbt 进行离线编译时遇到很多麻烦一个简单的build sbt name Test version 1 0 scalaVersion 2 10 4 libraryDependencie
与文件名中的冒号“：”作斗争

我有以下代码用于加载大量 csv gz 并将它们转储到其他文件夹中并将源文件名作为一列 object DailyMerger extends App def allFiles path File List File val parts
如何有效地将数据从 Kafka 移动到 Impala 表？

以下是当前流程的步骤 Flafka http blog cloudera com blog 2014 11 flafka apache flume meets apache kafka for event processing 将日志写入
ETL informatica 大数据版（非云版）可以连接到 Cloudera Impala 吗？

我们正在尝试在 Informatica 大数据版本不是云版本上进行概念验证我发现我们可能能够使用 HDFS Hive 作为源和目标但我的问题是 Informatica 是否连接到 Cloudera Impala 如果是这样我们是否
如何对 RDD 进行分区

我有一个文本文件其中包含大量由空格分隔的随机浮动值我正在将此文件加载到 scala 中的 RDD 中这个RDD是如何分区的另外是否有任何方法可以生成自定义分区以便所有分区都具有相同数量的元素以及每个分区的索引 val dRDD
以不同用户身份运行 MapReduce 作业

我有一个与 Hadoop 交互的 Web 应用程序 Cloudera cdh3u6 特定的用户操作应在集群中启动新的 MapReduce 作业该集群不是一个安全集群但它使用简单的组身份验证因此如果我以自己的身份通过 ssh 连接到它
如何在Hadoop中序列化List集合对象？

有没有办法在 Hadoop 中序列化 java 集合 The Writable接口仅适用于 Java 原语我有以下类属性 private String keywords private List
Spark引擎执行SQL时如何获取hive UDF中Spark的partitionId或taskContext？

例如我们用Spark引擎执行下面的SQL 我们需要my udf row 返回 Spark 中的分区 id add jar hdfs dir udf udf jar create temporary function my udf as co
以编程方式读取 Hadoop Mapreduce 程序的输出

这可能是一个基本问题但我在谷歌上找不到答案我有一个映射缩减作业它在其输出目录中创建多个输出文件我的 Java 应用程序在远程 hadoop 集群上执行此作业作业完成后需要使用以下命令以编程方式读取输出org apache had
Spark/Yarn：HDFS 上不存在文件

我在 AWS 上设置了 Hadoop Yarn 集群有 1 个主服务器和 3 个从服务器我已经验证我有 3 个活动节点在端口 50070 和 8088 上运行我在客户端部署模式下测试了 Spark 作业一切正常当我尝试使用 Spa
scala/spark 代码不允许在 hive 中添加列

如果源数据有新列我尝试在 Hive 表中添加一列所有新列的检测都运行良好但是当我尝试将列添加到目标表时我收到此错误 for f lt df schema fields if f name chk spark sqlContext
AWS EMR 引导操作为 sudo

我需要更新 etc hosts适用于我的 EMR 集群 EMR AMI 4 3 中的所有实例整个脚本无非就是 bin bash echo e ip1 uri1 gt gt etc hosts echo e ip2 uri2 gt gt e
没有函数映射到名称“coord:formatTime”

我正在尝试使用 oozie 中的以下内容获取当前时间戳
Hadoop fs 查找块大小？

在 Hadoop fs 中如何查找特定文件的块大小我主要对命令行感兴趣例如 hadoop fs hdfs fs1 data 但看起来这并不存在有Java解决方案吗 The fsck其他答案中的命令列出了块并允许您查看块的数量但是要
从机上的 DiskErrorException - Hadoop 多节点

我正在尝试处理来自 hadoop 的 XML 文件在对 XML 文件调用字数统计作业时出现以下错误 13 07 25 12 39 57 INFO mapred JobClient Task Id attempt 201307251234
使用 Hive 计算文本变量的单词频率

我有一个变量每一行都是一个句子例子 Row1 Hey how are you Rwo2 Hey Who is there 我希望输出是按单词分组的计数 Example Hey 2 How 1 are 1 我正在使用 split a bi
Hive：为现有文件夹结构添加分区

我在 HDFS 中有一个文件夹结构如下所示但是实际上没有使用以下命令在表上创建分区ALTER TABLE ADD PARTITION命令即使文件夹结构的设置就像表有分区一样如何自动将所有分区添加到Hive表中 Hive 1 0 外
如何配置Hive仓库路径？

我修改了这部分

随机推荐

将远程图像保存到隔离存储中

我尝试使用此代码下载图像 void downloadImage WebClient client new WebClient client DownloadStringCompleted new DownloadStringComplete
如何防止 URLDownloadToFile 从缓存中检索？

我正在使用 URLDownloadToFile 从网站检索文件后续调用将返回原始文件而不是更新版本我假设它正在检索缓存的版本在调用 URLDownloadToFile 之前使用相同的 URL 调用 DeleteUrlCacheEntr
invalidateList 和 invalidateDisplayList 有什么区别？

我有一个 DataGrid 其中填充有 ArrayCollection 中的对象更新对象的字段之一后我希望屏幕更新数据源不可绑定因为我是在运行时构建它的而且我还不知道如何使其可动态绑定这是另一个问题在这种情况下如果我在网格上
清理 Mercurial 存储库

我的 hg 存储库的历史记录中有一堆文件已被删除它们导致存储库变得相当大其中一些是图像以及项目早期的 sql 转储以及其他一开始就不应该提交的东西我如何让 Mercurial 忘记这些东西并再次将我的存储库缩小到合理的大小我是否
C# 中的非对称加密示例

我需要通过 TCP 连接将机密数据发送到服务器我做了很多研究并且理解了理论部分根据我的研究我想做以下事情注意有一个服务器和一个客户端我们假设客户端或服务器的公钥可以被任何人获取客户创建他的公钥和私钥他能够用他的私钥加密并用他的
不带值的 MediaWiki URL 参数

The query的一部分URL似乎由键值对组成并由相关联我一直习惯使用 jQuery param 函数对我的查询字符串进行 URL 编码因为我发现它使我的代码更具可读性和可维护性在过去的几天里我发现自己在调用 MediaWiki
SimpleDateFormat 类中有哪些可用的日期格式？

谁能告诉我 SimpleDateFormat 类中可用的日期格式我已经浏览了 api 但找不到满意的答案非常感谢任何帮助下面详细描述了日期和时间格式 SimpleDateFormat Java Platform SE 7 日期和时间模
如何将 String 上的 PageRequest 作为数值进行排序

我目前有一个系统可以过滤和排序数据库中的记录并将它们作为分页对象返回其中一行是这样的 final PageRequest request new PageRequest this pagingSettings getPageNumber
已知起点、终点和半径，如何求圆弧圆周上的点？

请参阅下图以直观地了解我的问题我有点 1 和 2 的坐标它们是通过使用其他可用信息的公式得出的参见问题如何计算已知半径和圆心的圆上的点我现在需要做的与轨道建设分开是将点 1 和点 2 之间的点绘制为绿色这样做的最佳方法是什么
Cordova 6.4.0 Android 构建发布 apk 时出错

我有一个项目在 cordova 6 3 1 上运行良好然后我将 cordova 和我的项目更新到 6 4 0 在此之后我第一次构建时 gradle 也自动更新了现在我遇到一个重要的问题我需要在 build json 文件中包含密钥库
MousePressEvent，QGraphicsView中的位置偏移

我有一些困难QGraphicsView and QGraphicsScene 当我缩放取消缩放场景并使用 mousePressEvent 创建项目时我的位置有一个偏移如何避免这种情况 event pos 似乎是问题 from PyQt
如何使用 selenium 3.0.0 beta 关闭 geckodriver

环境 Win 7 Selenium 3 0 0 测试版 FireFox 49 0 1 System setProperty webdriver gecko driver C geckodriver exe WebDriver driver
Apache ProxyPass 未加载资源

我配置了 apache proxypass 它可以工作但无法加载图像 javascript CSS 等我想 proxypass 到另一台服务器而不是本地主机以下是我的配置查看错误图像
Google 地图 API 的服务帐户

On the Google 云身份验证概述页面上对云服务进行了以下说明对于几乎所有情况无论您是在本地开发还是在外部开发生产应用程序您应该使用服务帐户而不是用户帐户或 API 密钥考虑到这一点我的问题是当使用 Google
异常处理 ASP.NET MVC Web API

首先是的我们已经创建并正在使用一个继承自 ExceptionFilterAttribute 的异常过滤器它会在应用程序启动时在我们的身份过滤器之后立即注册到配置中并且如果我们的 API 内部某个地方发生错误它的工作效果几乎与预期一
如何处理 Web 驱动程序 Selenium python 浏览器或应用程序可能不安全的问题？

我正在尝试自动登录 Gmail 但看到此错误我认为这一定是因为该网站能够检测到自动化并阻止它大家能告诉我如何克服这个问题吗我的个人帐户没有发现此问题但只有普通帐户才会出现此问题 In you account profile in S
在 kableExtra() 中设置字幕格式

是否可以将字幕格式设置为kableExtra 我想在编织时将表格的标题居中并加粗HTML in RMarkdown 我试图将桌子包裹起来CSS div文本居中的位置但这并没有产生预期的结果样本表 library kableExtra k
python下载速度极慢

有没有办法提高Python上的url下载速度我有一个用 VB6 编写的程序无需尝试即可使用 Python 我已经转换了这个东西现在正在尝试 Python linux 中的东西似乎慢得多时间是原来的两倍即使是该程序的初始版本似乎也比
Flutter 如何改变ListView中鼠标滚轮的滚动速度？

我是初学者我正在 Windows 下编写一个关于 Flutter 的应用程序问题是 ListView 中的文本通过鼠标剪辑滚动得太慢我尝试覆盖 ScrollPhysics 但没有成功请提供一种改变滚动速度的工作方法对于找到这篇文章
通过Java JDBC连接Hive

这里有一个问题从 java 连接到 Hive但我的是不同的我的配置单元在 machine1 上运行我需要使用在 machine2 上运行的 Java 服务器传递一些查询据我了解 Hive 有一个 JDBC 接口用于接收远程查询我从

通过Java JDBC连接Hive

通过Java JDBC连接Hive 的相关文章

随机推荐

热门标签