如何解决 Spark JDBC 的编码问题？

2024-03-19

我在 Oracle 中有一个表，其中有一些俄语记录。

当我使用 Spark JDBC 读取此表时，我收到的数据帧的值不正确。

您知道为什么会发生这种情况以及如何解决吗？

// executes given query using jdbc
  def executeQuery(spark: SparkSession, configuration: Map[String, String], sql_statement: String): DataFrame
  = spark.read.format("jdbc")
    .option("driver", "oracle.jdbc.OracleDriver")
    .option("url", s"jdbc:oracle:thin:@//${configuration("address")}")
    .option("user", configuration("username"))
    .option("password", configuration("password"))
    .option("dbtable", s"(${sql_statement})")
    .option("fetchSize", configuration("fetch_size"))
    .load()

在您的 jdbc 连接中，您需要设置.option("encoding", "UTF-8") and ("characterEncoding", "UTF-8")确保我们在读取数据时使用UTF8字符集。这应该确保您能够正确阅读俄语字符。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Oracle

apachespark

JDBC

如何解决 Spark JDBC 的编码问题？的相关文章

fetchsize和batchsize对Spark的影响

我想通过以下方式控制 RDB 的读写速度Spark直接但标题已经透露的相关参数似乎不起作用我可以得出这样的结论吗fetchsize and batchsize我的测试方法不起作用或者它们确实会影响阅读和写作方面因为测量结果基于规模是
如何在Spark结构化流中指定批处理间隔？

我正在使用 Spark 结构化流并遇到问题在 StreamingContext DStreams 中我们可以定义批处理间隔如下所示 from pyspark streaming import StreamingContext ssc
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
使用spark phoenix从表中读取rdd分区号为1

当我运行我的火花代码时 val sqlContext spark sqlContext val noact table primaryDataProcessor getTableData sqlContext zookeeper table
Oracle：如何确定“AFTER ALTER”触发器中对象的新名称？

假设我有一个AFTER ALTER在我的 Oracle 数据库上触发并重命名一些数据库对象 ALTER RENAME TO 在触发器中我如何确定new数据库对象的名称看来ORA DICT OBJ OWNER ORA DICT OBJ N
Oracle查询结果分页无TABLE FULL SCAN数据访问方式

stackoverflow 上有很多关于如何正确执行分页的问题对于 Oracle 来说最流行的答案是这样的 select from select row rownum rownum from select from some table
如何使用 SparkR 1.6.0 写入 JDBC 源？

使用 SparkR 1 6 0 我可以使用以下代码从 JDBC 源读取数据 jdbc url lt jdbc mysql localhost 3306 dashboard user
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
SQL 国家字符 (NCHAR) 数据类型的真正用途是什么？

也CHAR CHARACTER and VARCHAR CHARACTER VARYING SQL 提供了NCHAR NATIONAL CHARACTER and NVARCHAR NATIONAL CHARACTER VARYING 类型
spring-jdbc 与 spring-data-jdbc 以及它们支持什么

我很好奇 spring jdbc 我在最新的 spring 版本中缺少的和 spring data jdbc 之间有什么区别有区别还是只是重命名在存储库中我没有看到这一点是否有地方描述了版本支持的目标 DB JDBC 规范 JDK
Spark 执行器登录 YARN

我正在 Cloudera 集群上以 YARN 客户端模式启动分布式 Spark 应用程序一段时间后我在 Cloudera Manager 上看到一些错误一些执行者会断开连接并且这种情况会系统性地发生我想调试该问题但 YARN 未
如何使用 log4j 自定义附加程序在 HDFS 上创建日志？

Overview 我们希望使用 log4j 记录 Spark 作业活动并将日志文件写入 HDFS Java 8 Spark 2 4 6 Scala 2 1 2 Hadoop 3 2 1 我们无法找到本地 apache log4j 附加程序
快速查询最新记录的方法？

我有一张这样的表 USER PLAN START DATE END DATE 1 A 20110101 NULL 1 B 20100101 20101231 2 A 20100101 20100505 在某种程度上如果END DATE i
必须包含 log4J，但它会导致 Apache Spark shell 中出现错误。如何避免错误？

由于我必须将 jar 包含到 Spark 代码中因此我想请求帮助找出解决此问题而不删除 log4j 导入的方法简单代码如下 cp symjar log4j 1 2 17 jar import org apache spark rdd v
从函数内的 SELECT 返回一个变量

我正在尝试创建一个返回 varchar 的函数其中一个字段形成一个选择即聚合字段我收到下一个错误 ORA 01422 exact fetch returns more than requested number of rows 我的理
弹簧隔离支持吗？ SQL快照隔离

我们正在使用 SQL Server 快照隔离可能是提高性能和解决一些死锁问题的好方法假设我们确实需要更改为快照隔离我似乎找不到一种简单的方法来在 Springs 上启用快照隔离 Transactional 我发现以下 hibernate
SQL查询查找表的主键？

我怎样才能找到哪一列首要的关键使用查询来创建表这是重复的question https stackoverflow com questions 893874 mysql determine tables primary key dynami
Spark-submit，客户端无法通过以下方式进行身份验证：[TOKEN，KERBEROS]；

我使用 kerberos 设置了 hadoop 集群但是当我运行 Spark Submit 时它抛出异常 17 10 19 08 46 53 WARN scheduler TaskSetManager Lost task 0 0 in
Java ResultSet 如何检查是否有结果

结果集 http java sun com j2se 1 4 2 docs api java sql ResultSet html没有 hasNext 方法我想检查 resultSet 是否有任何值这是正确的方法吗 if resultS
Spark 3 KryoSerializer 问题 - 无法找到类：org.apache.spark.util.collection.OpenHashMap

我正在将 Spark 2 4 项目升级到 Spark 3 x 我们遇到了一些现有 Spark ml 代码的问题 var stringIndexers Array StringIndexer for featureColumn lt FEAT

随机推荐

在 CSS 中应该使用 rgba(0, 0, 0, 0) 还是 rgba(255, 255, 255, 0) 来实现透明度？

你应该使用rgba 0 0 0 0 or rgba 255 255 255 0 CSS 的透明度各自的优点和缺点是什么最后一个参数为rgba 函数是 alpha 或 opacity 参数如果您将其设置为0它将意味着完全透明前三个参
将datagridview导出到word文档c#

我正在尝试将数据网格导出到Word文档但不是这个结果 EmployeeID EmployeeName Birth Phone Address DateOfHiring Salary EmloyeeType 1 name 1 11 test
Mandrill 通过 Laravel / PHP 入站电子邮件

我想知道是否有人可以帮助我解决我在研究 Laravel 和通过 Mandrill 入站电子邮件处理相关问题时遇到的一些问题基本上我希望能够通过 Mandrill 接收电子邮件并将它们存储在我的 Laravel 数据库中现在我不确定我是否
将闪亮的小部件显示与特定的导航栏 tabPanel() 选择连接起来

我有一个闪亮的仪表板其中有一个导航栏页面其中包含两个 tabPanel Summary and Available Funds Then Available Funds 由一个tabsetPanel 有两个选项卡面板 Plot and
Android蓝牙UUID连接APP到ANDROID

我正在构建一个 Android 应用程序用于跟踪设备上的蓝牙连接并在超出范围时触发警报 Android 文档要求提供 UUID 才能建立连接 uuid 是用于唯一标识信息的字符串 ID 的通用唯一标识符 UUID 标准化 128 位格式
如何在多个显示器上正确使用 SetDisplayConfig？

我正在创建一个小程序它将包含桌面中的所有显示器扩展模式或禁用所有辅助显示器显示器可以连接到 GPU 和集成显卡该程序适用于Windows 7 因此根据互联网上的信息我决定使用CCD API 但遇到了SetDisplayConfi
带有空 RHS 的“dcast”[重复]

这个问题在这里已经有答案了有没有办法在不首先指定要翻转的变量的情况下翻转我的数据在我看来逻辑默认值似乎是组内索引例如 DT lt data table id rep 6 10 each 3 var rnorm 15 DT id va
TypeScript：如何从类型中提取泛型参数？

假设我有这样的类型React ComponentClass
JComboBox 填充枚举变量值

我有一个JComboBox我用这种方式制作的enum其价值观 JComboBox
migrate.exe 忽略绑定重定向

我正在尝试运行migrate exe申请来自EntityFramework在特定的 DLL 上该DLL引用了Microsoft Azure KeyVault WebKeynuget 包当我尝试运行命令时 migrate MyProjec
使用 .htaccess 动态 URL 重写

我对 htaccess 重写还很陌生我正在尝试创建规则来动态重写 URL 例如假设用户输入以下 URL http example com xxx user 2002 它将被重写为 http example com xxx user 20
Solr - 如何获取特定格式的搜索结果

在探索示例时索引维基百科数据 http wiki apache org solr DataImportHandler Example 3a Indexing wikipedia在Solr中我们如何才能得到预期的结果即与导入的数据相同是
斜杠有什么用？ [复制]

这个问题在这里已经有答案了可能的重复在 mysql real escape string 之后使用 stripslashes https stackoverflow com questions 11295141 using strips
将我的 sql 查询转换为 crm 中的 queryexpression 或 fetchxml

我有这个SQL查询我试图获取的位置opportunityId来自机会实体为谁approvaldocument尚未创建批准文档是其他实体的名称我认为 fetchxml 不支持此类查询我是 crm 新手我的项目位于crm 4 0版本
如何在 SwiftUI 中显示 HTML 文本

我的要求是显示文本SwiftUI其中包含HTML标签我尝试使用的方法WKWebKit Loadhtml效果很好但是我需要像这样显示它人物卡集合人员卡姓名职务具有 HTML 文本的人员详细信息例如Hello world 有人
如何在 LIFERAY 中从first.jsp 重定向到second.jsp？

这怎么办请帮我解决这个问题 jsp 内部的重定向并不是真正方便的想法因为下面的 jsp 解析进入渲染阶段而该阶段的目的是显示内容另一方面下面重定向到操作阶段在这里您可以决定 portlet 接下来应该做什么阅读本教程以更好地理
更新到 3.0 后 Gradle 构建失败

我最近将项目的 gradle 版本从 2 14 1 更新到 3 0 从那时起 gradle 构建每次都会失败并出现以下错误错误原因 org gradle api internal tasks DefaultTaskInputs Tas
分组表视图

我想创建一个如下图所示的表格视图谁能告诉我一个例子或者说我该怎么做创建一个 UITableView 并将样式设置为 UITableViewStyleGrouped 您可以通过编程方式或在 IB 中执行此操作然后您需要 2 个部分第一
如何卸载Keras？

我已经使用以下命令安装了 Keras sudo pip install keras 它安装正确并且工作正常直到我尝试导入应用程序模块 from keras applications vgg16 import VGG16 Using The
如何解决 Spark JDBC 的编码问题？

我在 Oracle 中有一个表其中有一些俄语记录当我使用 Spark JDBC 读取此表时我收到的数据帧的值不正确您知道为什么会发生这种情况以及如何解决吗 executes given query using jdbc def ex

如何解决 Spark JDBC 的编码问题？

如何解决 Spark JDBC 的编码问题？ 的相关文章

随机推荐

热门标签

如何解决 Spark JDBC 的编码问题？的相关文章