Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List()

2024-01-06

我搜索了与这个问题相关的其他答案，但没有帮助。

我正在尝试向数据框中添加一列。该列的数据类型为Seq[CaseClass]。起初我认为 Spark 可能不支持集合类型列，但事实并非如此。

这是我尝试运行的代码示例。我只想向每一行添加一个空的 Seq[CaseClass]，以便稍后追加。

case class Employee(name: String)
val emptyEmployees: Seq[Employee] = Seq()
df.withColumn("Employees", lit(emptyEmployees))

但后来我发现这个错误被抛出withColumn

Unsupported literal type class scala.collection.immutable.Nil$ List()
java.lang.RuntimeException: Unsupported literal type classscala.collection.immutable.Nil$ List()

如果您使用的是spark 2.2+，那么只需更改lit() to typedLit()，根据this https://stackoverflow.com/a/35420501/2639647 answer.

case class Employee(name: String)
val emptyEmployees: Seq[Employee] = Seq()
val df = spark.createDataset(Seq("foo")).toDF("foo")
df.withColumn("Employees", typedLit(emptyEmployees)).show()

向我们展示：

+---+---------+
|foo|Employees|
+---+---------+
|foo|       []|
+---+---------+

Update

对于 2.1，上面该版本的链接答案通过转换您的lit(Array)进入一个array() of lit()s （使用一些神奇的 scala 语法）。在你的情况下，这会起作用，因为数组是空的。

def asLitArray[T](xs: Seq[T]) = array(xs map lit: _*)

case class Employee(name: String)

val emptyEmployees: Seq[Employee] = Seq()
val df = spark.createDataset(Seq("foo")).toDF("foo")

df.withColumn("Employees", asLitArray(emptyEmployees)).show()

其结果相同：

+---+---------+
|foo|Employees|
+---+---------+
|foo|       []|
+---+---------+

真正拥有一些东西在你的Seq需要稍微不同的功能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

DataFrame

apachesparksql

caseclass

Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List() 的相关文章

如何发现 Scala 远程 Actor 已死亡？

在 Scala 中当另一个远程 actor 终止时可以通过设置 trapExit 标志并以第二个 actor 作为参数调用 link 方法来通知一个 actor 在这种情况下当远程参与者通过调用 exit 结束其工作时第一个参与者
如何对同一列上的数据帧列表中的所有数据帧进行排序？

我有一个数据框列表dataframes list 举个例子我把dput dataframes list 在底部我想对列列表中的所有数据框进行排序enrichment 我可以对一个数据框进行排序 first dataframe lt da
不支持的身份验证令牌，仅当禁用身份验证时才允许 schema='none'：{ schema='none' } - Neo4j 身份验证错误

我正在尝试使用 neo4j spark connector 从 Spark 连接到 Neo4j 当我尝试连接到 Neo4j 时遇到身份验证问题org neo4j driver v1 exceptions AuthenticationExce
如何在 Scala 中打印任何内容的列表？

目前我有一个打印整数的方法 def printList args List Int Unit args foreach println 我如何修改它使其足够灵活可以打印任何内容的列表您不需要专用的方法所需的功能已经在集合类中 pri
Java 表达式树 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有相当于 net的 LINQ 下的表达式树JVM 我想实现一些类似 LINQ 的代码结构Scala
SPARK SQL - 当时的情况

我是 SPARK SQL 的新手 SPARK SQL 中是否有相当于 CASE WHEN CONDITION THEN 0 ELSE 1 END 的内容 select case when 1 1 then 1 else 0 end from
错误：协变类型 A 出现在逆变位置

我试图写一个不可变的Matrix A 班级我希望该类是协变的A但是当我把在前面A编译器开始抱怨类中的某些操作以下是我的相关子集Matrix类实际类比以下子集大 5 倍左右 class Matrix A private val co
pyspark 中的 Pandas UDF

我正在尝试在 Spark 数据帧上填充一系列观察结果基本上我有一个日期列表我应该为每个组创建缺失的日期在熊猫中有reindex函数这是 pyspark 中不可用的我尝试实现 pandas UDF pandas udf schema
fetchsize和batchsize对Spark的影响

我想通过以下方式控制 RDB 的读写速度Spark直接但标题已经透露的相关参数似乎不起作用我可以得出这样的结论吗fetchsize and batchsize我的测试方法不起作用或者它们确实会影响阅读和写作方面因为测量结果基于规模是
缓存 Slick DBIO 操作

我正在尝试加快 SELECT FROM WHERE name 的速度Play 中的查询类型 Scala 应用程序我正在使用 Play 2 4 Scala 2 11 play slick 1 1 1 包该软件包使用Slick 3 1版本
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
在 Pandas 中将行拆分为多列

所以我有这个数据框 df pd DataFrame Function 1 internal prop 1 external prop 1 Function 2 internal prop 2 external prop 2 Function
玩：将表单字段绑定到双精度型？

也许我只是忽略了一些明显的事情但我无法弄清楚如何将表单字段绑定到 Play 控制器中的双精度型例如假设这是我的模型 case class SavingsGoal timeframeInMonths Option Int amount
Spark 1.3.1 上的 Apache Phoenix（4.3.1 和 4.4.0-HBase-0.98）ClassNotFoundException

我正在尝试通过 Spark 连接到 Phoenix 并且在通过 JDBC 驱动程序打开连接时不断收到以下异常为简洁起见下面是完整的堆栈跟踪 Caused by java lang ClassNotFoundException org a
分析 sbt 构建

我的 sbt 构建需要很长时间它又大又复杂很难知道从哪里开始清理看起来 sbt 保留了很多关于构建结构的元数据包括相互依赖关系命名任务范围界定等有了所有这些元数据似乎很容易跳入并测量每个不同任务及其范围花费的时间在代码
在 Spark 中计算逻辑回归系数的标准误差

我知道这个问题之前已经被问过here https stackoverflow com questions 37816701 calculating standard error of estimate wald chi square sta
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
如何为 Spark RDD 中的元素分配唯一的连续编号

我有一个数据集 user product review 并希望将其输入到 mllib 的 ALS 算法中该算法需要用户和产品是数字而我的是字符串用户名和字符串SKU 现在我获取不同的用户和 SKU 然后在 Spark 外部为它们分配数

随机推荐

检查页面是父页面还是子页面？

是否可以检查页面是父页面还是子页面我的页面设置如下家长子页1 子页2 etc 如果它是父页面我想显示某个菜单如果它在子页面上我想显示不同的菜单我知道我可以做类似下面的事情但我想让它更加动态而不包含特定的页面 ID 您可以测
“kotlin-noarg”插件在 Realm 中不起作用

kotlin allopen 插件可以工作但 kotlin noarg 插件不起作用我能怎么做下面是代码构建 gradle buildscript ext kotlin version 1 1 3 2 repositories go
cin 首次使用函数后不允许输入

对于 C 或任何类型的编程来说都是全新的我正在尝试进行简单的输入输出但是在回答第一个问题后我没有机会输入第二个输入我尝试过在网上查找内容但考虑到这是一个非常简单的代码据说哈哈没有人遇到过同样的问题这让我来到这里 inclu
生产中的高超音速休眠？

开发商高超音速 http hsqldb org 承诺提高绩效但我担心使用 hsqlDB 的管理和其他方面会出现问题有人在生产中使用这个吗这是个好主意吗许多公司 http hsqldb org web hsqlUsing html在生
如何评估 WHERE 子句中的输入

我正在我的一个变量中输入一个输入基本上我想做一些类似的事情 SELECT FROM PEOPLE WHERE IF INPUT 1 ITEMID 16 OR ITEMID 13 ELSE IF INPUT 2 ITEMID 11 OR I
Java SFTP (apache vfs2) - 密码带有@

我正在尝试使用 org apache commons vfs2 通过 SFTP 下载文件问题是密码包含字符因此这会导致 URI 被错误解析 org apache commons vfs2 FileSystemException Ex
有没有办法只限制mysql中的较低范围？

我想获取查询中除第一行之外的所有行我怎样才能做到这一点您可以使用大量行偏移量为1 LIMIT 1 18446744073709551615
为什么 JSON 列不能是唯一键？

我有一个表里面有一个名为ColumnName该列的数据类型是JSON 我正在努力让它成为unique key 但这是不可能的我收到了这条消息 3152 JSON 列 columnName 不能在键规范中使用我想了解为什么我不能将该列设
在 SQL Server 中从 base64 字符串转换为 varbinary(max)

我的表中以二进制形式存储了 PDF 文档存储 PDF 字节的列是 typevarbinary max 我想要updateSQL Studio 中包含更新文档的一条记录我尝试完成此操作的方式如下所示 UPDATE table SET fi
Azure 搜索是否支持拼写错误和同义词？

我见过讨论这两个主题的线程 Azure 搜索是否处理同义词 https stackoverflow com questions 31180405 does azure search handle synonyms 搜索 API 中的模糊搜索
没有简单组件的提供者

直到 5 分钟前它才工作这毫无意义这是组件 import Component OnInit from angular core import Osobaa from osobaa import Osoba from osoba impo
RUBYLIB 环境路径

所以目前我已将以下内容包含在我的 bashrc 文件中 export RUBYLIB home git project app helpers 我正在尝试使用具有以下规范的规范来运行 rspec require output helper
在Python中读取csv文件时列出索引超出范围错误

我有这段代码我正在读取 csv 文件使用NamedTemporaryFile更改 csv 文件的内容 def update localcsv ping Yes No filename file1 csv tempfile NamedTe
发布 TypeScript 包时如何处理可选的对等依赖项？

将 TypeScript 包发布到 npm 并提供接受来自一个对等依赖项或另一个对等依赖项的输入的函数时如何定义可选的对等依赖项 import ExternalFoo from foo import ExternalBar from ba
如何重写此 MySQL 查询，使其不会引发此错误：您无法在 FROM 子句中指定目标表“crawlLog”进行更新？

我正在尝试从公司表中获取 id 但该 id 尚未出现在crawlLog 表中然后我需要将该companyId 插入crawlLog 表中我需要在一次调用中执行此操作以便并行爬网程序在其他爬网程序选择了某个 url 但尚未将其插入爬网日
如何在小窗口中打开“zxing条码”扫描屏？

zxing Barcode 扫描仪在我的应用程序中成功运行 https github com journeyapps zxing android embedded https github com journeyapps zxing and
如何优化elasticsearch percolator索引内存性能

使用elasticsearch percolator索引时有没有办法提高内存性能我为我的渗滤器创建了一个单独的索引我有大约 1 000 000 个用户创建的已保存搜索用于电子邮件警报创建此渗透器索引后我的堆使用率飙升至 100 并
重新打开 gem 提供的 ActiveRecord 模型

我正在尝试扩展 ActiveRecord 模型 Vote 那是一颗宝石 https github com peteonrails vote fu https github com peteonrails vote fu 提供给我的应用程序
“自动释放但没有池”是什么意思？

我的应用程序结构如下核心部分是用 C 编写的并大量使用线程我正在其上用 Objective C 开发 UI 如果我不执行线程它工作正常但我无法禁用停止线程 UI 在日志中随机崩溃我可以看到以下消息 NSAutoreleaseN
Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List()

我搜索了与这个问题相关的其他答案但没有帮助我正在尝试向数据框中添加一列该列的数据类型为Seq CaseClass 起初我认为 Spark 可能不支持集合类型列但事实并非如此这是我尝试运行的代码示例我只想向每一行添加一个空的 Se

Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List()

Spark：不支持的文字类型类 scala.collection.immutable.Nil$ List() 的相关文章

随机推荐

热门标签