我正在尝试创建一个 Spark UDF 以从用户定义的案例类中提取(键,值)对的映射。
scala 函数似乎工作正常,但是当我尝试将其转换为 Spark2.0 中的 UDF 时,我遇到了“不支持 Any 类型的架构”错误。
case class myType(c1: String, c2: Int)
def getCaseClassParams(cc: Product): Map[String, Any] = {
cc
.getClass
.getDeclaredFields // all field names
.map(_.getName)
.zip(cc.productIterator.to) // zipped with all values
.toMap
}
但是当我尝试将函数值实例化为 UDF 时,会导致以下错误 -
val ccUDF = udf{(cc: Product, i: String) => getCaseClassParams(cc).get(i)}
java.lang.UnsupportedOperationException: Schema for type Any is not supported
at org.apache.spark.sql.catalyst.ScalaReflection$.schemaFor(ScalaReflection.scala:716)
at org.apache.spark.sql.catalyst.ScalaReflection$.schemaFor(ScalaReflection.scala:668)
at org.apache.spark.sql.catalyst.ScalaReflection$.schemaFor(ScalaReflection.scala:654)
at org.apache.spark.sql.functions$.udf(functions.scala:2841)
错误消息说明了一切。地图上有一个 Any。 Spark SQL 和 Dataset api 不支持 schema 中的 Any。它必须是受支持的类型之一(这是基本类型的列表,例如 String、Integer 等、受支持类型的序列或受支持类型的映射)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)