如何在 scala 中将嵌套 JSON 转换为映射对象

2023-12-04

我有以下 JSON 对象：

{
    "user_id": "123",
    "data": {
        "city": "New York"
    },
    "timestamp": "1563188698.31",
    "session_id": "6a793439-6535-4162-b333-647a6761636b"
}
{
    "user_id": "123",
    "data": {
        "name": "some_name",
        "age": "23",
        "occupation": "teacher"
    },
    "timestamp": "1563188698.31",
    "session_id": "6a793439-6535-4162-b333-647a6761636b"
}

我在用着val df = sqlContext.read.json("json")将文件读取到数据框

它将所有数据属性组合成数据结构，如下所示：

root
 |-- data: struct (nullable = true)
 |    |-- age: string (nullable = true)
 |    |-- city: string (nullable = true)
 |    |-- name: string (nullable = true)
 |    |-- occupation: string (nullable = true)
 |-- session_id: string (nullable = true)
 |-- timestamp: string (nullable = true)
 |-- user_id: string (nullable = true)

是否可以将数据字段转换为 MAP[String, String] 数据类型？那么它只具有与原始 json 相同的属性？

是的，您可以通过从 JSON 数据导出 Map[String, String] 来实现这一点，如下所示：

import org.apache.spark.sql.types.{MapType, StringType}
import org.apache.spark.sql.functions.{to_json, from_json}

val jsonStr = """{
    "user_id": "123",
    "data": {
        "name": "some_name",
        "age": "23",
        "occupation": "teacher"
    },
    "timestamp": "1563188698.31",
    "session_id": "6a793439-6535-4162-b333-647a6761636b"
}"""

val df = spark.read.json(Seq(jsonStr).toDS)

val mappingSchema = MapType(StringType, StringType)

df.select(from_json(to_json($"data"), mappingSchema).as("map_data"))

//Output
// +-----------------------------------------------------+
// |map_data                                             |
// +-----------------------------------------------------+
// |[age -> 23, name -> some_name, occupation -> teacher]|
// +-----------------------------------------------------+

首先我们提取出内容data字段转换为字符串to_json($"data")，然后我们解析并提取 Mapfrom_json(to_json($"data"), schema).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

json

scala

apachespark

如何在 scala 中将嵌套 JSON 转换为映射对象的相关文章

Python for 循环仅返回字典的最后一个值

我正在尝试在 python 中创建一个带有 xyz 坐标的 json 转储但是我用来遍历不同组的 for 循环仅返回最后一个组 self group strings CHIN L EYE BROW R EYE BROW L EYE R E
如何发现 Scala 远程 Actor 已死亡？

在 Scala 中当另一个远程 actor 终止时可以通过设置 trapExit 标志并以第二个 actor 作为参数调用 link 方法来通知一个 actor 在这种情况下当远程参与者通过调用 exit 结束其工作时第一个参与者
阶乘的 Scala 排列

我怎样才能找到n Scala 中某些字母的排列 Scala 2 9 RC1 scala gt abc permutations toList res58 List String List abc acb bac bca cab cba
在 JavaScript 中按属性过滤 JSON 数据

我有一个 JSON 序列化集合 id person1 date 7 20 2014 17 20 09 listed name Tom name Tom contact info email protected cdn cgi l email
Source.getLines 中的默认参数错误 (Scala 2.8.0 RC1)

假设我运行 Scala 2 8 0 RC1 以下 scala 代码应该打印出文件 c hello txt 的内容 for line lt Source fromPath c hello txt getLines println line 但
我应该如何在http post请求的请求负载中传递json数据

我想知道如何在有效负载中传递 json 请求例如 name test value test var post data var post options host this host path path method POST heade
Scala 如何忽略 Java 的检查异常？

例如如果调用 JavaThread sleep这会抛出一个已检查的InterruptedException来自 Scala 源文件然后不需要将调用包含在 Scala 中try catch Scala 如何删除将调用包围在 a 中的规则tr
如何捕获 Oozie Spark 输出

有没有办法捕获spark的输出然后将其输入到shell上我们当前正在使用 scala 创建 jar 文件并希望我们的 Spark 输出成为 shell 输入我的想法是使用 wf actionData spark XXXX var 我只
在 json 中解析尾随字符

我正在尝试检查 json 是否有效并且我遇到了奇怪的行为当我将一些字符附加到可解析的 json 时 jackson 和 gson 都会解析它并且它们会忽略尾随字符我想检查 json 是否严格有效请帮忙我尝试了几个标志mapper
获取 JSON 中的 HTML 以在 React 组件中呈现为 HTML

试图找出如何让链接实际呈现为链接现在在我从 Json 文件中读取这行文本后 React 将超链接渲染为文字文本而不将其渲染为链接一些数据 json about John has a blog you can read a href
PySpark Yarn 应用程序在 groupBy 上失败

我正在尝试在 Yarn 模式下运行一个处理大量数据的作业 2TB 从谷歌云存储读取管道可以总结如下 sc textFile gs path json map lambda row json loads row map toKvPair g
在 Scala 和 SBT 中调试较长的编译时间

在我的 Scala SBT 项目中我有一个文件需要 5 分钟才能编译所有其他的都可以在几秒钟内编译这使得开发非常痛苦我确信我滥用了一些 Scala 构造但我不知道如何调试它如何在 Scala 中调试较长的编译时间我正在使用 S
错误：协变类型 A 出现在逆变位置

我试图写一个不可变的Matrix A 班级我希望该类是协变的A但是当我把在前面A编译器开始抱怨类中的某些操作以下是我的相关子集Matrix类实际类比以下子集大 5 倍左右 class Matrix A private val co
如何将 Laravel 5.4 与 Angular 4 集成

我知道如何创造完整的拉拉维尔 5 4自己的项目我也知道如何使用创建 SPA角4 Problem 我不知道如何将 Laravel 与 Angular 集成另外我想使用 Laravel 5 4 作为后端使用 Angular 4 作为前端
pyspark 中的 Pandas UDF

我正在尝试在 Spark 数据帧上填充一系列观察结果基本上我有一个日期列表我应该为每个组创建缺失的日期在熊猫中有reindex函数这是 pyspark 中不可用的我尝试实现 pandas UDF pandas udf schema
使用本地存储在从另一个表保存的 HTML TABLE 中打印 JSON，以便我在另一个页面上打印我的表

在我的作业中我必须使用用户输入中的数据并将数据保存在本地存储中我必须以水平表格式将这些数据从本地存储打印到其他页面为此我编写了用于用户输入并将数据保存在本地存储中的代码 div p p div
使用 scala 集合 - CanBuildFrom 麻烦

我正在尝试编写一个接受任何类型集合的方法CC 并将其映射到一个新的集合相同的集合类型但不同的元素类型我正在挣扎基本上我正在尝试实施map but 不在集合本身上问题我正在尝试实现一个带有签名的方法它看起来有点像 def map
PHP 数组通过 JSON 转为 jquery 数组

我有点困惑为什么以下不起作用 get php
在 MySQL 中使用 COUNT 时如何返回 0 而不是 null

我使用此查询返回存储在 sTable 中的歌曲列表以及存储在 sTable2 中的总项目数 SQL queries Get data to display sQuery SELECT SQL CALC FOUND ROWS str repl
使用 Jade 评估自定义 javascript 方法 (CircularJSON)

我想通过 Jade 将一个对象解析为客户端 JavaScript 通常这会起作用 script var object JSON parse JSON stringify object but my object is circular ht

随机推荐

如何编写一个随windows启动自动启动的python程序？

我正在使用 python 2 6 和 pyqt4 编写一个程序我希望这个程序在 Windows 启动时自动启动类似于 uTorrent 客户端我该如何进行这项工作我使用的是Windows 7 您只需在 Windows 开始菜单的启
PHP 使用 Cookie 将当前会话 ID 存储在数据库中

我创建了一个使用 cookie 并将会话 ID 存储在数据库中的登录系统因此您的登录只能使用该特定会话 ID 我意识到这有几个问题如果您在另一台设备上登录会话 ID 会发生变化不可多次登录会话 ID 实际上是唯一标识用户已登录的内
如何防止论坛类应用程序中出现垃圾邮件？

对于网络应用程序除了验证码之外还有其他方法吗 Pastie org or p ramaz net 就我的口味而言验证码对于小糊状物来说花费的时间太长了你可以尝试蜜罐验证码本质上您可以使用 CSS 隐藏一些表单字段您的用户永远不
System.in方法指定的键盘在哪里？

我无法从概念上理解下面的代码从键盘检索字符并打印到命令行中我指定输入必须来自键盘的位置 public class Adder public static void main String arr Explain this next li
无法将参数传递给 @selector 方法？

我目前正在尝试使用标题为 X 的 UIButton 作为从视图中删除 Sprite 的方法基本上我的代码的工作原理是当触摸精灵时一条消息会发送到传递已选择的 Sprite 精灵的委托视图控制器在此方法中我在该精灵之上绘制一个
Jquery 可选择范围选择（滑块行为）

我想用值列表和选择范围的选项替换滑块我关注了 jquery selectable 文章它提供了一个很好的多选选项 http jqueryui com demos selectable display grid 由于我只需要范围选择因此
如何允许缺少 .d.ts 类型定义的模块？

我正在使用一些不受欢迎的模块例如Dyo and js sha3似乎没有任何类型我现在并不真正关心第三方库中的类型我不想花几个小时来输入这些类型我主要将它用于服务器以限制我的错误并在开发过程中更轻松地进行故障排除 I had a C
从 JSONObjects 的 JSONArray 中删除除一个元素之外的所有元素

我有一个像这样的 JSONArray org json a a b a c a d a e a f a g a 我想删除所有JSONObjects that do not有钥匙a 除了我幼稚的方法之外还有更好的方法吗 Iterator o
Eclipse C++ 多个项目通用文件

在 Eclipse CDT 中我希望有几个 C 项目 projA projB projC 等其中都包含一些 c cpp and or h来自公共目录的文件这是我现有的文件结构 Workspace gt projA gt src gt
jQuery 将toggleClass 保存在cookie 或localStorage 中

我正在尝试保存 cookie 或使用localStorage 以更好的为准记住访问者何时单击加号按钮来显示隐藏 div 任何人都可以协助使下面的代码与 cookie 一起使用或localStorage plus on click fun
设计：注册登录尝试

我有一个 Rails 3 0 项目使用devise我被要求在数据库中注册每次成功的登录和每次失败的尝试来自devise我想我必须扩展文档FailureApp但这些示例只是重定向用户根本没有使用该模型在堆栈溢出我刚刚发现这个问题但仍未得
CultureInfo 的 2 个字母 ISO 国家/地区代码

我有一个 Xamarin Forms 应用程序正在获取 GeoLocation 的 2 个字母的 ISO 国家地区代码我需要该应用程序以本地风格显示货币因此如果我将手机从英国带到日本它会显示以日元格式设置的货币字段设置十进制货币
Regex & BBCode - 完善嵌套报价

我正在为我的网站编写一些 BBcode 我已经设法让大部分代码完美运行但是 QUOTE 标签给了我一些悲伤当我得到这样的东西时 QUOTE 1 QUOTE 2 This is a quote from someone else QUOT
显示已过去时间

我需要动态显示经过的时间我的代码将根据间隔值弹出一条消息 public void button1 Click object sender EventArgs e this TopMost true DialogResult result1
Swift 线程 1：致命错误：init(coder:) 尚未实现（调用超级解决方案不起作用）

嘿伙计们我已经四处寻找但仍然找不到解决我的问题的方法我这里有一个自定义类 import UIKit DatasourceController is simply a UICollectionViewController that al
使用套接字时发送当前值的 Unity 延迟

Visual Studio 中的 client cs private void SendToServer string HeartRate SetHRTest HeartRate try s client GetStream StreamR
通过 Javascript 预览 Html 文件上传

我想为一篇文章展示预览之类的东西所以通过 JS 获取详细信息但问题来了
SVG onmouseover 对于具有重叠元素的组发生两次

当将函数附加到onmouseoverSVG 组的事件
如何隐藏图像的物理路径

在我的应用程序中我通过给出目录的物理路径来显示用户的图像例如http www example com user images abcdefghijk jpg 但我不想向外部用户公开这个物理路径来访问直接文件我想根据 gravtar 类
如何在 scala 中将嵌套 JSON 转换为映射对象

我有以下 JSON 对象 user id 123 data city New York timestamp 1563188698 31 session id 6a793439 6535 4162 b333 647a6761636b user

如何在 scala 中将嵌套 JSON 转换为映射对象

如何在 scala 中将嵌套 JSON 转换为映射对象 的相关文章

随机推荐

热门标签

如何在 scala 中将嵌套 JSON 转换为映射对象的相关文章