将 Cassandra OrderedMapSerializedKey 转换为 Python 字典

2023-12-03

我在 Cassandra 中有一列由列表映射组成，当使用 Python 驱动程序查询时，它返回一个 OrderedMapSerializedKey 结构。该结构是列表的映射。我想将整个查询放入 pandas 中。

要从 OrderedMapSerializedKey 结构中提取数据，即获取键并将其用作新列的标签，并仅保留列表的第一个元素作为值，我使用上述方法here在返回构建的 DataFrame 之前，在工厂中进行一些复杂/肮脏的操作。

有人问了类似的问题here，没有真正的答案。

有没有更好的方法将这样的 OrderedMapSerializedKey 结构转换为可以轻松加载到 pandas DataFrame 中的 Python 字典？

我认为最终的解决方案可能是存储OrderedMapSerializedKeyCassandra 结构作为dict在您的数据框列中，您可以将此值/列传输给您想要的任何人。最终是因为您可能不知道 Cassandra 行中的实际键（可能将不同的键插入到行中）。

所以这里是我测试过的解决方案，你只需要改进pandas_factory功能：

EDIT:

在之前的解决方案中，我仅替换了 Cassandra 数据集的第一（第 0）行（rows是元组列表，其中每个元组都是 Cassandra 中的一行）

from cassandra.util import OrderedMapSerializedKey

def pandas_factory(colnames, rows):

    # Convert tuple items of 'rows' into list (elements of tuples cannot be replaced)
    rows = [list(i) for i in rows]

    # Convert only 'OrderedMapSerializedKey' type list elements into dict
    for idx_row, i_row in enumerate(rows):

        for idx_value, i_value in enumerate(i_row):

            if type(i_value) is OrderedMapSerializedKey:

                rows[idx_row][idx_value] = dict(rows[idx_row][idx_value])

    return pd.DataFrame(rows, columns=colnames)

您必须插入一些自动检查 Cassandra 映射字段之前/之后是否有最小一个值，或者相应地手动修改上述脚本。

美好的一天！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 Cassandra OrderedMapSerializedKey 转换为 Python 字典的相关文章

为什么 tkinter / window.update 在我的程序中随着时间的推移变得更慢？

我发现当我调用 window update 时当向窗口写入的内容较少时它的运行速度会更快但后来当我向窗口写入更多元素时 window update 需要更长的时间请参阅下面的我的代码您可以看到它在更新窗口之前一次向屏幕 100
子进程改变目录

我想在子目录超级目录中执行脚本我需要首先进入该子目录超级目录我无法得到subprocess进入我的子目录 tducin localhost Projekty tests ve python Python 2 7 4 default
Python 中的安全解除引用

Groovy 有一个很好的安全取消引用运算符这有助于避免 NullPointerExceptions variable method The method仅当以下情况时才会被调用variable is not null 有没有办法在 Py
Python + PostgreSQL + 奇怪的ascii = UTF8编码错误

我有包含字符的 ascii 字符串 x80 代表欧元符号 gt gt gt print x80 当将包含该字符的字符串数据插入数据库时我得到 psycopg2 DataError invalid byte sequence for enc
为什么导入 pdb 时出现此错误？ “模块”对象没有属性“ascii_letters”

尝试调试我的代码我正在导入库pdb import sys from subprocess import check call import pdb functions if name main Code 我收到此错误 File reg p
html 解析器 python

我正在尝试解析一个网站我正在使用 HTMLParser 模块问题是我想解析第一个 a href 评论后但我真的不知道该怎么做所以我在文档中发现有一个函数叫做handle comment 但我还没有找到如何正确使用它我有以下内容 i
Pyspark 数据框逐行空列列表

我有一个 Spark 数据框我想创建一个新列其中包含每行中具有 null 的列名称例如原始数据框是 col 1 col 2 col 3 62 45 null 62 49 56 45 null null null null null
使用 Scipy imsave 将 Numpy 数组保存到图像时保留未更改的数据

使用 Scipy 保存二维 Numpy 数组单个值时toimage or imsave像素值与 Numpy 数组中的像素值不完全匹配相反在某些区域主要是边缘图像算法似乎使用某种插值是否有一个选项可以停止插值并保留准确的数据例
网页抓取 - 前往第 2 页

如何访问数据集的第二页无论我做什么它都只返回第 1 页 import bs4 from urllib request import urlopen as uReq from bs4 import BeautifulSoup as sou
如何使用 PySpark 有效地将这么多 csv 文件（大约 130,000 个）合并到一个大型数据集中？

我之前发布了这个问题并得到了一些使用 PySpark 的建议如何有效地将这一大数据集合并到一个大数据框中 https stackoverflow com questions 60259271 how can i merge this la
在 matplotlib 中使用 yscale('log') 时缺少误差线

在某些情况下当使用对数刻度时 matplotlib 会错误地显示带有误差条的图假设这些数据例如在 pylab 内 s 19 0 20 0 21 0 22 0 24 0 v 36 5 66 814250000000001 130 177
如何检查列表是否为空？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动例如如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
为什么“return self”返回 None ？ [复制]

这个问题在这里已经有答案了我正在尝试获取链的顶部节点getTopParent 当我打印出来时self name 它确实打印出了父实例的名称然而当我回来时self 它返回 None 为什么是这样 class A def init sel
Spark中的count和collect函数抛出IllegalArgumentException

当我使用时抛出此异常时我尝试在本地 Spark 上加载一个小数据集count 在 PySpark 中 take 似乎有效我试图搜索这个问题但没有找到原因看来RDD的分区有问题有任何想法吗先感谢您 sc stop sc Spark
大型数据集上的 Sklearn-GMM

我有一个很大的数据集我无法将整个数据放入内存中我想在这个数据集上拟合 GMM 我可以用吗GMM fit sklearn mixture GMM 重复小批量数据没有理由重复贴合只需随机采样您认为机器可以在合理时间内计算的尽可能多的数据
scipysolve_ivp() 中的访问时间步长

我有一个常微分方程系统正在使用 scipy 的solve ivp 函数求解它运行良好但我在访问每个步骤中使用的时间步时遇到问题我知道solve ivp 将当前时间传递给用户定义的函数但我需要使用的时间步长而不是当前时间为了解决
issubclass() 对从不同路径导入的同一类返回 False

目的是实现某种插件框架其中插件是同一基类即 A 的子类即 B 基类使用标准导入加载而子类使用 imp load module 从众所周知的包即 pkg 的路径加载 pkg init py mod1 py class A mod2
在Python中从日期时间中减去秒

我有一个 int 变量它实际上是秒让我们调用这个秒数X 我需要得到当前日期和时间以日期时间格式减去的结果X秒 Example If X是 65 当前日期是2014 06 03 15 45 00 那么我需要得到结果2014 06 03
在游戏中实现功能

我在完成这部分作业时遇到了麻烦我必须宣布游戏的获胜者然后输入到函数中输入所有 if 语句后我必须创建一个函数def playGame 这必须包括 showRules user getUserChoice computer getCo
为什么用字符串和时间增量转置 DataFrame 会转换数据类型？

这种行为对我来说似乎很奇怪 id列字符串在转置后转换为时间戳df如果另一列是时间增量 import pandas as pd df pd DataFrame id 00115 01222 32333 val 12 14 170 df v

随机推荐

调用 SwingWorker.get( ) 时防止 GUI 冻结

我有一个程序我正在加载文件同时显示一个窗口以通知用户正在加载文件我决定创建一个 FileLoader 类它是一个 SwingWorker 它实际上处理加载文件还有一个 ProgressWindow 它实现 PropertyChan
Java 砖块碰撞 [关闭]

Closed 这个问题需要多问focused 目前不接受答案我一直在开发一款 Breakout 游戏除了砖块碰撞之外几乎所有的事情都完成了球在墙壁和桨上弹跳得很好但当它碰到砖块时它会直接穿过它们我很确定问题出在主类的 chec
RestSharp 忽略响应字符集编码

我正在使用 RestSharp 版本 105 1 0 NET 4 5 1 对我们自己的 API 进行 REST 调用此 API 发送带有以下特别感兴趣的标头的响应 Content Type application json Charset
在 Java 中截取屏幕截图（机器人，代码可以工作，但不能与外部全屏应用程序一起使用）

我使用以下代码来截取屏幕截图 Robot robot new Robot BufferedImage image robot createScreenCapture screenRectangle ImageIO write image p
区分联合表中的行

我正在使用此 sql 查询从两个不同的表中选择没有匹配列的数据 select from SELECT s shout id s user id s time FROM shouts s union all select v post id
Visual Studio 相当于 c++11（或更低版本）中的 gcc __attribute__((unused))？

我正在尝试编写一个宏以便在用户需要时使用抑制未使用的变量警告例如在派生类中当您尚未实现整个类时我知道我可以删除变量名称但为了明确起见我更喜欢宏到目前为止我有这个 ifdef WIN32 define UNUSED x x e
在 VS2013 中使用 VS2008 (v90) C++ 工具集？

微软文档解释如何在 VS2013 中使用 2010 或 2012 工具集有谁知道 2008 工具集是否也有向后支持我正在从 2008 年升级到 2013 年的几个项目但我的团队领导希望我们最初升级项目文件但仍以与 2008 年相同的
Git svn 变基失败

I use git svn跟踪 SVN 存储库当我尝试做一个git svn rebase我收到此错误 Incomplete data Delta source ended unexpectedly 这是一个大型仓库具有悠久的历史仅仅获
MVC4 Windows 身份验证重定向到帐户/登录

我正在设置Windows 身份验证在 MVC 4 应用程序中使用视觉工作室2013并使用IIS Express 开发服务器但是我被重定向到 Account Login 就好像我正在使用表单身份验证一样我的 bin 文件夹或任何地方
在 RECEIVE_BOOT_COMPLETED 上通过广播接收器访问数据库

当手机完成启动后我想根据数据库中的小时分钟信息自动重新注册一些警报我尝试使用广播接收器来执行此操作但它不起作用当尝试在启动时访问数据库 DB 帮助程序类时它会崩溃通过应用程序访问数据库帮助程序类时它工作正常这是可能的还是
boost::spirit::karma 输出引号内的字符串

我正在尝试使用 boost spirit karma 转义引号中的字符串如果它只是一个字符串则效果很好但是对于 std vector 中 boost variant 中的字符串则不然只是打印字符串确实有效但是我不太明白为什么
字符串有隐藏字符，无法验证，

大约2小时前我问了一个问题不需要看问题只是一个参考使用node js存储图像出现错误给出的解决方案实际上与我的代码相同我试图找到我的代码和他的代码之间的差异看看他做了什么修改才能使其工作但没有任何修改所以我想到尝试一下在线I
既然“invoke”已被软弃用，那么替代方案是什么？

rlang invoke 现已软弃用 purrr invoke 退休了如今以编程方式调用带有参数列表的函数的简洁方法是什么 tldr Use exec代替invoke use map2 plus exec代替invoke map 示例i
UIImagePickerController 如何隐藏翻转相机按钮？

有没有办法隐藏 UIImagePickerController 内的翻转相机按钮谢谢阅读我最终使用 UIImagePickerController 的自定义子类来解决此和其他问题 import SMImagePickerContro
将包含十六进制值的字节数组转换为十进制值

我正在 c 中进行应用程序这里我想将包含十六进制值的字节数组转换为十进制值假设我有一个字节数组为 array 0 0X4E array 1 0X5E array 2 0X75 array 3 0X49 在这里我想将该十六进制数组转换为
random_state在train_test_split和分类器中的作用

基于这个答案 Scikit learn 中的随机状态伪随机数如果我使用相同的整数比如 42 random state 然后每次进行训练测试分割时它应该给出相同的分割即每次运行期间训练中的数据实例相同测试时的数据实例相同 But
XSLT根据父子元素的值删除子元素

我正在尝试使用这里使用的一些相同的逻辑https stackoverflow com a 10629806 662877 到不同的 XML 但没有得到预期的输出如果 TERR KHM6 则删除剥离这两个元素创建付款项目 and 创建支付
一java内存刷新易失性：一个好的程序设计？

这是与此相关的问题 java 在一个变量上使用易失性 VS 每个变量我有一个或多个不同的对象我想改变其中的某些状态然后我想让该状态对其他线程可见出于性能原因我不想使该对象中的每个成员变量都是易失性的有时我想在单线程应用程序中使
Spring REST 服务：从请求中检索 JSON

我正在 Spring 3 1 上构建 REST 服务我正在使用 EnableWebMVC 注释由于我的服务仅接受 JSON 请求因此我还想将传入请求转储到 MongoDB 集合中以进行日志记录以及稍后的数据转换我想访问原始 JSO
将 Cassandra OrderedMapSerializedKey 转换为 Python 字典

我在 Cassandra 中有一列由列表映射组成当使用 Python 驱动程序查询时它返回一个 OrderedMapSerializedKey 结构该结构是列表的映射我想将整个查询放入 pandas 中要从 OrderedMapS

将 Cassandra OrderedMapSerializedKey 转换为 Python 字典

将 Cassandra OrderedMapSerializedKey 转换为 Python 字典 的相关文章

随机推荐

热门标签

将 Cassandra OrderedMapSerializedKey 转换为 Python 字典的相关文章