如何在极坐标中的多个条件下使用“when”、“then”和“otherwise”？

2023-12-26

我有一个包含三列的数据集。将检查 A 列中的字符串。如果字符串匹配foo or spam，同一行中其他两列的值L and G应该改为XX。为此我尝试了以下方法。

df = pl.DataFrame(
    {
        "A": ["foo", "ham", "spam", "egg",],
        "L": ["A54", "A12", "B84", "C12"],
        "G": ["X34", "C84", "G96", "L6",],
    }
)
print(df)

shape: (4, 3)
┌──────┬─────┬─────┐
│ A    ┆ L   ┆ G   │
│ ---  ┆ --- ┆ --- │
│ str  ┆ str ┆ str │
╞══════╪═════╪═════╡
│ foo  ┆ A54 ┆ X34 │
│ ham  ┆ A12 ┆ C84 │
│ spam ┆ B84 ┆ G96 │
│ egg  ┆ C12 ┆ L6  │
└──────┴─────┴─────┘

预期结果

shape: (4, 3)
┌──────┬─────┬─────┐
│ A    ┆ L   ┆ G   │
│ ---  ┆ --- ┆ --- │
│ str  ┆ str ┆ str │
╞══════╪═════╪═════╡
│ foo  ┆ XX  ┆ XX  │
│ ham  ┆ A12 ┆ C84 │
│ spam ┆ XX  ┆ XX  │
│ egg  ┆ C12 ┆ L6  │
└──────┴─────┴─────┘

我试过这个

df = df.with_column(
    pl.when((pl.col("A") == "foo") | (pl.col("A") == "spam"))
    .then((pl.col("L")= "XX") & (pl.col( "G")= "XX"))
    .otherwise((pl.col("L"))&(pl.col( "G")))
)

然而，这是行不通的。有人可以帮我弄这个吗？

要将多列设置为相同的值，您可以使用：

df.with_columns(
   pl.when(pl.col("A").is_in(["foo", "spam"]))
     .then(pl.lit("XX"))
     .otherwise(pl.col("L", "G"))
     .keep_name()
)

shape: (4, 3)
┌──────┬─────┬─────┐
│ A    ┆ L   ┆ G   │
│ ---  ┆ --- ┆ --- │
│ str  ┆ str ┆ str │
╞══════╪═════╪═════╡
│ foo  ┆ XX  ┆ XX  │
│ ham  ┆ A12 ┆ C84 │
│ spam ┆ XX  ┆ XX  │
│ egg  ┆ C12 ┆ L6  │
└──────┴─────┴─────┘

.is_in()可以使用而不是多个== x | == y chains.

要使用不同的值一次更新多个列，您可以使用.map()和一本字典：

df.with_columns(
   pl.when(pl.col("A").is_in(["foo", "spam"]))
     .then(pl.col("L", "G").map(
        lambda col: {
           "L": "XX",
           "G": "YY",
        }.get(col.name)))
     .otherwise(pl.col("L", "G"))
)

shape: (4, 3)
┌──────┬─────┬─────┐
│ A    ┆ L   ┆ G   │
│ ---  ┆ --- ┆ --- │
│ str  ┆ str ┆ str │
╞══════╪═════╪═════╡
│ foo  ┆ XX  ┆ YY  │
│ ham  ┆ A12 ┆ C84 │
│ spam ┆ XX  ┆ YY  │
│ egg  ┆ C12 ┆ L6  │
└──────┴─────┴─────┘

使用时.map整个列都被传递（作为pl.Series）意味着您也可以根据需要操纵它：

df.with_columns(
   pl.when(pl.col("A").is_in(["foo", "spam"]))
     .then(pl.col("L", "G").map(
        lambda col: {
           "L": col.str.to_lowercase(),
           "G": "prefix_" + col
        }.get(col.name)))
     .otherwise(pl.col("L", "G"))
)

shape: (4, 3)
┌──────┬─────┬────────────┐
│ A    ┆ L   ┆ G          │
│ ---  ┆ --- ┆ ---        │
│ str  ┆ str ┆ str        │
╞══════╪═════╪════════════╡
│ foo  ┆ a54 ┆ prefix_X34 │
│ ham  ┆ A12 ┆ C84        │
│ spam ┆ b84 ┆ prefix_G96 │
│ egg  ┆ C12 ┆ L6         │
└──────┴─────┴────────────┘

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pythonpolars

如何在极坐标中的多个条件下使用“when”、“then”和“otherwise”？的相关文章

Python Polars 消耗大量内存并花费更长的时间

这就是我正在尝试做的事情使用 Polars 惰性数据框扫描 csv 使用函数格式化电话号码删除空值和重复项将 csv 写入新文件中这是我的代码 import sys import json import polars as pl i
如何从极坐标中的日期时间列中提取日期

我正在尝试从熊猫转移到极地但遇到了以下问题 import polars as pl df pl DataFrame integer 1 2 3 date 2010 01 31T23 00 00 00 00 2010 02 01T00 00
极坐标对列表列中的元素进行计数

我有带列的数据框b对于列表元素我需要创建列c计算列表中每一行的元素数量这是 Pandas 中的玩具示例 import pandas as pd df pd DataFrame a 1 2 3 b 1 2 3 2 5 0 a b 0 1
如何在Polars中按数据类型选择列？

在 pandas 中我们有pandas DataFrame select dtypes根据选择某些列的方法dtype 在 Polars 中是否有类似的方法来做这样的事情可以将数据类型传递给pl col import polars as p
Polars 将 array[string] 列聚合到 set[str] 中

我有极地数据框 df pl DataFrame col1 aaa aaa bbb ccc ccc ddd ddd ddd ddd ddd col2 a a a a col3 x x y y 我想将 col2 col3 分组并将 col1 聚
根据列聚合过滤选定的列

我希望仅选择唯一值少于 3 个的列我可以通过生成布尔掩码pl all n unique lt 3 但我不知道是否可以通过 Polars API 使用该掩码目前我正在通过 python 解决这个问题有更惯用的方法吗 import po
使用 Polars 生成运行记录，其中一个月的期末余额将成为下个月的期初余额

我想在给定初始期初余额的情况下生成一段时间内的运行计数模拟例如一个虚构的企业从 1000 美元开始在任何一个月内都会经历随机的盈利和亏损 12 个月后这家企业可能会赚多少钱我的问题是我可以生成所需的列但无法弄清楚如何在不破坏当
使用另一个列表作为极坐标中的布尔掩码的过滤器列表

我有一个包含两列的极坐标数据框其中两列都是列表 df pl DataFrame a True False False True b name1 name2 name3 name4 df shape 2 2 a b list bool li
如何在极坐标中的多个条件下使用“when”、“then”和“otherwise”？

我有一个包含三列的数据集将检查 A 列中的字符串如果字符串匹配foo or spam 同一行中其他两列的值L and G应该改为XX 为此我尝试了以下方法 df pl DataFrame A foo ham spam egg L A54
Polars的replace_time_zone和convert_time_zone对于相同的时区转换显示不同的字符串表示形式

测试数据 import polars as pl import pandas as pd from datetime import date time datetime polars df for Jan to 12th March 202
在 Polars 中轻松将字符串列转换为 pl.datetime

考虑一个带有一列的 Polars 数据框str表示日期格式的类型 27 July 2020 我想将此列转换为polars datetime类型与Python标准不同datetime 以下代码使用标准datetime格式有效但 Pola
如何将 Spark 数据帧转换为 Polars 数据帧？

我想知道如何将 Spark 数据帧转换为 Polars 数据帧假设我在 PySpark 上有这段代码 df spark sql select from tmp 我可以使用以下命令轻松地将其转换为 pandas 数据框 toPandas 极
长 .when().then().when().then().otherwise() 链的替代方案

是否有一些聪明的替代方法可以编写长的when then otherwise 链而不对值进行硬编码请参见下面的示例假设我们有以下数据框 df pl DataFrame Market AT AT DE DE CA DE UK US Numb
在极坐标中转换字符串时如何处理夏季和冬季的时间戳

我正在尝试将字符串时间戳从我的相机放入原始文件元数据的时间戳转换为极地日期时间但是当我同时拥有夏季和冬季时间的时间戳时极地会抛出此错误 ComputeError Different timezones found during strp
极坐标比 numpy 慢？

我正在考虑使用polars代替numpy在一个解析问题中我将结构化文本文件转换为字符表并对不同的列进行操作然而似乎polars大约慢5倍numpy在我执行的大多数操作中我想知道为什么会出现这种情况以及我是否做错了什么polars应该
如何限制极坐标的显示宽度，以便以清晰的方式打印宽数据帧？

考虑下面的例子 pd set option display width 50 pl DataFrame data np random randint 0 20 size 10 42 columns list abcdefghijklmnop
Polars 从日期时间对象中添加/减去 UTC 偏移量

我想添加减去UTC极坐标中日期时间对象的偏移量通常以小时为单位但我似乎没有找到实现此目的的方法鉴于日历年中存在夏令时 UTC 偏移量可以是动态的例如 EST EDT 映射到 5 4 小时UTC分别偏移 from datetime
Polars：如何添加带有数字的列？

in pandas df new a where a是一个数字系列或只是一个数字而在polars我们可以添加一个char df with column pl all pl lit str alias new 但如何添加数字系列或数字作为新
如何使用 Polars 按值列表过滤 df？

我有来自 csv 的 Polars df 我尝试按值列表过滤它 list 1 2 4 6 48 df pl read csv bm dat sep new columns cid1 cid2 cid3 lazy filter pl col
从极坐标中的日期时间列检索日期

目前当我尝试从极坐标日期时间列中检索日期时我必须写一些东西如同 df pl DataFrame time dt datetime now df df select pl col pl col time apply lambda x x

随机推荐

悄悄更新正在进行的通知

我有一项可以无线连接到其他设备的服务启用该服务后我会收到一条持续通知表明该服务已启用启用服务后用户即可连接到另一台设备此时我想更新正在进行的通知以说明已连接的设备的名称这很容易通过调用来完成startForeground O
并发链表

我正在尝试用 C 设计一个允许并发访问的链表显然对该列表使用单个锁的效率非常低因为不相交的区域可能会并行更新现在除了为每个节点存储一个锁之外我还有什么选择另外在这种情况下非阻塞版本会是更好的选择吗有相关链接吗 EDIT 谢谢
非常短的 jQuery 图像幻灯片

我正在寻找使用 jQuery 创建淡入淡出图像幻灯片的最短方法我在谷歌上找到的例子总是有很多不必要的特殊内容我很难理解它们幻灯片需要投射到现有图像上 img src myImage jpg 使用以下图像 imgArray img1 j
Spring mvc @RequestBody如何使用@EmbeddedId解析JPA实体

我有 2 个实体 User 和 UserAlias 用户有复合PK 我有一些疑问如何在 Spring MVC 控制器中解析 JSON 以填充 User 和 UserPK 对象例如使用以下数据 id 1 名称新用户别名别名1 别名2
Qt Creator 找不到标头（显示：“没有这样的文件或目录”）

我如何告诉 Qt Creator 2 4 1 基于 Qt 4 7 4 32 位在哪里查看默认情况下对于头文件当我在 Qt Creator 中打开一个 C 文件并说 include
是否可以使用 JPA 和 hibernate 扫描 jar 文件中的实体

我有以下情况项目 A 包含几个实体并且是独立的项目 B 包含几个实体并且是独立的项目 C 包含很少的实体并且依赖于项目 A 和项目 B 我正在使用 Maven 来管理依赖项和构建当我尝试测试项目 A 和项目 B 时一切进展顺利
Android 在视图内启动应用程序

好吧我有一个应用程序我想使用其他应用程序例如我有一个应用程序除了目录查找之外它可以执行很多操作因为已经有一个应用程序可以为我的学校执行此操作我知道我可以有意图地启动应用程序但这也会使它们远离我的应用程序的导航菜单无论如何
将纬度/经度转换为城市名称？（反向地理定位）

我正在 Codeigniter PHP jQuery 中创建一个工作委员会雇主可以在其中输入他们的位置我们使用 Google 地图 API 来绘制它虽然这已经产生了很棒的可用性结果但问题是当我们尝试向求职者显示这些位置时他们会感
WPF 如何存储语言字典？

根据https msdn microsoft com en us library system windows controls spellcheck v vs 110 aspx https msdn microsoft com en us
Python Pandas 跨列累积和并在另一个新列中获取结果

我有包含 col1 col10 的数据框我想计算跨列的累积总和并动态创建新列即 cum col1 cum col10 我研究了 cumsum 但这给出了最终的累积和如何在创建新列时实现累积总和数据框看起来像 id col1 col2
imagecreatefrompng 根本不起作用

我已经用 mime 类型检查了文件如果是 jpg 或 gif 则可以完美使用 src imagecreatefromjpeg tmpName and src imagecreatefromgif tmpName 但如果图像是png src
重复单词的正则表达式

我是正则表达式新手我不太清楚如何编写一个正则表达式来匹配任何重复的连续单词例如巴黎在the the spring Not 那个那个相关的你笑什么是my my正则表达式那么糟糕是否有一个正则表达式可以匹配上面所有的粗体字符串
使用 Notepad++ 通过 FTP 连接到服务器

我正在使用 Notepad 6 5 3 版本来编辑我的文件我想使用 Notepad 连接到我的服务器我使用这个方法打开 Notepad gt 插件 gt NppFTP gt 显示 NppFTP 窗口在 NppFTP 窗口中 Cli
在 .NET 中将复杂的布尔条件从字符串转换为布尔值

我需要将复杂的表达式从字符串解析为布尔值它只能包含布尔值真假括号 AND OR 操作数 Eg bool Parse true false false false true false 知道如何实现这一目标吗这是一个狡猾的评估器类
Elasticsearch - IndicesClient.put_settings 不起作用

我正在尝试更新我原来的索引设置我的初始设置如下所示 client create index movies body settings number of shards 1 number of replicas 0 analysis fil
iPhone“书签到主屏幕”会删除 cookie 和会话吗？

现在我正在开发一个基于网络的应用程序用户必须首先登录当我通过 iPhone Safari 打开页面登录并重新启动 Safari 时我仍然处于登录状态 Cookie 和会话 ID 仍然设置但是当我使用添加到主屏幕添加此页面时
spring Net 与企业库

我一直在网上搜索有关网络框架的信息从现在起我可以在我的项目中使用它来保留它我几乎已经做出了决定但我想要一些关于该方向的参考信息市场正在继续发展我在谷歌中找不到任何关于哪个是最常用的哪个最有未来等等的信息我也一直在阅读其他框架
CoreAnimation CALayer 和 CATextLayer 组合

I am just playing around with CA lately Now I am kind of stuck This is the thing I want to animate 就目前而言我已经让圆形动画正常工作了我
gradle.buildStarted 未触发

我无法在我的 gradle 构建中触发 buildStarted 不确定我做错了什么我有一个像这样的根项目 gradle 文件版本 1 0 buildscript repositories maven url http repo jfr
如何在极坐标中的多个条件下使用“when”、“then”和“otherwise”？

我有一个包含三列的数据集将检查 A 列中的字符串如果字符串匹配foo or spam 同一行中其他两列的值L and G应该改为XX 为此我尝试了以下方法 df pl DataFrame A foo ham spam egg L A54

如何在极坐标中的多个条件下使用“when”、“then”和“otherwise”？

如何在极坐标中的多个条件下使用“when”、“then”和“otherwise”？ 的相关文章

随机推荐

热门标签

如何在极坐标中的多个条件下使用“when”、“then”和“otherwise”？的相关文章