如何根据条件在 Pandas 中构建新列(新列应输出字符串)

2024-02-15

我正在尝试使用条件在 pandas 中创建一个列来创建定性观察。

例如,如果数据框如下所示:

      Distance      
1     1              
2     5                        
3     40              
4     15 

我想创建一个新列(我们称之为df['length'])这是对距离的观察。

例如:

if df[Distance] = 1:
  print('Short')

我希望将“Short”输入到符合条件的每一行的新列中。

或者例如:

if df[Distance] > 10:
  print('Long')

我希望符合新列中条件的每一行都是“长”。

我该怎么做呢?

我正在尝试将其写入函数中。这就是我现在所拥有的:

def trip_distance(row):    

    df = pd.read_csv('taxi_january_standard_rate.csv')

    if df['trip_distance'] > 50 :
        return "Long"

然后我尝试使用它来填充新列:

df['trip_length'] = df.apply(trip_distance , axis=1)

但它似乎不起作用。它给了我一个错误:

('Series 的真值不明确。使用 a.empty, a.bool(), a.item()、a.any() 或 a.all().', '出现在索引 0 处')

基本上,我试图对出租车数据集中的一列进行 5 个定性描述,其中对于大于某个值的每个距离,我将其描述为“长”,或者如果它接近平均值,我将其描述为“平均”等


你需要np.where https://docs.scipy.org/doc/numpy/reference/generated/numpy.where.html

 import numpy as np
 df['Length']=np.where(df['Distance']>10,'Long','Short')

如果你想要多个条件,请使用@sacul解决方案,使用np.选择 https://docs.scipy.org/doc/numpy/reference/generated/numpy.select.html

df['length'] = np.select([df.Distance < 2, df.Distance > 10], ['short', 'long'], 'average')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何根据条件在 Pandas 中构建新列(新列应输出字符串) 的相关文章

  • VSCode Settings.json 丢失

    我正在遵循教程 并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区 但是当我在 VSCode 中打开设置时 工作区设置 选项卡不在 用户设置 选项卡旁边 我还尝试通过以下方式手动转到文件 APPDATA Code User s
  • 我应该使用 Python 双端队列还是列表作为堆栈? [复制]

    这个问题在这里已经有答案了 我想要一个可以用作堆栈的 Python 对象 使用双端队列还是列表更好 元素数量较少还是数量较多有什么区别 您的情况可能会根据您的应用程序和具体用例而有所不同 但在一般情况下 列表非常适合堆栈 append is
  • 嵌套列表的重叠会产生不必要的间隙

    我有一个包含三个列表的嵌套 这些列表由 for 循环填充 并且填充由 if 条件控制 第一次迭代后 它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件 它们不重叠 在第二次迭代之后 新
  • 在 Django Admin 中调整字段大小

    在管理上添加或编辑条目时 Django 倾向于填充水平空间 但在某些情况下 当编辑 8 个字符宽的日期字段或 6 或 8 个字符的 CharField 时 这确实是一种空间浪费 字符宽 然后编辑框最多可容纳 15 或 20 个字符 我如何告
  • Tensorboard SyntaxError:语法无效

    当我尝试制作张量板时 出现语法错误 尽管开源代码我还是无法理解 我尝试搜索张量板的代码 但不清楚 即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
  • Python 内置的 super() 是否违反了 DRY?

    显然这是有原因的 但我没有足够的经验来认识到这一点 这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
  • 如何将 GAE 中一种 Kind 中的所有实体复制到另一种 Kind 中,而无需显式调用每个属性

    我们如何使用function clone entity 如中所述在 Python 中复制 Google App Engine 数据存储中的实体 而无需在 编译 时知道属性名称 https stackoverflow com question
  • Pandas 组合不同索引的数据帧

    我有两个数据框df 1 and df 2具有不同的索引和列 但是 有一些索引和列重叠 我创建了一个数据框df索引和列的并集 因此不存在重复的索引或列 我想填写数据框df通过以下方式 for x in df index for y in df
  • 找到一个数字所属的一组范围

    我有一个 200k 行的数字范围列表 例如开始位置 停止位置 该列表包括除了非重叠的重叠之外的所有类型的重叠 列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围 并对 100k 个数字重复该
  • 无效的选择器:使用 Selenium 时不允许出现复合类名错误

    我正在尝试通过 Web Whatsapp 打印聊天中的一条消息 我可以通过 控制台 选项卡中的 Javascript 来完成此操作 我就是这样做的 recived msg document getElementsByClassName XE
  • Protobuf 如何编码 oneof 消息结构

    对于这个 python 程序 在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
  • 如何以正确的方式为独立的Python应用程序制作setup.py?

    我读过几个类似的主题 但还没有成功 我觉得我错过或误解了一些基本的事情 这就是我失败的原因 我有一个用 python 编写的 应用程序 我想在标准 setup py 的帮助下进行部署 由于功能复杂 它由不同的 python 模块组成 但单独
  • 每当使用 import cv2 时 OpenCV 都会出错

    我在终端上使用 pip3 install opencv contrib python 安装了 cv2 并且它工作了 但是每当我尝试导入 cv2 或运行导入了 cv2 的 vscode 文件时 在 python IDLE 上它都会说 Trac
  • 制作一份 Python 文档的 PDF 文件

    Python 官方网站提供 PDF 文档下载 但它们是按章节分隔的 我下载了源代码并构建了 PDF 文档 这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件 我认为这样阅读起来会更方便 如果连接单独
  • 如何从pandas中的多列计算多列

    我正在尝试使用函数从 pandas 数据框中的多个列计算多个列 该函数采用三个参数 a b 和 c 并返回三个计算值 sum prod 和 quot 在我的 pandas 数据框中 我有三个列 a b 和 c 我想从中计算列 sum pro
  • 如何将 Django 中的权限添加到模型并使用 shell 进行测试

    我在模型中添加了 Meta 类并同步了数据库 然后在 shell 中创建了一个对象 它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
  • 等待子进程使用 os.system

    我用了很多os system在 for 循环内调用创建后台进程 如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
  • 如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

    Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
  • python 对浮点数进行不正确的舍入

    gt gt gt a 0 3135 gt gt gt print 3f a 0 314 gt gt gt a 0 3125 gt gt gt print 3f a 0 312 gt gt gt 我期待 0 313 而不是 0 312 有没有
  • 如何在Python脚本中从youtube-dl中提取文件大小?

    我是 python 编程新手 我想在下载之前提取视频 音频大小 任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

  • SQL SELECT 每月的第一天和最后一天。

    最亲爱的专业人士 我构建了一个查询来获取当月的第一天和最后一天 但该月第一天的时间戳有问题 declare FirstDOM datetime LastDOM datetime set FirstDOM select dateadd dd
  • Sqlite 获取最大 id 不起作用(?)

    我用这个 SELECT WHERE id MAX id FROM history 但我的查询是空的 我也尝试过这个 这个有效 SELECT MAX id AS max id FROM history 但显然我的查询只包含 max id 键
  • 在java中将美元(大十进制)转换为美分(整数)的最佳方法是什么?

    我必须将我的网络应用程序与支付网关集成 我想输入美元总金额 然后将其转换为美分 因为我的支付网关库接受美分金额 类型Integer 我找到Big Decimal在java中是操纵货币的最佳方式 目前我输入的金额为 50 美元 并将其转换为I
  • SQL Server 和 Java 之间的时间戳差异

    我需要将一个简单的过程从 Java 代码复制到 SQL Server 存储过程 它将进入生产中的 SQL Azure 数据库 但我正在针对本地 SQL Express 12 安装对其进行测试 该存储过程的一部分是将一些值连接成一个字符串 这
  • SSIS 和 MySQL - 表名分隔符问题

    我正在尝试使用 SQL Server 2008 SSIS 将行从 Access 数据库插入 MySQL 数据库 TITLE Microsoft SQL Server Management Studio ERROR 42000 MySQL O
  • 删除重复的文件扩展名

    我有数千个名为 filename gz gz gz gz gz gz gz gz gz gz gz 的文件 我正在使用这样的 find 命令find name gz 找到这些文件并使用 exec或者通过管道连接到 xargs 并使用一些神奇
  • 无法访问 sencha 中整个控制器的全局变量

    我一直在尝试访问一个控制器内的全局值 但无法访问它 我一直在关注这个如何在sencha中定义全局变量 https stackoverflow com questions 18095037 how to define global varia
  • C3.js将折线图Y轴的标签位置更改为Y轴居中

    我需要更改 Y 轴标签在 Y 轴上的位置 当前的六个位置选项无法满足我的场景 我也尝试使用 d3 进行自定义 但仍然没有成功 我创建了一个plnkr http plnkr co edit WzXVForyGJP01WJlAXj5 p pre
  • 由于随机效应,lme 发出警告消息

    我有一个包含 5 个变量的数据框 批次 晶圆 序列号 电压 放大倍数 在此数据框中 有 1020 个按 Serial number 分组的子集 每个子集都有一定数量的测量数据点 电压放大 我将数据与 summary fit2 lme lt
  • 是否可以创建 DbContext 接口或抽象类并使用它来注入不同的 DbContext 对象?

    我有一个软件产品 数据库是在 SQLServer 上创建的 表和列名称是由开发团队定义的 然后使用数据库优先方法将模型导入到 Visual Studio 现在我们正在为其他公司开发相同类型的解决方案使用 ORACLE 并请求表和列的命名约定
  • MongoDB:对数据库的读/写是否并发?

    当百万个线程尝试执行时会发生什么read from and write to MongoDB同时 锁定是否发生在db level table level or row level 它发生在数据库级别 但是在 Mongo 2 0 中 有一些并
  • matplotlib 等高线图:对数刻度中的比例颜色条级别

    是否可以将颜色条的级别设置为对数比例 如下图所示 这是一些可以实现的示例代码 import matplotlib pyplot as plt import numpy as np from matplotlib colors import
  • 解决WinForms中的跨线程异常

    目前我正在使用 WinForms C 语言 并且必须在后台运行该应用程序 为此 我使用异步 当我运行该应用程序时 它显示一个异常 例如 跨线程操作无效 从创建它的线程以外的线程访问控制 我该如何解决这个错误 当对控件进行方法调用时 如果调用
  • 哪里可以获取其他 iOS 版本的 iOS 系统符号

    请注意 我要求提供一个可以下载这些符号的地方 或者要求一个明确的答案 此类网站被 Apple 禁止 重复 问题与我在问题中链接的问题类似 唯一建议的答案是访问物理设备或找到另一位拥有物理设备的开发人员 我已经符号化了故障转储 但只有我的应用
  • PHP 字符串转数组

    我有一个字符串 当我 var dump 返回以下内容时 string 20 key1 key1 value key2 key2 value 如何将其转换为一个数组 在 var dump 时返回以下内容 array 2 key1 gt str
  • MVC 5 阻止通过 Iframe 访问内容

    自从从 MVC4 升级到 MVC5 以来 我注意到我的网页中添加了一个额外的服务器标头 X 框架选项 SAMEORIGIN 我了解添加此标签的安全优势 但其中一个页面应该包含在其他项目 在其他域上 的 iframe 中 这个额外的标头会阻止
  • 将 git hook 添加到谷歌云存储库

    谷歌云附带的功能之一是git 仓库 https cloud google com source repositories docs 是否可以向此存储库添加挂钩 我想要收到推送 但我不知道如何访问 git hooks 如果您将代码托管在git
  • 假互联网差

    我正在尝试在网络状况不佳的情况下测试我的 iPhone 和 Android 应用程序 我记得不久前我读到过一个程序 它可以伪造不同类型的不良互联网 有谁记得这个程序叫什么或者是否有类似的东西我可以用来完成这个任务 对于 iOS 正如其他人所
  • 如何将自定义 HTML 内容添加到 FastAPI Swagger UI 文档?

    我需要在 FastAPI 应用程序的 Swagger UI 中添加一个自定义按钮 我发现这个答案 https stackoverflow com questions 74661044 add a custom javascript to t
  • 如何根据条件在 Pandas 中构建新列(新列应输出字符串)

    我正在尝试使用条件在 pandas 中创建一个列来创建定性观察 例如 如果数据框如下所示 Distance 1 1 2 5 3 40 4 15 我想创建一个新列 我们称之为df length 这是对距离的观察 例如 if df Distan