从 pandas 值序列创建 pandas 区间序列

2024-05-27

我能找到的最接近的答案似乎太复杂:如何在 pandas 中创建间隔列? https://stackoverflow.com/a/47396828/575530

如果我有一个看起来像这样的 pandas 数据框:

+-------+
| Value |
+-------+
|     6 |
|    12 |
|    56 |
|    60 |
|   120 |
+-------+

我怎样才能把它变成这样?

+-------+-----------+
| Value | Interval  |
+-------+-----------+
|     6 |           |
|    12 | (6, 12]   |
|    56 | (12, 56]  |
|    60 | (56, 60]  |
|   120 | (60, 120] |
+-------+-----------+

(注意:这是一个非常简化的示例,我的真实数据帧很大,因此性能是一个问题。)


pd.cut https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.cut.html默认为right=True so if 'Value'严格单调递增

df['Interval'] = pd.cut(df.Value, bins=df.Value)
#   Value       Interval
#0      6            NaN
#1     12    (6.0, 12.0]
#2     56   (12.0, 56.0]
#3     60   (56.0, 60.0]
#4    120  (60.0, 120.0]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从 pandas 值序列创建 pandas 区间序列 的相关文章

  • pandas 数据框列表的列表列表

    我有一个列表的列表 最外层列表的长度为 20 单独的类别 中间列表的长度可变 时间戳列表 内部列表的长度为 5 分割每个时间戳 例如 sTimestamps 0 5 Tue Feb 7 10 06 30 2017 Tue Feb 7 10
  • Pandas:多索引列标题

    我有时间序列数据框df看起来像这样 time A B C D E 2011 01 04 15 55 00 0 003452 0 005303 0 016632 0 009611 0 000726 2011 01 04 15 56 00 0
  • 删除通过pandas创建的html表格的边框

    我正在使用 python 脚本在网页上显示数据框 我用了df to html将我的数据框转换为 HTML 但是 默认情况下 它将边框设置为 0 我尝试通过自定义 css 模板来覆盖它 但它不起作用 这是我的熊猫代码 ricSubscript
  • python,在数据框中存储字典

    我构建了一个 pandas 数据框 它在每个单元格中存储一个简单的字典 例如 Sales 0 Revenue 0 我可以通过以下方式从数据帧中检索特定值 df columnA index100 Revenue 但现在我想绘制一个图表 其中包
  • 如何访问数据框中的一行嵌套字典

    我有一个 json 文件 如下所示 file name main question no Q 1 question what is answer user John comment It is defined as value number
  • 从 pandas 数据帧中提取阶段/段以及相应的时间戳

    我有以下数据框 Sleep Stage Time hh mm ss Event Duration s 0 SLEEP S0 23 27 14 SLEEP S0 30 1 SLEEP S0 23 27 44 SLEEP S0 30 2 SLE
  • 使用自定义颜色渐变填充两条线之间的区域

    我正在做一项几乎已经完成的作业 但我想对其添加一些小改动 尝试使用基于温度的颜色图而不是简单的颜色来填充两条线之间的区域 绘制线条的方式本质上使它们成为独立的实体 所以我知道我可能需要两个彼此相遇或重叠的颜色图来完成此任务 但我不太确定如何
  • 如何避免 pandas 在保存的 csv 中创建索引

    我试图在对文件进行一些编辑后将 csv 保存到文件夹中 每次我使用pd to csv C Path of file csv csv 文件有一个单独的索引列 我想避免将索引打印到 csv 我试过 pd read csv C Path to f
  • Pandas:如何根据另一个数据框的值对数据框上的列求和

    我是 Pandas 新手 我正在尝试做以下事情 我有一个名为的数据框comms包含articleID和commentScore列 等等 我有另一个名为arts带有列文章 ID 我需要创建arts一个名为文章评分 每篇文章必须具有articl
  • 如何向 pandas 数据框中的新列添加值?

    我想在 Pandas 数据框中创建一个新的命名列 将第一个值插入其中 然后将另一个值添加到同一列 就像是 import pandas df pandas DataFrame df New column append a df New col
  • pandas.DF() 中的列是否单调递增?

    我可以使用 is monotonic 方法检查 pandas DataFrame 的索引是否单调递增 但是 我想检查其中一列值的值 浮点 整数 是否严格增加 In 13 my df pd DataFrame 1 2 3 5 7 6 9 In
  • pandas 从 csv 文件读取 MultiIndex 数据

    我有一个 MultiIndex csv 文件 我想读入 数据保存在csv文件中 如下 import pandas as pd import numpy as np dfcsv pd read csv FilePath MultiIndex
  • 如何使用 python 从嵌套表结构中识别最终父级?

    我有下表 我的问题是 我如何以编程方式识别最终父级 以下是通过示例解释的规则 the id 5 0的父母是51 0 身份证号51 0没有父母 因此 id5 0的最终父级是51 0 the id 6 0的父母是1 0 身份证号1 0的父母是1
  • pandas python 根据一个或多个其他列的子集更新 A 列的子集

    Edit我修改了下面的部分描述 以澄清 功能 和 组 的含义 修复拼写错误 并包含我尝试过的其他代码 我的熊猫df有 450 万行和 23 列 下表显示了几行df2这是从生成的df 它显示了两组 eeskin and hduquant 和三
  • 如何使用 Python Pandas 制作 DataFrame 切片并在特定切片中“fillna”?

    问题 让我们从 Kaggle 获取泰坦尼克号数据集 我有包含 Pclass 性别 和 年龄 列的数据框 我需要用特定组的中位数填充 年龄 列中的 NaN 如果是来自一等的女性 我想用一等女性的中位数填写她的年龄 而不是整个年龄列的中位数 问
  • 对多索引进行排序,同时尊重其索引结构

    如何在尊重级别组织的同时对多索引数据框进行排序 例如 鉴于以下df 假设我们根据C 例如按降序排列 C D E A B bar one 0 346528 1 528538 1 three 0 136710 0 147842 1 flux s
  • python pandas 中的双端队列

    我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
  • 在 NetworkX 中使边缘更粗

    student id 0 1 2 3 4 5 6 7 8 9 10 11 12 0 131X1319 1 14 6 16 1 10 8 15 15 17 15 18 16 1 13212YX3 1 1 4 8 11 9 14 7 0 3 0
  • 跨行对 Pandas 数据框进行分组 - 2.0

    进一步这个问题跨行对 Pandas 数据框进行分组 https stackoverflow com questions 46995997 grouping pandas dataframe across rows 操作是 amount cl
  • 如何替换 pandas 数据框列中的重音符号

    我有一个数据框dataSwiss其中包含瑞士城市的信息 我想用普通字母替换带有重音符号的字母 这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d

随机推荐