带有非独特标签的熊猫

2024-05-26

我正在尝试对数据进行装箱并根据该装箱应用浮点值。我认为 pandas.cut 是实现此目的的工具，但显然它需要每个 bin 标签都有唯一的值。

values = [0.6, 0.5, 0.5, 0.6, 0.8, 0.9]
bins = [0, 2, 5, 10, 15, 25, 200]
binned = pd.cut(original_table[field], bins, labels=values)

>>> ValueError: Categorical categories must be unique

我的数据（original_table）非常大，迭代执行任何操作都非常慢，这就是为什么 cut 是一个有吸引力的工具。有没有解决方法可以让 pd.cut 为此工作？

这是我发现的另一种规避此问题的选择here https://github.com/pandas-dev/pandas/issues/33141#issuecomment-606356700。看起来也很快就会修复

import pandas as pd
import numpy as np


values = [0.6, 0.5, 0.5, 0.6, 0.8, 0.9]
bins = [0, 2, 5, 10, 15, 25, 200]

# Cut it
binned = pd.cut(original_table[field], bins, labels=pd.Categorical(values))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

带有非独特标签的熊猫的相关文章

将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
在Python中获取文件描述符的位置

比如说我有一个原始数字文件描述符我需要根据它获取文件中的当前位置 import os psutil some code that works with file lp lib open path to file p psutil Pro
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe

随机推荐

为什么我们不能在 Map(Java) 上使用 Iterator？

我明白要迭代Map 我需要使用entrySet 方法然后使用Iterator就所得的Set 我觉得这个问题可能很愚蠢但是如何Map完全实现以便使用Iterator直接就可以了据我所理解 Map不是一个集合并且Iterator旨在
OpenSSL HMAC 函数中的意外复杂性

SSL 文档分析这个问题与 OpenSSL 中 HMAC 例程的使用有关由于 Openssl 文档在某些领域有点薄弱分析表明使用 unsigned char HMAC const EVP MD evp md const void ke
使 GetRawInputDeviceInfo 和 RIDI_DEVICEINFO 与 C# 一起使用

我有一个问题我似乎无法使 GetRawInputDeviceInfo 与 RIDI DEVICEINFO 结合使用尝试检索 RID DEVICE INFO 根本不起作用我从函数中得到错误 1 这意味着没有足够的空间来存储 RID DE
机器人/蜘蛛可以利用 Cookie 吗？

我正在尝试检测访客是否是人类我刚刚有了一个想法但不确定这是否可行但是如果我可以在用户的浏览器上存储 cookie 并在他们浏览我的网站时检索它如果我成功检索 cookie 这是否是检测机器人和蜘蛛的好技术精心设计的机器人或蜘蛛
在django中使用uuid查询对象

我正在使用 uuid 创建一个 id 字段该字段是主键如下所示 import uuid class User Profile models Model id models UUIDField primary key True defau
使用 SSH.NET SftpClient 设置扩展文件属性

在使用 Renci SSH NET SFTP 库将文件从 Windows 上传到远程计算机 Ubuntu 16 04 LTS 后我尝试使用扩展文件属性来存储一些信息但属性没有得到保留这就是我尝试设置扩展属性的方式 SftpFileAt
如何获取 3G 调制解调器的 IP 地址？

我的 GPRS 调制解调器有一张 SIM 卡它可以连接Web Web 服务给它一个 IP 号码我需要它像那样 http www your ip address com http www your ip address com 我怎样才
Scrapy CrawlSpider 规则具有多个回调

我正在尝试创建一个实现 scrapy CrawlSpider 的 ExampleSpider 我的 ExampleSpider 应该能够处理仅包含艺术家信息的页面仅包含专辑信息的页面以及其他一些包含专辑和艺术家信息的页面我能够处理前两
结构成员初始化 - 省略具有默认值的属性值

我是 Swift 新手正在关注在线文档具体来说我正在查看初始化 https docs swift org swift book LanguageGuide Initialization html https docs swift or
使用 Objective-C 获取 Photoshop 的动作列表

我正在使用 C 和 Obj C 编写一个与 Photoshop 交互的 OSX 应用程序我一直在使用NSAppleScript使用动态构建的 AppleScript 来驱动 Photoshop 是的这有点可怕我希望能够以不同的方式驱动
GO TO 语句 - Fortran 到 Matlab

我一直在努力将此网格搜索代码从 Fortran 转换为 Matlab 但是我无法正确合并 GO TO 语句我正在尝试使用 while 循环但我认为我需要其他东西来结束搜索任何帮助将不胜感激 vmax 1 0E 15 amax G 1
opensc-pkcs 链接错误

我正在尝试使用在 Redhat linux 5 上构建的 opensc pkcs11 so 但是当我尝试在示例程序中使用时它给出了链接错误 main cpp text 0x265 undefined reference to C Ini
C 指针与 Objective-C 指针

我有 Objective C 背景正在尝试扩展我在 C 方面的知识然而有一件事让我感到困惑那就是 C 和 Obj C 中指针之间的区别正如您在下面的示例中看到的两种语言之间的行为似乎有点不同我想知道您是否可以帮助解释原因 C
Gradle 解析策略 cacheDynamicVersionsFor 不起作用

我想每次都推动 Gradle 重新下载我的 SNAPSHOT 依赖项可以通过以下方式做到这一点 refresh dependencies 但我想以另一种方式以编程方式完成此操作 configurations all resolutionS
SymPy 和 Sage 有什么区别？

有什么区别SymPy http www sympy org and Sage https www sagemath org 又名 SageMath 全面披露我是 SymPy 的首席开发人员您应该了解的第一件事是 SymPy 和 Sage
使用 XSLT 转换 XML 并保留 CDATA（在 Ruby 中）

我正在尝试将包含如下内容的文档转换为另一个文档使 CDATA 与第一个文档中的完全相同但我还没有弄清楚如何使用 XSLT 保留 CDATA 初始 XML
为什么 JSHINT 抱怨这是一种严格的违规行为？

我认为这可能是重复的使用此关键字并揭示模块模式的严格违规 https stackoverflow com questions 6300937 strict violation using this keyword and revealing
C++ 映射插入和查找性能和存储开销

我想存储一个映射integer的关键float内存中的值我大约有 1 3 亿个键相应地也有 1 3 亿个值我的重点是查找性能我必须进行数百万次查找 C STL 库有一个map此类关联数组的类我有几个问题map 存储开销是多少ma
反转或点 kxnxn 矩阵的快速方法

有没有一种快速方法可以使用 numpy 计算 kxnxn 矩阵的逆矩阵在每个 k 切片处计算逆矩阵换句话说有没有办法矢量化下面的代码 gt gt gt from numpy linalg import inv gt gt gt a r
带有非独特标签的熊猫

我正在尝试对数据进行装箱并根据该装箱应用浮点值我认为 pandas cut 是实现此目的的工具但显然它需要每个 bin 标签都有唯一的值 values 0 6 0 5 0 5 0 6 0 8 0 9 bins 0 2 5 10 15 2

带有非独特标签的熊猫

带有非独特标签的熊猫 的相关文章

随机推荐

热门标签

带有非独特标签的熊猫的相关文章