在同一列上多次调用 Pandas df.sort_values() 会产生不同的结果？

2024-04-05

下面的例子......为什么会发生这种情况以及如何防止它？

>>> df = pd.DataFrame({'a': list(range(150)), 'b': [1, 2, 3] * 50})
>>> df.sort_values('b').equals(df.sort_values('b').sort_values('b'))
False
>>> df.sort_values('b').head()
       a  b
0      0  1
39    39  1
42    42  1
45    45  1
132  132  1
>>> df.sort_values('b').sort_values('b').head()
       a  b
0      0  1
87    87  1
120  120  1
84    84  1
81    81  1

对我来说工作指定mergesort就像只有一种稳定的排序方法DataFrame.sort_values http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sort_values.html，因为如果仅按一列排序是默认方法kind=quicksort:

kind{‘快速排序’、‘合并排序’、‘堆排序’}，默认快速排序

排序算法的选择。另请参阅 ndarray.np.sort 了解更多信息。归并排序是唯一稳定的算法。对于 DataFrame，此选项仅在对单个列或标签进行排序时应用。

如果按多列排序默认是mergesort.

print (df.sort_values('b', kind='mergesort').head())
     a  b
0    0  1
3    3  1
6    6  1
9    9  1
12  12  1

print (df.sort_values('b', kind='mergesort').sort_values('b', kind='mergesort').head())
     a  b
0    0  1
3    3  1
6    6  1
9    9  1
12  12  1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

在同一列上多次调用 Pandas df.sort_values() 会产生不同的结果？的相关文章

如何在 Pandas Python 中按 id 对行进行排名

我有一个像这样的数据框 id points1 points2 1 44 53 1 76 34 1 63 66 2 23 34 2 44 56 我想要这样的输出 id points1 points2 points1 rank points2
Python 不考虑 distutils.cfg

我已经尝试了给出的所有内容并且所有教程都指向相同的方向即使用 mingw 作为 python 而不是 Visual C 中的编译器我确实有 Visual C 和 mingw 当我想使用 pip 安装时问题开始出现它总是给Unabl
使用 Tkinter 打开网页

因此我的应用程序需要能够打开其中的单个网页并且它必须来自互联网并且未保存特别是我想使用 Tkinter GUI 工具包因为它是我最熟悉的工具包最重要的是我希望能够在窗口中生成事件例如单击鼠标但无需实际使用鼠标有什么好的方法
Python speedtest.net，或等效的[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案是否有一个 Python 库可以实现 SpeedTest net 测试或等效的互联网连接速度测试 GitHub上有一个项目叫速度检查 https gi
NSUserNotificationCenter.defaultUserNotificationCenter() 使用 PyInstaller 返回 None

我正在尝试将通知发送到通知中心 Mac OSX 我正在使用 PyObjC 绑定来使用我们的 python 应用程序中的 cocoa api 我正在使用以下代码片段 import Foundation import objc NSUserNo
会话数据库表清理

该表是否需要清除或者由 Django 自动处理 Django 不提供自动清除功能然而有一个方便的命令可以帮助您手动完成此操作 Django 文档清除会话存储 https docs djangoproject com en dev to
了解 Python 2.7 中的缩进错误

在编写 python 代码时我往往会遇到很多缩进错误有时当我删除并重写该行时错误就会消失有人可以为菜鸟提供 python 中 IndentationErrors 的高级解释吗以下是我在玩 CheckIO 时收到的最近 inden
使用 python 脚本更改 shell 中的工作目录

我想实现一个用户态命令它将采用其参数之一路径并将目录更改为该目录程序完成后我希望 shell 位于该目录中所以我想实施cd命令但需要外部程序可以在 python 脚本中完成还是我必须编写 bash 包装器 Example t
Pandas 合并指标自定义值

在 pandas 合并期间将指示器更新为更友好的消息的最快方法是什么默认indicator True yields left only right only both 我想更新为Only present in last month s d
pandas groupby 操作缺少数据

在 pandas 数据框中我有一列如下所示 0 M 1 E 2 L 3 M 1 4 M 2 5 M 3 6 E 1 7 E 2 8 E 3 9 E 4 10 L 1 11 L 2 12 M 1 a 13 M 1 b 14 M 1 c 15
如何从邻接表高效创建稀疏邻接矩阵？

我正在与last fm http labrosa ee columbia edu millionsong lastfm数据集来自百万歌曲数据集 http labrosa ee columbia edu millionsong 数据以一组 j
在Python中使用pil读取tif图像时出现值错误？

我必须读取尺寸的tif图像2200 2200并输入 uint16 我将 PIL 库与 anaconda python 一起使用如下所示 from PIL import Image img Image open test tif img i
将 Django 中的所有视图限制为经过身份验证的用户

我是 Django 新手我正在开发一个项目该项目有一个登录页面作为其索引和一个注册页面其余页面都必须仅限于登录用户如果未经身份验证的用户尝试访问这些页面则必须将他她重定向到登录页面我看到 login required装饰器会将
Spark 数据帧：根据另一列的值提取一列

我有一个包含带有连接价目表的交易的数据框 paid currency EUR USD GBP 49 5 EUR 99 79 69 客户已支付 49 5 欧元如货币列中所示我现在想将支付的价格与价目表中的价格进行比较因此我需要根据
如何检测一个二维数组是否在另一个二维数组内？

因此在堆栈溢出成员的帮助下我得到了以下代码 data needle s which is a png image base64 code goes here decoded data decode base64 f cStringIO
如何在引发异常时将变量传递给异常并在异常时检索它？

现在我只有一个空白的异常类我想知道如何在引发变量时给它一个变量然后在 try except 中处理它时检索该变量 class ExampleException Exception pass 为其构造函数提供一个参数将其存储为属性然后
类返回语句不打印任何输出

我正在学习课程但遇到了问题return语句它是语句吗我希望如此程序什么也没有打印出来它只是结束而不做任何事情 class className def createName self name self name name def
tf.print() vs Python print vs tensor.eval()

看来在Tensorflow中至少有三种方法可以打印出张量的值我一直在读here https www freecodecamp org news debugging tensorflow a starter e6668ce72617 an
PyQt5按钮lambda变量变成布尔值[重复]

这个问题在这里已经有答案了当我运行下面的代码时它显示如下为什么 x 不是 x 而是变成布尔值这种情况仅发生在传递到用 lambda 调用的函数中的第一个参数上错误的 y home me model some file from P
Tkinter 将鼠标点击绑定到框架

我一定错过了一些明显的东西我的 Tkinter 程序中有两个框架每个框架在网格布局中都有一堆标签我想将鼠标点击绑定到其中一个而不是另一个我目前使用 root bind

随机推荐

C++ 中集合集合的高效集合交集

我有一个收藏std set 我想以最快的方式找到这个集合中所有集合的交集集合中的集合数量通常非常小 5 10 每个集合中的元素数量通常小于 1000 但偶尔会达到 10000 左右但是我需要进行数十次这些交集数千次尽可能快我尝试对以
WPF 的免费字体和颜色选择器？

我正在为 WPF 寻找一些好的字体选择器和颜色选择器组件我试图找到一些标准解决方案例如 Winforms 组件但似乎没有我想知道为什么它不一定是完美的代码项目中的一些东西就足够了但我更喜欢好看且直观易用的组件谢谢 Look
响应式 SVG 图像蒙版

我使用 SVG 作为图像蒙版但我不知道如何在调整页面大小时使 SVG 改变其大小当我更改窗口大小时 SVG 内的图像会调整大小但 SVG 不会关于如何解决这个问题有什么想法吗这是 SVG 代码
避免在 Swift 中使用连续的“if let”声明[重复]

这个问题在这里已经有答案了在斯威夫特我用过if let声明来检查我的对象是否不是nil if let obj optionalObj 但有时候我不得不面对连续的if let声明 if let obj optionalObj if let
支持多个Python模块版本（具有相同版本的Python）

我环顾四周但找不到我的问题的明确答案我非常合理地需要支持同一 Python 模块的 N 个版本如果它们存储在同一个包目录中则它们必须具有唯一的名称如下例所示 some package my module 1 0 py some
通过 JavaScript 正则表达式获取 url 路径名的一部分

我有以下网址 https www example com article f 1 test article 我需要通过 JavaScript 纯 JavaScript 从 url 中获取 1 部分我知道我可以用 location path
knockoutjs 中的滑动动作绑定

我在我的应用程序中使用淘汰赛作为主要框架它必须支持平板电脑和移动设备由于框架是基于绑定处理程序构建的我想知道如何实现对操作如滑动和其他特定于设备的操作的自定义绑定或者也许有类似的事情完成可能为时已晚但这里有一个库将触摸绑定
DB2 WITH 语句可以用作 UPDATE 或 MERGE 的一部分吗？

我需要更新数据库表中的一些行如何识别要更新的行涉及一系列复杂的语句我设法将它们归结为一系列WITH语句现在我有了正确的数据值我需要更新表由于我设法使用WITH语句获取这些值因此我希望在更新合并中使用它一个简化的示例如下 wi
如何更改 Ubuntu 中的文件权限 [重复]

这个问题在这里已经有答案了在 Ubuntu 中我想更改整个文件夹及其所有子文件夹的文件权限以供任何人读写我努力了sudo chmod 666 var www and sudo chmod 755 var www没有成功 update
Facebook 重置“在 Facebook 上分享”链接的缓存

我刚刚更新了我们网站的的开放图协议我刚刚注意到每当我分享一些链接时旧的是 Facebook 正在解析的但是对于我运行的那些链接debugger https developers facebook com tools debug他们
仅当 command1 在 cmd windows shell 中成功时才运行 command2

我们如何组合 cmd shell 语言中的命令以便仅在第一个命令成功完成时才执行第二个命令类似以下 bash 命令 make a out a out仅在以下情况下执行make那是成功的下列 command1 command2 应该致力
读取 nul 分隔字段

给定这个文件 printf alpha 0bravo 0charlie gt delta txt 我想将这些字段读入单独的变量中我使用的原因空分隔符是因为字段将包含文件路径其中可以包含除 null 之外的任何字符我尝试了这些命令
Android 中某些相机分辨率下的不同捕获输出大小

我正在使用 Android Camera2 API 开发一个自定义相机应用程序您可以在手机中可用的不同相机和视频分辨率之间切换它还提供了拍摄 1 1 方形照片的可能性为了拍摄方形照片我拍摄了一张正常的 4 3 照片然后将其裁剪以保
GetType 返回 Int 而不是 System.Int32

GetType ToString 返回对象的全名我想要您通常用来实例化该对象的名称即 int 而不是 Int32 有没有办法做到这一点 C 有许多类型它们实际上是 NET CLR 的关键字别名Types 在这种情况下 int是 C
如果不允许任务之间共享可变状态，为什么 Rust 具有互斥体和其他同步原语？

我的理解是 Rust 中的任务之间不可能共享可变状态那么为什么 Rust 有这样的东西mutexes https doc rust lang org std sync struct Mutex html在语言中他们的目的是什么不允许在
如何在asp.net core中更改Razor中的根路径〜/

我有一个带有 Razor 的 ASP NET Core 2 1 MVC 应用程序它广泛使用 path syntax 如果应用程序从域根运行例如从http localhost 5000 但是当我在非根位置运行应用程序时例如 http
错误：您需要包含一些实现 __karma__.start 方法的适配器

我正在尝试向我的项目之一添加一些单元测试到目前为止我已经安装并配置了 karma 并安装了 jasmine 我的里面有一个测试文件test folder karma 服务器已启动浏览器页面已准备就绪但是karma run失败如下 k
如何翻译$url_handlers？

我遇到一个情况需要翻译以下内容 url handlers对于不同的国家因此在英文网站上 URL 如下所示 http website com gyms boston group training http website com gym
curl_multi_exec：下载的一些图像丢失了一些数据/流不完整

我已经实现了一个 PHP 函数它检查并下载大量图像 gt 1 000 使用数组传递给它使用 PHPcurl multi init method 经过几次返工后因为我得到了 0 字节文件等内容我现在有一个下载所有图像的解决方案但下载
在同一列上多次调用 Pandas df.sort_values() 会产生不同的结果？

下面的例子为什么会发生这种情况以及如何防止它 gt gt gt df pd DataFrame a list range 150 b 1 2 3 50 gt gt gt df sort values b equals df sort va

在同一列上多次调用 Pandas df.sort_values() 会产生不同的结果？

在同一列上多次调用 Pandas df.sort_values() 会产生不同的结果？ 的相关文章

随机推荐

热门标签

在同一列上多次调用 Pandas df.sort_values() 会产生不同的结果？的相关文章