Python-pandas 将 NA 替换为数据框中一组的中位数或平均值

2023-11-25

假设我们有一个 df：

    A       B
   apple   1.0
   apple   2.0
   apple    NA
   orange   NA
   orange  7.0
   melon   14.0
   melon   NA
   melon   15.0
   melon   16.0

要替换 NA，我们可以使用df["B"].fillna(df["B"].median())，但它将用“B”中所有数据的中位数填充 NA

有什么办法可以用某个 A 的中位数来代替 NA （如下所示）：

    A       B
   apple   1.0
   apple   2.0
   apple   **1.5**
   orange  **7.0**
   orange  7.0
   melon   14.0
   melon   **15.0**
   melon   15.0
   melon   16.0

Thanks!

在 pandas 中你可以使用transform获取空填充值：

>>> med = df.groupby('A')['B'].transform('median')
>>> df['B'].fillna(med)
0     1.0
1     2.0
2     1.5
3     7.0
4     7.0
5    14.0
6    15.0
7    15.0
8    16.0
Name: B, dtype: float64

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

r

DataFrame

Python-pandas 将 NA 替换为数据框中一组的中位数或平均值的相关文章

Python，将迭代函数变成递归函数

我创建了一个输出 4 3 2 1 0 1 2 3 4 的迭代函数 def bounce2 n s n for i in range n print n n n 1 if n lt 0 for i in range s 1 print n n
Python的reduce()短路了吗？

If I do result reduce operator and False 1000 得到第一个结果后它会停止吗自从False anything False 相似地 result reduce operator or True 10
使用许多特殊字符将 R 连接到 HANA 数据库时出现问题

我在将 HANA 数据读入 R 时遇到问题我已通过以下方式建立了连接 ch lt odbcConnect HANA uid USER pwd PW 并确认我已通过以下方式连接 sqlTables ch 这会调出我的表格列表对我想要拉取的
为什么在 Windows 中使用 GetConsoleScreenBufferInfoEx 时控制台窗口会缩小？

我正在尝试使用 GetConsoleScreenBufferInfoEx 和 SetConsoleScreenBufferInfoEx 设置 Windows 命令行控制台的背景和前景色我正在 Python 中使用 wintypes 进行此
迭代字符串 R 的字符

有人可以解释一下为什么这不会在 R 中单独打印所有数字 numberstring lt 0123456789 for number in numberstring print number 字符串不就是字符数组吗在 R 中该怎么做 In
如何使用循环将十进制转换为二进制？

我想编写一个程序将十进制数 0 到 9 转换为二进制数我可以编写如何使用重复除法将十进制数转换为二进制数的代码但是我在创建一个以二进制格式打印十进制数字 0 到 9 的循环时遇到了麻烦这是我的代码 number 0 remaind
如何使用 Pandas 将巨大的 CSV 转换为 SQLite？

我有一个巨大的表大约 60 GB 采用存档的 CSV 文件形式我想将其转换为 SQLite 文件我现在所做的事情如下 import pandas import sqlite3 cnx sqlite3 connect db sqlite
ggplot2 可视化/显示中的地图错误？

正如您在下面看到的我使用 ggplots 制作的地图上存在一个奇怪的显示问题任何投影似乎都会发生同样的问题这是代码仅包maps and ggplot2需要 mapWorld lt borders world colour gray5
如何使用 Python 多处理避免在分叉进程中加载父模块

当您创建一个Pool使用Python的进程multiprocessing 这些进程将分叉父进程中的全局变量将显示在子进程中如下面的问题所述如何限制多处理进程的范围 https stackoverflow com questions 2
一行Python和SQLite代码，为什么需要加“，”？ [复制]

这个问题在这里已经有答案了 c execute INSERT INTO numbers VALUES random randint 0 100 如果我将上面的代码更改为 c execute INSERT INTO numbers VALUE
如何在 Scala 中将 DataFrame 模式写入文件

我有一个 DataFrame 它从一个巨大的 json 文件加载并从中获取架构该架构基本上大约有 1000 列我希望将 printSchema 的相同输出保存在文件中而不是控制台中有任何想法吗如果您在本地环境中工作您可以执行以下操
在 matplotlib 中使用 yscale('log') 时缺少误差线

在某些情况下当使用对数刻度时 matplotlib 会错误地显示带有误差条的图假设这些数据例如在 pylab 内 s 19 0 20 0 21 0 22 0 24 0 v 36 5 66 814250000000001 130 177
使用 R 交互式更改 Plotly 图像中的轴刻度（线性/对数）

Goal 创建交互式下拉菜单按钮来更新 R 中 Plotly 图形的轴比例 Issue 有很多关于创建的文档buttons https plot ly r custom buttons and 对数图 https plot ly r lo
参数验证，Python 中的最佳实践[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案让我们举一个 API 的例子 def get abs directory self path if os path isdir path ret
如何在C++中列出Python模块的所有函数名称？

我有一个 C 程序我想导入一个 Python 模块并列出该模块中的所有函数名称我该怎么做我使用以下代码从模块中获取字典 PyDictObject pDict PyDictObject PyModule GetDict pModule
如何设置 matplotlib 表中列的背景颜色

我在一个目录中有多个 txt 文件例如 d memdump 0 txt 1 txt 10 txt 示例文本文件如下 Applications Memory Usage kB Uptime 7857410 Realtime 7857410
在 Python 的 Textmate 中突出显示尾随空格？

我想做类似的事情this http remysharp com 2008 03 30 trailing white space in textmate Textmate 提示这样当我在 Python 中编写代码时尾随空白总是以某种方式突
issubclass() 对从不同路径导入的同一类返回 False

目的是实现某种插件框架其中插件是同一基类即 A 的子类即 B 基类使用标准导入加载而子类使用 imp load module 从众所周知的包即 pkg 的路径加载 pkg init py mod1 py class A mod2
在Python中从日期时间中减去秒

我有一个 int 变量它实际上是秒让我们调用这个秒数X 我需要得到当前日期和时间以日期时间格式减去的结果X秒 Example If X是 65 当前日期是2014 06 03 15 45 00 那么我需要得到结果2014 06 03
从 pandas 数据框中绘制堆积条形图

我有数据框 payout df head 10 复制以下 Excel 绘图的最简单最智能和最快的方法是什么我尝试过不同的方法但无法让一切都到位 Thanks 如果您只想要一个堆积条形图那么一种方法是使用循环来绘制数据框中的每一列并

随机推荐

PHP，HTML：自动提交表单[关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案询问代码的问题必须对所解决的问题表现出最低限度的了解包括尝试的解决方案为什么不起作用以及预期结果也可以看看 Stack Overflow 问题清单有关您编写的代码的问题必须描
附加文本未在 d3 v4 中显示

我正在尝试翻译平行坐标示例到新版本的 d3 v4 我有一个使用此 javascript 的工作示例如果有人尝试使用 d3 的 v4 并对新功能有问题这也是一个很好的示例 var margin top 30 right 10 bott
如何让 jQuery 等待 Ajax 调用完成后再返回？

我有一个需要登录的服务器端功能如果用户登录该函数将在成功时返回 1 如果没有该函数将返回登录页面我想使用 Ajax 和 jQuery 调用该函数我所做的就是使用普通链接提交请求并在其上应用点击功能如果用户未登录或函数失败我希
是否有可以检查表情符号的特定范围的 unicode 代码点？

表情符号是否占据明确定义的 unicode 范围并且在 python 2 7 中是否有确定的方法来检查代码点是否是表情符号我似乎找不到这方面的任何信息有几个消息来源指出了这个范围 U0001f600 U0001f650 但例如有代
即使使用 ChangeDetectionStrategy.OnPush 也会调用 Angular ngDoCheck()

可以说我有一个像这样的组件结构 AppComponent HeaderComponent ContentComponent TodosComponent TodoComponent 如果我设置 HeaderComponent 的change
从 BGL 图中提取邻接矩阵

使用Boost图库我正在寻找一种方法提取邻接矩阵来自由以下任一表示的基础图boost adjacency list or boost adjacency matrix 我想结合使用这个矩阵boost numeric ublas求解联立线性方
如何在 shell 中以可移植的方式在第一个空行上分割文件（例如使用 sed）？

我想将包含 HTTP 响应的文件拆分为两个文件一个仅包含 HTTP 标头另一个包含消息正文为此我需要在第一个空行上将文件分成两个或者对于仅包含 CR 的第一行的 UNIX 工具 r 字符使用外壳脚本如何以可移植的方式执行此操作
错误 android SurfaceFlinger

我有这个错误消息 SurfaceFlinger 半透明 0 isOpaque 1 isExternalDisplayLayer 0 isExternalBlockLayer0 我使用的是安卓4 1 1 我无法说出我的代码的哪一部分正在生成此
使用 Watir 检查坏链接

我有一个无序列表的链接我保存在一边我想单击每个链接并确保它转到真实页面而不是 404 500 等问题是我不知道该怎么做是否有一些我可以检查的对象可以为我提供 http 状态代码或其他内容 mylinks Browser ul id
Android 中具有动态 ActionBar 颜色的半透明 StatusBar

我正在尝试实现一个半透明的状态栏以便我的导航视图是BEHIND状态栏但仍然喜欢动态更改操作栏的颜色因此状态栏颜色需要更改为操作栏颜色的较暗版本如果我将状态栏设置为透明正如许多消息来源所建议的那样我的 Primary dark
如何编写多行命令？

我们如何将命令扩展到下一行基本上 Linux 的 Windows 替代品是什么 ls l usr 这里我们使用反斜杠将命令扩展到下一行 Windows 的等效项是什么尝试了键盘上的几乎每个键后 C Users Tim gt cd Meh
在 C# 中递归打印斐波那契字符串

可以不用 while 循环来完成吗 static void Main string args Console WriteLine Please enter a number int number Convert ToInt32 Consol
Ruby on Rails：按月对博客文章进行分组

嘿伙计们我使用常见的 CRUD 操作创建了一个简单的博客应用程序我还在 PostController 中添加了一个名为 archive 的新操作和一个关联的视图在此视图中我想带回所有博客文章并按月对它们进行分组以这种格式显示它们
PHP 的 count() 函数对于数组来说是 O(1) 还是 O(n) ？

Does count 真的计算了 PHP 数组的所有元素还是这个值缓存在某处并且只是被检索嗯我们可以看一下源码 ext standard array c PHP FUNCTION count calls php count recur
如何使用 BorderLayout 将两个组件放入 JPanel 中？

基本上我想做的是添加两张图片并排在 JPanel 的中心并在 JPanel 的右侧添加一个 JLabel 所以我被告知将 JPanel 的布局设置为 BorderLayout 并使用 BorderLayout CENTER 添加图片使
创建一个自动填充目标页面上字段的链接

我正在编写一份时事通讯要求我这样做的人想要其中的链接一切都很完美没有问题现在的问题是当您单击此链接时它会进入一个包含字段的页面并且该人问我是否可以自动填写其中一个字段该页面是某些服务的订阅页面当您使用他的电子邮件登录该页面
如何在 iPhone 的 Objective-C 中以编程方式调整图像大小

我有一个应用程序可以在很小的空间中显示大图像这些图像相当大但我仅以 100x100 像素帧显示它们由于我使用的图像大小我的应用程序响应缓慢为了提高性能如何使用 Objective C 以编程方式调整图像大小请找到以下代码 U
枚举的 rawValue 属性无法识别

我正在使用 Xcode 6 的 Playground 来尝试 Swift 中的枚举 enum Rank String case One One Two Two init rawValue String self rawValue rawVa
创建 Pandas 滚动窗口系列数组

假设我有以下代码 import numpy as np import pandas as pd x np array 1 0 1 1 1 2 1 3 1 4 s pd Series x index 1 2 3 4 5 这会产生以下结果s 1
Python-pandas 将 NA 替换为数据框中一组的中位数或平均值

假设我们有一个 df A B apple 1 0 apple 2 0 apple NA orange NA orange 7 0 melon 14 0 melon NA melon 15 0 melon 16 0 要替换 NA 我们可以使用

Python-pandas 将 NA 替换为数据框中一组的中位数或平均值

Python-pandas 将 NA 替换为数据框中一组的中位数或平均值 的相关文章

随机推荐

热门标签

Python-pandas 将 NA 替换为数据框中一组的中位数或平均值的相关文章