删除重复项，但忽略空值

2024-01-25

所以我知道你可以使用类似的方法来删除重复的行：

the_data.drop_duplicates(subset=['the_key'])

然而，如果the_key对于某些值来说为 null，如下所示：

   the_key  C  D
1      NaN  *  *
2      NaN     *
3      111  *  *
4      111

它将保留那些标记在C柱子。是否可以得到drop_duplicates治疗所有nan一样不同并得到一个输出，保持数据像在D column?

Use duplicated http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.duplicated.html拴着isna http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.isna.html并按以下条件过滤boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing:

df = df[(~df['the_key'].duplicated()) | df['the_key'].isna()]
#fol oldier pandas versions
#df = df[(~df['the_key'].duplicated()) | df['the_key'].isnull()]
print (df)
   the_key  C    D
1      NaN  *    *
2      NaN       * 
3    111.0  *    *

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

删除重复项，但忽略空值的相关文章

如何替换Python字符串中的正确字母

任务是您的任务是纠正数字化文本中的错误您只需处理以下错误 S 被误解为 5 O 被误解为 0 I 被误解为 1 我的代码 def correct string for i in string if 5 in string string
如何通过 python 中的函数运行列表？

我试图通过我创建的函数运行我的列表但不断收到错误我不知道出了什么问题温度 F temp f 19 21 21 21 23 功能 def fahrToCelsius tempFahrenheit return tempFahrenhei
Python，Google Places API - 给定一组纬度/经度查找附近的地点

我有一个由商店 ID 及其纬度经度组成的数据框我想迭代该数据框并使用 google api 为每个商店 ID 查找附近的关键地点例如输入 Store ID LAT LON 1 1 222 2 222 2 2 334 4 555 3
使用 Pandas 从 csv 文件读取标题信息

我有一个包含 14 行标题的数据文件在标头中有经纬度坐标和时间的元数据我目前正在使用 pandas read csv filename delimiter header 14 读取文件但这只是获取数据我似乎无法获取元数据有人知道
为什么需要设置WORKON_HOME环境变量？

我已经有一段时间没有使用 python 虚拟环境了但我也安装了虚拟环境包装器我的问题是在文档页面中它说要这样做 export WORKON HOME Envs mkdir p WORKON HOME source usr local
获取 Keras model.summary() 作为表

我在 Keras 中创建了相当大的模型我正在用 LaTeX 写一篇关于它的文章为了很好地描述 LaTeX 中的 keras 模型我想用它创建一个 LaTeX 表我可以手动实现它但我想知道是否有任何更好的方法来实现这一点我四处
如何知道python运行脚本的路径？

sys arg 0 给我 python 脚本例如 python hello py 返回 sys arg 0 的 hello py 但我需要知道 hello py 位于完整路径中的位置我怎样才能用Python做到这一点 os path a
了解 Python 2.7 中的缩进错误

在编写 python 代码时我往往会遇到很多缩进错误有时当我删除并重写该行时错误就会消失有人可以为菜鸟提供 python 中 IndentationErrors 的高级解释吗以下是我在玩 CheckIO 时收到的最近 inden
无法通过 Android 应用程序访问我的笔记本电脑的本地主机

因此我在发布此内容之前做了一项研究我发现的解决方案不起作用更准确地说连接到我的笔记本电脑的 IPv4192 168 XXX XXX 没用连接到10 0 2 2 加上端口不起作用我需要测试使用 Django Rest 框架构建的
Pandas 字典键到列[重复]

这个问题在这里已经有答案了我有一个像这样的数据框 index column1 e1 u c680 5 u c681 1 u c682 2 u c57 e2 u c680 6 u c681 2 u c682 1 u c57 e3 u c68
使用 python 脚本更改 shell 中的工作目录

我想实现一个用户态命令它将采用其参数之一路径并将目录更改为该目录程序完成后我希望 shell 位于该目录中所以我想实施cd命令但需要外部程序可以在 python 脚本中完成还是我必须编写 bash 包装器 Example t
使用 ElementTree 在 python 中解析 xml

我对 python 很陌生我需要解析一些脏的 xml 文件这些文件需要先清理我有以下 python 代码 import arff import xml etree ElementTree import re totstring wit
Flymake的临时文件可以在系统临时目录下创建吗？

我目前正在使用以下代码在 emacs 中连接 Flymake 和 Pyflakes defun flymake create temp in system tempdir filename prefix make temp file or
获取多个同名请求参数

我的问题是给定的代码 from flask import Flask request app Flask name app route def hello return str request values get param None a
如何创建增量加载网页

我正在编写一个处理大量数据的页面它会永远持续到我的结果页面加载几乎无限因为返回的数据太大了因此我需要实现一个增量加载页面例如 url 中的页面 http docs python org http docs python org
类返回语句不打印任何输出

我正在学习课程但遇到了问题return语句它是语句吗我希望如此程序什么也没有打印出来它只是结束而不做任何事情 class className def createName self name self name name def
如何将两列 pandas Dataframe 移动并堆叠为一列？

我有一个下面提到的数据框 ETHNIC SEX USUBJID 0 HISPANIC OR LATINO F 16 1 HISPANIC OR LATINO M 8 2 HISPANIC OR LATINO Total 24 3 NOT H
检查 IP 地址是否在给定范围内

我想检查一下是否有IP180 179 77 11位于特定范围之间例如180 179 0 0 180 179 255 255 我编写了一个函数它将每个 IP 八位字节与其他八位字节进行比较 def match mask IP min ip
PyObjC + Python 3.0 问题

默认情况下 Cocoa Python 应用程序使用默认的 Python 运行时版本 2 5 如何配置我的 Xcode 项目以便它使用较新的 Python 3 0 运行时我尝试用新版本替换项目中包含的Python framework 但它不
从 Django 运行 shell 命令

我正在 Django 中开发一个网页使用 apache 服务器需要调用 shell 命令来启用禁用一些守护进程我尝试这样做 os system service httpd restart 1 gt HOME out 2 gt HOM

随机推荐

将项目从 Delphi 7 迁移到 Delphi XE 有多难？

我们公司有一个软件已经开发了10多年所以里面有一些非常过时的东西它仍然很实用什么都有但我看到 Delphi XE 上的新功能它让我想要切换问题是源代码本身有超过 300mb 的 pas 文件包含组件等总共 1GB 我们使用自定
F# If/Then 中的推断类型

如果我有以下功能 let myFunc x y if y 0 then 1 x 我收到错误 Program fs 58 17 error FS0001 This expression was expected to have type un
Powershell 连接到 VSO

我正在尝试使用 Powershell 连接到 VSO 这是我的代码 tfsServer New Object System Uri the server is here creds System Net CredentialCache De
Python - calendar.timegm() 与 time.mktime()

我似乎很难理解这个问题有什么区别calendar timegm and time mktime 说我有一个datetime datetime如果没有附加 tzinfo 两者不应该给出相同的输出吗它们不都给出纪元和作为参数传递的日期之间的
C++：固定但运行时定义长度数组的向量

我知道我可以使用 std vector
使用 Linq 从数据表中获取不同的行（多列不同）

我试图区分多个列并从数据表中获取数据行但出现错误 Dim query As IEnumerable Of DataRow From row As DataRow In SourceTable AsEnumerable Select row
C# 和元数据文件错误

我使用 MSDN 上的教程创建了自己的小型 C 编译器但它无法正常工作我遇到一些错误然后修复它们然后我遇到新的不同的错误然后修复它们等等最新的错误真的让我很困惑 Line number 0 Error number CS00
CSS 覆盖规则和特殊性

我经常对 CSS 覆盖规则感到困惑一般来说我意识到更具体的样式表会覆盖不太具体的样式表并且特异性取决于指定的选择器数量还有 important关键字也发挥着作用因此这是一个简单的示例我有一个包含两个表格单元格的表格表格本身
sklearn的MLP Predict_proba函数内部是如何工作的？

我想了解如何sklearn的 MLP 分类器 https scikit learn org stable modules generated sklearn neural network MLPClassifier html检索其结果pre
将 png 图像转换为有损 avif

我尝试压缩大约 1MB 的 png 以获得更小的图像当我使用以下命令将图像压缩为 jpeg 时 for i in card png do convert resize 445x625 background white flatten i
Metro 应用程序中的 ListView 没有垂直滚动条

我对 Windows Store 又名 Metro 应用程序 XAML 没有经验所以也许我忽略了一些简单的东西但根据书籍和示例垂直滚动条是 ListView 控件的自然组成部分除非明确禁用否则会在出现时显示是 ListView 中
获取画布中两点之间的距离

我有画布绘图选项卡并希望 lineWidth 基于最后两次鼠标移动坐标更新之间的距离我将自己将距离转换为宽度我只需要知道如何获得这些点之间的距离我已经有了这些点的坐标你可以用毕达哥拉斯定理来做如果有两个点 x1 y1 和 x2
Python 和 Rust 之间零拷贝共享 Polars 数据帧的示例？

我有一个Python函数例如 def add data input df 对 input df Polars 数据框进行一些操作例如用新值填充某些列我想在 Rust 函数中使用这个函数 input df 可能有几十兆字节大所以我想
使用 process.start 打开文本文件

在计算皮尔逊相关并将结果写入文本文件后我一直试图从系统中打开一个文本文件但到目前为止由于某种原因代码没有打开任何记事本文件我尝试打开其他文件它们可以工作很好但 txt 文件没有专门打开甚至 docx 文件也使用相同的代码打开
允许递归构造函数可能有什么好处（如果有）？

在 Java 中构造函数不能是递归的编译时错误递归构造函数调用假设我们没有这个限制要记住的事情构造函数的返回类型为 void 由于它是一个 void 方法因此您无法利用递归的完整功能构造函数可以使用 this 调用自身或任
FileChannel#force 和缓冲

我现在想澄清一下并在 FileOutputStream 和 FileChannel 之间画出一些相似之处所以首先似乎使用标准 Java io 写入文件的最有效方法是使用用 BufferedOutputStream 包装的 FileOu
WPF MVVM取消窗口关闭

我是 WPF 和 MVVM 新手我想最小化窗口而不是关闭它换句话说我想取消Closing窗口事件并最小化该窗口我应该如何以 MVVM 方式进行操作如果相关的话最后我会设置ShowInTaskbar to false并使用WinF
刷新有嵌套路由的页面时出现“404 not found”，因为Vite没有将所有路由重定向到index.html

我可以使用 React 路由器useNavigate钩子去一个嵌套的路线比如localhost 3000 nested route 但是一旦重新加载我就会收到 404 未找到错误因为它正在尝试查找localhost 3000 nest
键绑定的 Atom 数据语法

有人可以完整解释 Atom 的数据语法属性用于键绑定选择器的语法吗例如有什么区别 data grammar source example and data grammar source example 另外如何指定多种语法例如
删除重复项，但忽略空值

所以我知道你可以使用类似的方法来删除重复的行 the data drop duplicates subset the key 然而如果the key对于某些值来说为 null 如下所示 the key C D 1 NaN 2 NaN 3

删除重复项，但忽略空值

删除重复项，但忽略空值 的相关文章

随机推荐

热门标签

删除重复项，但忽略空值的相关文章