Python Pandas 用缺失值填充数据框

2024-04-23

我有这个数据框作为例子

import pandas as pd

#create dataframe
df = pd.DataFrame([['DE', 'Table',201705,201705, 1000], ['DE', 'Table',201705,201704, 1000],\
                   ['DE', 'Table',201705,201702, 1000], ['DE', 'Table',201705,201701, 1000],\
                   ['AT', 'Table',201708,201708, 1000], ['AT', 'Table',201708,201706, 1000],\
                   ['AT', 'Table',201708,201705, 1000], ['AT', 'Table',201708,201704, 1000]],\
                   columns=['ISO','Product','Billed Week', 'Created Week', 'Billings'])
print (df)

  ISO Product  Billed Week  Created Week  Billings
0  DE   Table       201705        201705      1000
1  DE   Table       201705        201704      1000
2  DE   Table       201705        201702      1000
3  DE   Table       201705        201701      1000
4  AT   Table       201708        201708      1000
5  AT   Table       201708        201706      1000
6  AT   Table       201708        201705      1000
7  AT   Table       201708        201704      1000

我需要做的是用 0 Billings 为每个 groupby['ISO','Product'] 填充一些缺失的数据，其中序列中存在中断，即在某一周内没有创建帐单，因此它丢失了。它需要基于计费周的最大值和创建周的最小值。也就是说，这些组合应该是完整的，顺序上没有中断。

因此，对于上述情况，我需要以编程方式追加到数据库中的缺失记录如下所示：

  ISO Product  Billed Week  Created Week  Billings
0  DE   Table       201705        201703         0
1  AT   Table       201708        201707         0

这是我的解决方案，相信有高手会提供更好的解决方案~让我们拭目以待吧~

df1=df.groupby('ISO').agg({'Billed Week' : np.max,'Created Week' : np.min})
df1['ISO']=df1.index

     Created Week  Billed Week ISO
ISO                               
AT         201704       201708  AT
DE         201701       201705  DE

ISO=[]
BilledWeek=[]
CreateWeek=[]
for i in range(len(df1)):
    BilledWeek.extend([df1.ix[i,1]]*(df1.ix[i,1]-df1.ix[i,0]+1))
    CreateWeek.extend(list(range(df1.ix[i,0],df1.ix[i,1]+1)))
    ISO.extend([df1.ix[i,2]]*(df1.ix[i,1]-df1.ix[i,0]+1))
DF=pd.DataFrame({'BilledWeek':BilledWeek,'CreateWeek':CreateWeek,'ISO':ISO})
Target=DF.merge(df,left_on=['BilledWeek','CreateWeek','ISO'],right_on=['Billed Week','Created Week','ISO'],how='left')
Target.Billings.fillna(0,inplace=True)
Target=Target.drop(['Billed Week',  'Created Week'],axis=1)
Target['Product']=Target.groupby('ISO')['Product'].ffill()

Out[75]: 
   BilledWeek  CreateWeek ISO Product  Billings
0      201708      201704  AT   Table    1000.0
1      201708      201705  AT   Table    1000.0
2      201708      201706  AT   Table    1000.0
3      201708      201707  AT   Table       0.0
4      201708      201708  AT   Table    1000.0
5      201705      201701  DE   Table    1000.0
6      201705      201702  DE   Table    1000.0
7      201705      201703  DE   Table       0.0
8      201705      201704  DE   Table    1000.0
9      201705      201705  DE   Table    1000.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Python Pandas 用缺失值填充数据框的相关文章

如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像

随机推荐

Twig 链接到当前路线但更改区域设置

我会在现有网站中添加一些指向不同区域设置版本的链接效果很好但是很丑 li a href img src alt es a li li a href a li
导出使用 docker-compose 创建的容器

我创建了一系列容器docker 撰写其中一些容器按照定义在容器中的一些规则相互通信 docker compose yml file 我需要将这些容器从serverA to serverB 相同的操作系统但我在理解它是如何工作的方面遇到了
terraform 不检测 lambda 源文件的更改

In my main tf我有以下内容 data template file lambda script temp file template file fn lambda script py data template file libr
为什么我可以在 iOS 14.1 上安装我的应用程序，但不能在 14.2 上安装？

自从安装 Xcode 12 2 以来我无法在运行 iOS 14 2 的模拟器上安装我们的应用程序我下载了 14 1 运行 14 1 的模拟器安装该应用程序就好了很明显我的同事没有这个问题即使他运行的是相同版本的 Xcode 所以我
如何使用 Psequel GUI 连接到 Mac 上的 localhost PostgreSQL？

我跟着本教程 http www moncefbelyamani com how to install postgresql on a mac with homebrew and lunchy 在我的 Mac 上安装 PG 这是我第一次在本地
默认情况下 Bootstrap 未折叠面板

我有一个可折叠面板但我希望它默认折叠 div class panel panel default div class panel heading h4 class panel title a href collapse1 span cla
基于一个公共密钥 Angular 2 合并 2 个数组

我有2个arrays in Angular 2我想根据一个键值合并它们数组1 columnId 1 type value 1 columnId 2 type value 2 数组2 columnId 1 field field 1 col
ASP.NET MVC 模型列表绑定

这是我的模型 public class Items public string Foo get set public string Bar get set 控制器 public ActionResult Index var model ne
SMTP - SSL 证书问题 - C# - 为什么此代码有效？

现在这个问题在 Stack Overflow 中有几个版本如下所示观看次数最多的问题 https stackoverflow com questions 777607 the remote certificate is invalid
GCC/CLANG 与 MSVC 的预处理器之间有何差异？

以下预处理器宏通常的嫌疑人测试空参数列表并计算参数数量在 gcc clang 上运行时没有警告但在 Microsoft VisualC 上失败 IS EMPTY returns nothing if the parameter li
如何列出自定义帖子类型的所有类别？

我有一个名为餐饮的帖子类型并且有一个名为餐饮类别的分类法我想做的是我想在页脚区域显示帖子类型餐饮的所有类别在 WordPress 4 6 中get terms已弃用所以有一个替代方案 get categories 读这
如何让我的 NPM 包在本地安装时显示“npm WARN Preferred Global”

很难用谷歌搜索这个主题太多的用户问题我的问题是关于包开发的我想让我的包的用户看到 npm WARN 更喜欢全局当不是全局安装时我想npm install yo以前有这样的警告但现在没有了至少我看不到我的环境 npm vers
在 C# 中是否有更简单的方法为函数指定别名

背景在我移植的API中有大量以sqlite3 为前缀的函数它们被封装在一个名为Sqlite3的类中因此函数调用为Sqlite3 sqlite3 我创建了许多别名调用类似于以下内容 C alias for call public s
使用 jQuery 获取下一个同级的文本

我正在尝试获得下一节项目标题 section project title并回应它为了便于阅读我的标记已被删除但它的结构仍然存在我能够获取下面的部分项目标题 section activediv 但不知道如何抓住next项目名称请注意
来自远程客户端的 websphere jms 队列访问

背景我是 php 和前端 Web 开发人员使用 Netbeans 开发 Java 应用程序从 websphere 我认为是 V8 5 JMS 队列中读取数据然后向适当的脚本服务器发出命令这是我大约 10 年来第一次主要接触 Jav
android中invalidateOptionsMenu()有什么用

我是android的新手当我浏览导航抽屉的示例代码时我发现他调用了方法invalidateOptionsMenu 所以我搜索了它的功能但找不到答案所以任何人都可以向我介绍一下它的功能以及我们什么时候应该这样做吗用那个这个函数告诉
无法通过 python-jira lib 连接到 JIRA-api

我无法对 python jira 进行身份验证我尝试使用https pypi python org pypi jira https pypi python org pypi jira 根据我使用的文档 from jira import J
如何使用 PHP 读取来自 Stackoverflow API 的 GZIP 响应？

如何使用 PHP 读取 Stackoverflow API 的响应响应是 GZIP 编辑的我发现例如以下建议 url http api stackoverflow com 1 1 questions question id data f
iOS NSDate 仅包含时间字符串

我的任务是将带有时间的字符串解析为 NSDate 我用以下代码做得很好 NSString timeStr 15 00 00 NSDateFormatter formatter NSDateFormatter alloc init forma
Python Pandas 用缺失值填充数据框

我有这个数据框作为例子 import pandas as pd create dataframe df pd DataFrame DE Table 201705 201705 1000 DE Table 201705 201704 1000

Python Pandas 用缺失值填充数据框

Python Pandas 用缺失值填充数据框 的相关文章

随机推荐

热门标签

Python Pandas 用缺失值填充数据框的相关文章