Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组

2023-12-28

让我们考虑一个 DataFrame，它在 2010 年 1 月的每一天包含 1 行 2 个值：

date_range = pd.date_range(dt(2010,1,1), dt(2010,1,31), freq='1D')
df = pd.DataFrame(data = np.random.rand(len(date_range),2), index = date_range)

我将该 DataFrame 拆分为 5 个 DataFrame 的列表，每个 DataFrame 都包含原始数据的 1 周数据：df_weeks = [g for n, g in df.groupby(pd.TimeGrouper('W'))]

如果我输入df.groupby(pd.TimeGrouper('W')).groups我可以看到一个字典解释如何分组：

{Timestamp('2010-01-03 00:00:00', freq='W-SUN'): 3,
 Timestamp('2010-01-10 00:00:00', freq='W-SUN'): 10,
 Timestamp('2010-01-17 00:00:00', freq='W-SUN'): 17,
 Timestamp('2010-01-24 00:00:00', freq='W-SUN'): 24,
 Timestamp('2010-01-31 00:00:00', freq='W-SUN'): 31}

让我们考虑另一个具有稀疏数据但与第一个重叠的 TimeSeries：

observations = pd.DataFrame(data =np.random.rand(5,2), index = (dt(2010,1,12), dt(2010,1,18), dt(2010,1,20), dt(2010,1,22), dt(2010,1,28)))

如果我运行相同的代码obs_weeks = [g for n, g in observations.groupby(pd.TimeGrouper('W'))]，显然它会在列表中返回更少的 DataFrame，因为数据覆盖的范围更小。observations.groupby(pd.TimeGrouper('W')).groups返回：

{Timestamp('2010-01-17 00:00:00', freq='W-SUN'): 1,
 Timestamp('2010-01-24 00:00:00', freq='W-SUN'): 4,
 Timestamp('2010-01-31 00:00:00', freq='W-SUN'): 5}

但有没有办法重用第一个 DataFrame.GroupBy 的组将其应用到第二个？即，这意味着在特定情况下最终会出现一个变量obs_weeks包含 5 个数据帧，跨越相同的时间范围df_weeks，其中 2 个是空的？

解决您的问题的一种简单方法是确保观测数据框包含 df 数据框包含的所有日期。您可以使用reindex方法。然后您将拥有完全相同的组。您还可以使用resample('W')代替groupby(pd.Timegrouper('W'))

obs2 = observations.reindex(df.index)

obs2.resample('W').groups

{Timestamp('2010-01-03 00:00:00', freq='W-SUN'): 3,
 Timestamp('2010-01-10 00:00:00', freq='W-SUN'): 10,
 Timestamp('2010-01-17 00:00:00', freq='W-SUN'): 17,
 Timestamp('2010-01-24 00:00:00', freq='W-SUN'): 24,
 Timestamp('2010-01-31 00:00:00', freq='W-SUN'): 31}

如果我们进行简单的聚合（例如求和），我们可以看到两个帧的结果

df.resample('W').sum()

                 0         1
2010-01-03  1.990558  2.555191
2010-01-10  2.707777  3.771756
2010-01-17  2.799897  3.353363
2010-01-24  3.165479  2.778870
2010-01-31  4.946577  3.394211

现在与obs2其中有 2 个缺失组

obs2.resample('W').sum()

                   0         1
2010-01-03       NaN       NaN
2010-01-10       NaN       NaN
2010-01-17  0.172341  0.137136
2010-01-24  1.752472  2.375306
2010-01-31  0.711525  0.124271

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组的相关文章

通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
Pandas：merge_asof() 对多行求和/不重复

我正在处理两个数据集每个数据集具有不同的关联日期我想合并它们但因为日期不完全匹配我相信merge asof 是最好的方法然而有两件事发生merge asof 不理想的数字重复数字丢失以下代码是一个示例 df a pd Da
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

未捕获错误：初始化之前无法调用页面上的方法；尝试调用方法“bindRemove”[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在使用 jQuery mobile 1 4 5 开发一个 Web 应用程序错误未捕获错误初始化之前无法调用页面上的方法
让 div 充当弹出窗口

I am designing a simple webpage I want to display a popup window in the same page just like the image attached below 我不知
服务器是否在主机“localhost”(::1) 上运行并接受端口 5432 上的 TCP/IP 连接？

首先请注意我在 Stack Overflow 上和网络上的文章中发现了几个类似的问题但这些都没有帮助我解决我的问题 PG 错误无法连接到服务器连接被拒绝服务器是否在端口 5432 上运行 https stackoverflow c
SSL 问题 - Jenkins 从属设备与 TFS 的连接问题

升级了詹金斯创建了一个奴隶在从机上安装最新的 JDK 并启动从机当用奴隶标记一个作业并运行它时出现以上错误在谷歌上进行了搜索并根据搜索将我的目标 TFS 的公共证书添加到位于 C Program Files x86 Java j
从 Netbeans 启动 Tomcat 失败

我从 Netbeans IDE 7 4 启动 Apache Tomcat 6 时遇到问题在 7 3 版本上我也遇到了同样的问题其他人提到这个问题也存在于其他版本中例如 8 0 等我做了什么删除已安装的Tomcat 7 不删除它我
是否有宏可以有条件地将行复制到另一个工作表？

在 Excel 2003 中是否有宏或方法可以有条件地将行从一个工作表复制到另一个工作表我通过 Web 查询将 SharePoint 中的数据列表提取到 Excel 中的空白工作表中然后我想将特定月份的行复制到特定工作表例如将 Sh
批处理脚本不运行，尽管其代码在 CMD 中运行

我正在寻找一种简单的方法来获取以 GB 为单位的系统卷信息批量所以我得到了这个 for f tokens 1 3 a in WMIC LOGICALDISK GET FreeSpace Name Size FINDSTR I V Nam
我应该将 useSelector 传递给 useState

大家好我有一个关于您喜欢哪种方法的问题在使用 TypeScript 的 React 功能组件中使用 useSelector 从 Redux State 获取值是 1 const campaign useSelector campaig
无法将 DispatcherServlet 映射到上下文根

这是我用于 spring mvc 的当前配置 1 web xml
我的 C 程序读取一个文本文件。当我将它放入 Xcode 时，它失败了。发生了什么？

我有一个打开 txt 的函数使用 fscanf 读取格式如下的数字 532 2 234 32 当我使用 GCC 编译时它成功地做到了这一点但我无法在 Xcode 中打开文件为什么相关代码是 int main void FILE in
如何禁用 WinForms DataGrid 中的按钮单元格？

我有一个 WinForms 应用程序其中包含一个 DataGridView 控件和一列 DataGridViewButtonCell 单元格当我单击其中一个按钮时它会启动一项后台任务我想禁用这些按钮直到该任务完成我可以禁用 Da
Gekko 长期性能

在下面的代码中全年 PV 斜率优化每小时时间步长 CSV 数据下载link https drive google com file d 172HaD87t9V PDElMER4MwDaWyuCZ3KA5 view usp sharing
如何在使用rescue_from时使用Rails4和RSpec测试渲染状态：404

我有一个带有 PagesController 的 Rails4 应用程序当找不到页面时 show method 会抛出自定义异常 PageNotFoundError 在我定义的控制器之上rescue from PageNotFoundEr
转换输出中不需要的字符编码转换

我这里有一个情况 JAVA版本1 6 Linux RH 5 6 Tikanga Windows 7 Cygwin最新版本等级 1 6 在一台机器 Linux 上当我运行 Gradle 构建时我得到生成的 xsl 文件这些文件与我运行
iOS：Objective-C 中的事件监听器相当于什么？

在我的一些学习中我看到有人提到在视图控制器中您可以拥有一个模型并在模型上有某种监听器来监听其中的变化我认为我没有使用正确的名称这可能就是为什么我的搜索没有找到任何结果的原因本质上我想将服务器调用从控制器移到我的模型中但我需
使用 Netty 的多线程 UDP 服务器

我正在尝试使用 Netty 实现 UDP 服务器这个想法是只绑定一次因此只创建一个Channel This Channel仅使用一个处理程序进行初始化该处理程序通过一个线程在多个线程之间分派传入数据报的处理ExecutorServic
Google Drive API 使用浏览器版本创建空的“无标题”文件

我正在尝试使用 Google Drive API 的浏览器版本它似乎主要遵循 Nodejs 语法但除了浏览器的第一个 hello world 示例之外似乎没有太多示例现在我正在尝试创建一个文件夹然后在该文件夹内创建一个简单的
当任务计划程序启动时隐藏 C# 控制台应用程序窗口

我已经在谷歌上搜索了这个并阅读了一些资源但我无法找到一个好的答案有谁知道如何防止控制台应用程序窗口在任务计划程序启动时打开 Ref 改变output type to Windows application会解决你的问题转到项目 gt
从 XAML 中的 *.resx 文件获取值

是否可以将资源文件中的某些值直接添加到 XAML 标记中或者为了本地化我们总是必须在 cs 文件中制作类似的内容 txtMessage Text Messages WarningUserMessage Where Messages是资源
Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组

让我们考虑一个 DataFrame 它在 2010 年 1 月的每一天包含 1 行 2 个值 date range pd date range dt 2010 1 1 dt 2010 1 31 freq 1D df pd DataFrame

Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组

Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组 的相关文章

随机推荐

热门标签

Python、Pandas：使用 GroupBy.groups 描述将其应用于另一个分组的相关文章