具有 MultiIndex 的 Pandas DataFrame：按日期时间级别值的年份进行分组

2024-01-14

我有一个带有多重索引的 pandas 数据框，如下所示：

# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd

# multi-indexed dataframe
df = pd.DataFrame(np.random.randn(8760 * 3, 3))
df['concept'] = "some_value"
df['datetime'] = pd.date_range(start='2016', periods=len(df), freq='60Min')
df.set_index(['concept', 'datetime'], inplace=True)
df.sort_index(inplace=True)

控制台输出：

df.head()
Out[23]: 
                 0         1         2
datetime                              
2016      0.458802  0.413004  0.091056
2016     -0.051840 -1.780310 -0.304122
2016     -1.119973  0.954591  0.279049
2016     -0.691850 -0.489335  0.554272
2016     -1.278834 -1.292012 -0.637931

df.head()
    ...: df.tail()

Out[24]: 
                 0         1         2
datetime                              
2018     -1.872155  0.434520 -0.526520
2018      0.345213  0.989475 -0.892028
2018     -0.162491  0.908121 -0.993499
2018     -1.094727  0.307312  0.515041
2018     -0.880608 -1.065203 -1.438645

现在我想沿着“日期时间”级别创建年度总和。

我的第一次尝试如下，但这不起作用：

# sum along years
years = df.index.get_level_values('datetime').year.tolist()
df.index.set_levels([years], level=['datetime'], inplace=True)
df = df.groupby(level=['datetime']).sum()

对我来说，这似乎也相当沉重，因为这项任务可能很容易实现。

所以这是我的问题：如何获得“日期时间”级别的年度总和？是否有一种简单的方法可以通过将函数应用于日期时间级别值来实现这一点？

You can groupby http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html按第二级multiindex and year http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DatetimeIndex.year.html:

# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd

# multi-indexed dataframe
df = pd.DataFrame(np.random.randn(8760  * 3, 3))
df['concept'] = "some_value"
df['datetime'] = pd.date_range(start='2016', periods=len(df), freq='60Min')
df.set_index(['concept', 'datetime'], inplace=True)
df.sort_index(inplace=True)
print df.head() 
                                       0         1         2
concept    datetime                                         
some_value 2016-01-01 00:00:00  1.973437  0.101535 -0.693360
           2016-01-01 01:00:00  1.221657 -1.983806 -0.075609
           2016-01-01 02:00:00 -0.208122 -2.203801  1.254084
           2016-01-01 03:00:00  0.694332 -0.235864  0.538468
           2016-01-01 04:00:00 -0.928815 -1.417445  1.534218

# sum along years
#years = df.index.get_level_values('datetime').year.tolist()
#df.index.set_levels([years], level=['datetime'], inplace=True)

print df.index.levels[1].year
[2016 2016 2016 ..., 2018 2018 2018]
df = df.groupby(df.index.levels[1].year).sum()
print df.head()
               0           1          2
2016  -93.901914  -32.205514 -22.460965
2017  205.681817   67.701669 -33.960801
2018   67.438355  150.954614 -21.381809

或者你可以使用get_level_values http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Index.get_level_values.html and year http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DatetimeIndex.year.html:

df = df.groupby(df.index.get_level_values('datetime').year).sum()
print df.head()
               0           1          2
2016  -93.901914  -32.205514 -22.460965
2017  205.681817   67.701669 -33.960801
2018   67.438355  150.954614 -21.381809

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

具有 MultiIndex 的 Pandas DataFrame：按日期时间级别值的年份进行分组的相关文章

Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other
Python（Selenium）：如何通过登录重定向/组织登录登录网站

我不是专业程序员所以请原谅任何愚蠢的错误我正在做一些研究我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库在我解决
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
解释 Python 中的数字范围

在 Pylons Web 应用程序中我需要获取一个字符串例如关于如何做到这一点有什么建议吗我是 Python 新手我还没有找到任何可以帮助解决此类问题的东西该列表将是 1 2 3 45 46 48 49 50 51 77 使用
Conda SafetyError：文件大小不正确

使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
Python：如何将列表列表的元素转换为无向图？

我有一个程序可以检索 PubMed 出版物列表并希望构建一个共同作者图这意味着对于每篇文章我想将每个作者如果尚未存在添加为顶点并添加无向边或增加每个合著者之间的权重我设法编写了第一个程序该程序检索每个出版物的作者列表并
识别 pandas 数据框中各组之间的差异

我有一个按日期和 ID 索引的 pandas 数据框我想识别日期之间增删的ID 将 ID 添加到另一个数据帧以及添加删除的日期 date ID value 12 31 2010 13 0 124409 9 0 555959 1 0 7
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate

随机推荐

保护对微光应用程序的访问

这是我之前问题的后续问题可以看到闪亮的微光应用程序的代码 https stackoverflow com questions 14671609 is is possible to see the code for shiny glimme
如何编译mod_proxy_uwsgi或mod_uwsgi？

所以我尝试在 apache2 后面使用 uwsgi 但我是在 CentOS 6 机器上这样做的我习惯使用基于 Debian Ubuntu 的系统作为上下文 I used pip install uwsgi并遵循使用 Django 应用程序
数据结构：插入、删除、包含、获取随机元素，全部都是 O(1)

我在面试时被问到这个问题你会如何回答设计一个数据结构在 O 1 时间内提供以下操作 insert remove contains 获取随机元素考虑一个由哈希表 H 和数组 A 组成的数据结构哈希表键是数据结构中的元素值是它们在数
我应该直接从视图 yii2 调用模型吗

我有点困惑因为在这里他们直接调用模型因此不通过控制器传递它 http www yiiframework com doc 2 0 guide input forms html http www yiiframework com doc
编译器错误，还是非标准代码？ - lambda 中的可变参数模板捕获

我有以下 C 11 代码 template
获得一个粘性标题“向上推”，就像在 Instagram 的 iPhone 应用程序中使用 CSS 和 jQuery

Instagram 应用程序有一个很好的粘性标题可以将当前标题推到新标题的位置我找到了一个关于如何在 Android 上本地执行此操作的很棒的教程但我希望使用 JavaScript 和 CSS 来执行此操作我能够将我的标题换成新的
在哪里可以找到 Windows GUI 标准？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我听说他们有标准的 GUI 指南但我似乎找不到工作链接谢谢是不是Windows 用户体验交互指南
保留组合条形图中缺失列的位置

一个非常常见的问题是当 ggplot 中缺少列时保留条形的宽度例如1 https stackoverflow com questions 11020437 consistent width for geom bar in the even
使用 ajax 处理长时间的服务器端操作？

I ve a 特别长时间操作将在以下情况下运行用户按下界面上的按钮我想知道什么是最好的方式将此信息返回给客户端该操作正在填充事实表中多年的数据这大约需要 20 分钟所以我不打算将界面设置为同步即使服务器端产生大量数据我仍然
Winforms 订阅自己的事件

我看到开发人员在 WinForms 中做的一件常见的事情是表单控件订阅自己的事件这样你就可以得到 this Load new System EventHandler this WelcomeQuickViewWF Load this A
如何在每个页面的后台页面运行 chrome.tabs.insertCSS？

我想在页面中添加自定义样式表without内容脚本我的 CSS 没问题但是下面的代码使用了onUpdated and onCreated事件监听器不起作用 Part of manifest json permissions http w
$moduleManager->getEventManager()->getSharedManager()->attach 在稳定的 zf2 中不起作用

namespace Auth use Zend ModuleManager ModuleManager class Module public function init ModuleManager moduleManager shared
应用程序图标有未分配的图像错误

我收到这些错误我分不清到底在说哪件事如果是 42 毫米 2x 那么我就没有地方放它了你能帮我吗谢谢编辑根据下面的评论我查看了右侧窗格看起来需要 44 2x 所以我创建了一个但是Unassigned当我将图标拖到其上时它不
NextJs：使用 Intro.js 时未定义元素 [重复]

这个问题在这里已经有答案了为什么我在使用时出现以下错误intro js在我的下一个项目中 ReferenceError Element is not defined br Because intro js使用 DOM API 并且在 SS
当对象被删除时，对象内部的 setInterval 是否会阻止垃圾回收？

我正在开发一个小型 Websocket 项目使用 Socket io 其中我使用这样的类 function myClass start server sync window setInterval this update bind thi
在 PostgreSQL 中合并 JSONB 值？

使用运算符产生以下结果 select a b 2 jsonb a c 3 jsonb column a c 3 1 row 我希望能够实现以下结果只是运算符的占位符 select a b 2 jsonb a c 3 jsonb colu
R：使用许多配对物种和丰度列重新组织数据框

我得到了一个生态数据数据框其中包含几对物种丰度列如下所示 df lt data frame site 1 3 sp1 c A A X abund1 c 10 20 30 sp2 c B B Y abund2 c 10 20 30 sp3
使用 .htaccess 或 PHP 重定向到不同的 URL [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我在index php 有一个表单
PHP 中的stream_select() 问题

我正在使用stream select 但几秒钟后它返回0个描述符而我的函数仍然有数据要读取但一个不寻常的事情是如果您将超时设置为 0 那么我总是得到描述符的数量为零 num stream select read w e 0 Strea
具有 MultiIndex 的 Pandas DataFrame：按日期时间级别值的年份进行分组

我有一个带有多重索引的 pandas 数据框如下所示 coding utf 8 import numpy as np import pandas as pd multi indexed dataframe df pd DataFrame

具有 MultiIndex 的 Pandas DataFrame：按日期时间级别值的年份进行分组

具有 MultiIndex 的 Pandas DataFrame：按日期时间级别值的年份进行分组 的相关文章

随机推荐

热门标签

具有 MultiIndex 的 Pandas DataFrame：按日期时间级别值的年份进行分组的相关文章