重新采样数据帧，计算间隔内不同列的最小值、最大值以及第一列和最后一列

2024-03-26

我有一个数据库，其中包含 1 分钟的交易数据条目，包括开盘价、最高价、最低价和收盘价。我想创建一个函数，删除某些时间戳以仅保留 30m 条目。但是，需要更新该时间戳的值以反映新的周期。

我执行了以下代码，但有一个问题：

def time_stamp(minutes):
    Start_stamp=1609459200000
    End_stamp=1622505540000
    Interval=60000*minutes
    list_stamp=np.arange(Start_stamp, End_stamp+1, Interval).tolist()
    for i in range(minutes,End_stamp,minutes):
        df.loc[i,'High']=df['High'].loc[-minutes:].max()
        df.loc[i,'Low']=df.loc[-minutes:,'Low'].min()
        df.loc[i,'Open']=df.loc[-minutes:,'Close']
    df.drop(df.loc[~df['t'].isin(list_stamp)].index, inplace=True)
    return df
time_stamp(30)

ValueError：索引器与系列不兼容

有人可以给我一些建议吗？谢谢你！

有一种更像熊猫的方法可以做到这一点。

由于没有数据样本，我不得不制作一个。这是执行此操作的代码：

#Make the data
index = pd.date_range('1/1/2000',periods=60*24,freq='T')
df = pd.DataFrame(np.random.rand(60*24,2),columns = ['open','close'],index=index)
df = df+1 # doing this to avoid possiblity of negative values in next steps
df['high'] = df.apply(lambda row: row.max() + np.random.random(),axis=1)
df['low'] = df.apply(lambda row: row.min() - np.random.random(),axis=1)

此时 df 的状态 (head(10)

,open,close,high,low
2000-01-01 00:00:00,1.5236619202496442,1.151985535527245,1.7477467456279827,0.3031985970254675
2000-01-01 00:01:00,1.7567707020541863,1.844917989219291,2.3157262902092053,0.781678343968321
2000-01-01 00:02:00,1.4329459219698644,1.5715643667517165,2.2800512080007325,0.4385068358774301
2000-01-01 00:03:00,1.6278939890163286,1.4967963857419173,2.4514762537932637,0.7483790156969329
2000-01-01 00:04:00,1.7696997962274348,1.7981539004095517,2.1609841398138325,1.4423796609201727
2000-01-01 00:05:00,1.3156416756165012,1.6792424542358473,2.6725022251661867,1.263416934678443
2000-01-01 00:06:00,1.4611709821585714,1.3417705793465275,1.7269143465983203,0.6447125825749427
2000-01-01 00:07:00,1.1353922264378535,1.3576210147951089,1.8826801353270626,0.49493624242983736
2000-01-01 00:08:00,1.6827074173849588,1.2127513631592481,2.4320709664997366,1.015161578142598
2000-01-01 00:09:00,1.277323428018112,1.379928215762615,2.1107247913266804,0.7283856978040806

然后我们就可以做你需要做的事情了（注意时间戳就是索引）

df.重采样 https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.resample.html#pandas.DataFrame.resample将时间序列“重新采样”为您选择的频率。我用了 30 分钟，正如问题中指定的那样。

.agg https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.agg.html让我们做你想做的 -> 获取第一个开盘日期、最后一个收盘日期、最高价和最低价：

df = df.resample('30T').agg({'open': 'first', 'close': 'last','high':'max','low':'min'})

最终输出：

,open,close,high,low
2000-01-01 00:00:00,1.5236619202496442,1.9399515432326182,2.7830658255264904,0.11963392810868156
2000-01-01 00:30:00,1.3507487064130956,1.943836375991639,2.8756089239367886,0.18513880795935822
2000-01-01 01:00:00,1.3521982535896768,1.3917486576623297,2.8566136804896236,0.1750201985909
2000-01-01 01:30:00,1.0429129450145977,1.653875051452551,2.903310168048458,0.12223652926377937
2000-01-01 02:00:00,1.724667336487399,1.3501859745845943,2.7883533771155182,0.10617913875428453
2000-01-01 02:30:00,1.0951747626878743,1.9314727636907452,2.704938040638077,0.2811809746810251
2000-01-01 03:00:00,1.2706302627630148,1.7120392033624894,2.909430407567025,0.11251041513367666
2000-01-01 03:30:00,1.2979020670054455,1.1065439262276353,2.7908377681443057,0.3071618087183765
2000-01-01 04:00:00,1.2146422040399025,1.3758650428561257,2.906605257212037,0.2757186485567582
2000-01-01 04:30:00,1.2791605232157812,1.3337224908227947,2.968804134958828,0.1021661248014647

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

timestamp

trading

重新采样数据帧，计算间隔内不同列的最小值、最大值以及第一列和最后一列的相关文章

如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

如何获取实现 CometProcessor 接口的 servlet 的请求以通过过滤器

我有一个servlet实现彗星处理器 http tomcat apache org tomcat 6 0 doc api org apache catalina CometProcessor html我试图让传入该 servlet 的请求通
有没有一种方法可以像 DataTable 一样管理对不规则 XML 文档的更改？

我正在寻找一种方法来导入和导出 XML 数据文档的更改列表不规则结构不自然地适合数据集如果我有一个常规结构我将使用数据表我可以评估哪些记录已被编辑然后提交或取消更改并且我还可以传输所需更改的数据包如何使用 XML 数据执行此
d3 不均匀分布缩放

关于绘制值之间间距不等的轴的任何建议例如我目前正在使用以下方法绘制轴 yScale d3 scale linear domain 0 60000 range height 0 我需要 0 到 5000 之间更大的间距而不是平均分配所有
如何在 reStructuredText (reST) 中写入乘号？

我正在编写将使用 Sphinx 呈现为 HTML 和 PDF 的 reST 文档我的源文件是 UTF 8 并且期望我的 HTML 显示为 UTF 8 书写乘号的最佳做法是什么即而不是x 我知道我可以将它作为 Unicode 字符插入
logback.xml 并从 JetBrains IDEA IDE 运行应用程序

我在IDEA中开发应用程序时 logback xml应该放在哪里才能对应用程序产生影响当您运行调试 IDEA 时似乎不会生成任何 jar 也不会调用 Maven 来构建某些内容它是否直接从编译的 class 文件执行 main 如果
避免在具有多个值类型的映射中进行未经检查的分配？

我在 Java 7 中遇到警告问题 Unchecked assignment java lang Class to java lang Class
保持标题 (h1, h2...) 在换行符处不全宽

我的标题有display inline block集但其中一个非常长需要两行问题是当它中断到第二行时它会自动使其占据父容器的整个宽度即使它周围有足够的空间并且设置为内联块有人知道如何防止这种情况吗另外如果它会破坏其他标题
“找不到文件：VBA6.dll”错误 - 奇怪的行为

我运行的是 Windows 8 和 Office 2013 64 位我正在尝试继续从 Office 2010 32 位开始的 Excel 中的 VBA 开发我知道必要的 64 位更改但我收到了令人困惑的配置错误问题是这样的如果我
Django 的 CSS 加载块

我有几页对于每个页面我需要加载唯一的 css 对于我使用的所有静态文件this https docs djangoproject com en dev howto static files with a template tag 在in
Go中没有startswith、endswith函数吗？

只是好奇地想知道为什么 Go 编程语言中的标准库中没有像startswith endswith 等标准函数 The strings http golang org pkg strings包装包含有前缀 http golang org pk
默认字符串初始化：NULL 还是空？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何在颤动中按下后更改 ElevatedButton 的背景颜色，但我有三个，所以在选择时应该更改一个

在此输入图像描述 https i stack imgur com LpWw0 png 我有三个按钮当我按一个按钮时我不希望所有按钮都更改背景颜色只有选定的一个可以那么我该如何实现这一目标尝试以下代码希望对您有帮助 Create E
Azure linux上的Git推送节点js失败，kudu想要运行dotnet命令

从本地 git 推送到 Azure 应用服务 git 失败直到昨天为止这一直运作良好我真的不明白为什么dotnet当App在Linux中运行时参与Azure中的推送执行我在本地从 Windows Powershell 运行 git
使用多个配置文件配置 logback

我试图通过 springboot 下的配置文件分割我的 logback xml 这是我的方法 logback prod xml
如何从 Web 服务 JSON 数组或对象反序列化？

我在 Windows Phone 7 中创建了一个 Web 服务应用程序这是从下面的 uri 获取的 JSON 数组 id 4 name 班加罗尔 id 1 name 钦奈 id 3 name 海得拉巴 id 2 name 孟买 List
如何实现从一个进程到另一个进程的快速上下文切换？

我需要在沙箱进程上运行不安全的本机代码并且需要减少进程切换的瓶颈两个进程控制器和沙箱共享两个自动重置events http msdn microsoft com en us library windows desktop aa964
为什么 C 允许缺少函数声明？

今天我们遇到了一个不寻常的现象一位同事在他的代码中调用了一个正常运行的函数这触发了 libc gethostbyname 中的段错误令人费解的是相同的函数在同一运行时的其他源文件中运行没有问题令人惊讶的是当使用 valgrind
如何使用 OpenCV Viz 和 ARUCO 转换增强现实应用的 3D 模型

我正在开发一个简单的基于标记的增强现实应用程序OpenCV 可视化 and ARUCO 我只想在标记上可视化 3D 对象 PLY 格式我可以使用 ARUCO 毫无问题地运行标记检测和姿态估计返回旋转和平移向量我可以在 Viz 窗口中可
如何将函数的python代码打印到终端？ [复制]

这个问题在这里已经有答案了我有一个系统在其中我不断地试验函数的内容然后运行程序由于我经常打开许多终端窗口因此有时我并不确切知道哪个版本的函数属于哪个终端窗口有没有办法将特定函数的源代码打印到终端好吧感谢 Hoopdady 在
重新采样数据帧，计算间隔内不同列的最小值、最大值以及第一列和最后一列

我有一个数据库其中包含 1 分钟的交易数据条目包括开盘价最高价最低价和收盘价我想创建一个函数删除某些时间戳以仅保留 30m 条目但是需要更新该时间戳的值以反映新的周期我执行了以下代码但有一个问题 def time sta

重新采样数据帧，计算间隔内不同列的最小值、最大值以及第一列和最后一列

重新采样数据帧，计算间隔内不同列的最小值、最大值以及第一列和最后一列 的相关文章

随机推荐

热门标签

重新采样数据帧，计算间隔内不同列的最小值、最大值以及第一列和最后一列的相关文章