Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
计算 Dask 中过去 n 天的滚动平均值
我正在尝试计算大型数据集过去 n 天 n 30 的滚动平均值 在 Pandas 中 我将使用以下命令 temp chunk groupby id code apply lambda x x set index entry time flat
python
pandas
Dask
daskdataframe
Dask 数据帧并行任务
我想从数据帧创建功能 附加列 并且我有以下许多功能的结构 遵循本文档https docs dask org en stable delayed best practices html https docs dask org en stabl
Dask
daskdistributed
daskdataframe
daskdelayed
将 SQL 查询读入 Dask DataFrame
我正在尝试创建一个函数 该函数将 SQL SELECT 查询作为参数 并使用 dask 将其结果读入 dask DataFramedask read sql query功能 我是 dask 和 SQLAlchemy 的新手 我首先尝试了这个
python
pandas
sqlalchemy
Dask
daskdataframe
Dask:定期更新已发布的数据集并从其他客户端提取数据
我想将数据附加到published dask dataset来自队列 如 redis 然后其他 python 程序将能够获取最新数据 例如每秒 分钟一次 并执行一些进一步的操作 这可能吗 应该使用哪个附加接口 我应该将它加载到pd Data
Dask
daskdistributed
daskdataframe
使用 Dask 导入大型 CSV 文件
我正在使用 Dask 导入一个非常大的 csv 文件 680GB 但是 输出不是我所期望的 我的目标是仅选择一些列 6 50 并可能过滤它们 我不确定 因为似乎没有数据 import dask dataframe as dd file pa
python
DataFrame
Dask
daskdataframe
vaex