Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
有效地从 2 个数据帧中查找日期时间范围的重叠
关于查找日期或时间范围的重叠存在一些问题 例如 https stackoverflow com questions 9044084 efficient date range overlap calculation in python 我用这
python
pandas
performance
datetime
daterange
在 pandas 线图中绘制多列[重复]
这个问题在这里已经有答案了 我试图在折线图中绘制多个列 其中 月份 作为 X 轴 每个 计数 作为新线 我希望它有 5 行 Count 18 Count 14 我尝试绘制 1 条线作为测试 但是当我运行以下代码时 我得到以下输出 但没有图形
python
pandas
Dataset
linegraph
Python 2.7 - statsmodels - 格式化和编写摘要输出
我正在使用逻辑回归pandas 0 11 0 数据处理 和statsmodels 0 4 3在 Mac OSX Lion 上进行实际回归 我将运行约 2 900 个不同的逻辑回归模型 并需要将结果输出到 csv 文件并以特定方式格式化 目前
python
python27
pandas
StatsModels
将大型 Twitter JSON 数据 (7GB+) 加载到 Python 中
我已经通过 AWS 设置了一个公共流来收集推文 现在想做一些初步分析 我的所有数据都存储在 S3 存储桶中 5mb 文件 我下载了所有内容并将所有文件合并为一个 每条推文都按照 Twitter 规范存储为标准 JSON 对象 基本上 合并的
json
python3x
pandas
twitter
ijson
python - 从完整地址获取邮政编码
我有一个数据框 其中一列中有完整地址 我需要创建一个仅包含邮政编码的单独列 有些地址只有五位数字的邮政编码 而其他地址则有额外的四位数字 如何拆分列以获取邮政编码 示例数据 d name bob john address 123 6th S
python
pandas
DataFrame
无法使用 pandas 获取平均日期
我有一个时间序列数据集 我想从中获取平均日期 这是一个人为的示例 显示 pandas datetime64 对象的溢出错误 import pandas as pd import numpy as np rng pd date range 2
python
pandas
从 DST 感知日期时间对象在 Dataframe 中创建 pandas DatetimeIndex
我从在线 API 收集了一系列数据点 每个数据点都有一个值和一个 ISO 时间戳 不幸的是我需要循环它们 所以我将它们存储在临时的dict然后从中创建一个 pandas 数据帧并将索引设置为时间戳列 简化示例 from datetime i
python
pandas
datetime
timezone
DatetimeIndex
如何将 xlsx 读取为 pandas 数据框,并将公式作为字符串
我有一个包含一些计算列的 Excel 文件 例如 我在 a 列中有一些数据 而 b 列是使用 a 列中的值计算的 我需要将新数据附加到 a 列并计算 b 列并保存文件 import pandas as pd df pd DataFrame
Excel
python3x
pandas
pyexcel
忽略 NaN 的列表理解
我正在尝试构建一个列表理解 其条件是不导入 nan 值 但运气不佳 以下是当前代码以及结果输出 什么条件会将 nan 从列表中删除 def generate labels filtered df columnName return labe
python
pandas
按自定义年度频率重新采样
我知道我可以使用 AS JUL 从 7 月 1 日开始每年重新采样 但在不同的日期之前我该如何做 In 11 df Out 11 value date 2005 07 02 4 2005 09 20 7 2005 11 12 4 2005
python
pandas
Panda如何将行分组到不同的时间桶中?
我有一个带有名为时间戳的日期时间类型列的数据帧 我想根据时间部分的时间戳将数据帧拆分为多个数据帧 每个数据帧包含按其值模 x 分钟进行值的行 其中 x 是变量 请注意e and f不按原来的顺序 以 10 分钟为模 我希望所有时间都以3在一
python
pandas
NumPy
scipy
加快 pandas groupby 中的滚动总和计算
我想按组计算大量组的滚动总和 但我很难快速地完成它 Pandas 内置了滚动和展开计算器的方法 这是一个例子 import pandas as pd import numpy as np obs per g 20 g 10000 obs g
python
pandas
performance
pandasgroupby
rollingcomputation
从第二个 DF 中查找一个 DF 中属于同等大小的矩形(由两个点给出)的点的快速(矢量化)方法
我的数据框 A 如下所示 type latw lngs late lngn 0 1000 45 457966 9 174864 45 458030 9 174907 1 1000 45 457966 9 174864 45 458030 9
python
pandas
NumPy
DataFrame
parallelprocessing
Python Pandas:返回连续缺失的工作日日期并为数据框中缺失的日期分配比率
Dates rates 7 26 2019 1 04 7 30 2019 1 0116 7 31 2019 1 005 8 1 2019 1 035 8 2 2019 1 01 8 6 2019 0 9886 8 12 2019 0 965
python
pandas
Pandas groupby:根据另一列中的值更改一列中的值
我会尽力解释我的问题 但我是 Pandas 新手 所以请耐心等待 我有一个 Pandas 数据框df Random ID Seq ID Type Seq Token 0 8 1 User First 1 8 2 Agent Second 2
python
python3x
pandas
pandasgroupby
Pandas 中的索引如何工作?
我是Python新手 这似乎是一个需要问的基本问题 但我真的很想了解这里发生了什么 import numpy as np import pandas as pd tempdata np random random 5 myseries on
python
pandas
如何打开sqlite数据库并将其转换为pandas dataframe
我已经下载了一些数据作为 sqlite 数据库 data db 我想在 python 中打开这个数据库 然后将其转换为 pandas 数据框 这是到目前为止我所做的 import sqlite3 import pandas dat sqli
python
database
SQLite
pandas
DataFrame
将 pandas qcut bins 应用于新数据
我使用 pandas qcut 将一些数据分成 20 个容器 作为二元分类模型训练数据准备的一部分 如下所示 data VAR BIN pd qcut cc data var 20 labels False 我的问题是 如何将从上面的 qc
python
pandas
用布尔数组屏蔽一系列
这给我带来了很多麻烦 我对 numpy 数组与 pandas 系列的不兼容感到困惑 例如 当我使用系列创建布尔数组时 x np array 1 2 3 4 5 6 7 y pd Series 1 2 3 4 5 6 7 delta np p
python
pandas
NumPy
Pandas:比较系列中的列表对象
在我的数据框中 一列由列表组成 例如 df pd DataFrame A 1 2 2 4 3 1 我需要找出列表 1 2 在此数据框中的位置 我试过 df loc df A 1 2 and df loc df A 1 2 但完全失败了 比较
python
pandas
«
1
2
3
4
5
6
7
8
...100
»