使用 python 按 +- 边距分组

2023-12-19

使用 python 按 +- 边距分组 我想根据边距 +-1 (1) 和 +-10 (2) 对由 2 列 ['1', '2'] 组成的数据框进行分组,例如 [[273, 10],[274, 14] ,[275, 15]] 我希望它的结果是 [[273, 10],[274, 14]],[[274, 14],[275, 15]]。

但我有一个相当大的数据集,按方法分组并不能解决问题,因为我无法输入这两个条件。

例如,这种代码永远带我走,没有结果

1 = np.random.uniform(low=300, high=1800, size=(300000,))
2 = np.random.uniform(low=0, high=7200, size=(300000,))
print("Random numbers were created")
df = pd.DataFrame({'1': 1, '2':2})
df['id'] = df.index
1_MARGIN = 1
2_MARGIN = 10

tic = time.time()

group = []
for index, row in df.iterrows():
    
    filtered_df = df[(row['1'] - 1_MARGIN < df['1']) & (df['1'] < row['1'] + 1_MARGIN) & 
                     (row['2'] - 2_MARGIN < df['2']) & (df['2'] < row['2'] + 2_MARGIN)]
    group.append(filtered_df[['id', '1']].values.tolist())

toc = time.time()
print(f"for loop: {str(1000*(toc-tic))} ms")

我也尝试过

data = df.groupby('1')['2'].apply(list).reset_index(name='irt')

我得到了我想要的结果,但我无法适应条件


None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 python 按 +- 边距分组 的相关文章

  • Python:记录垃圾收集器

    我有一个 python 应用程序 有一些性能问题 我想将垃圾收集器的事件 特别是何时调用 添加到我的日志中 是否可以 thanks http docs python org library gc html gc set debug http
  • 子进程改变目录

    我想在子目录 超级目录中执行脚本 我需要首先进入该子目录 超级目录 我无法得到subprocess进入我的子目录 tducin localhost Projekty tests ve python Python 2 7 4 default
  • Python的reduce()短路了吗?

    If I do result reduce operator and False 1000 得到第一个结果后它会停止吗 自从False anything False 相似地 result reduce operator or True 10
  • 字典中的列表,Python 中的循环

    我有以下代码 TYPES hotmail type hotmail lookup mixed dkim no signatures S Return Path email protected cdn cgi l email protecti
  • Python 正则表达式部分匹配或“hitEnd”

    我正在编写一个扫描器 因此我将任意字符串与正则表达式规则列表进行匹配 如果我可以模拟 Java hitEnd 功能 不仅知道正则表达式何时不匹配 还知道何时匹配 这将非常有用 can t匹配 当正则表达式匹配器在决定拒绝输入之前到达输入末尾
  • Django 的 URL 覆盖率测试为 0%,为什么?

    使用姜戈鼻子 我对 URL 进行了测试 但 URL 覆盖率仍然为 0 为什么 python manage py 测试配置文件 这是我的报道 Name Stmts Miss Cover Missing profiles 0 0 100 pro
  • 在 Flask (WSGI) 中使用全局单例,我是否需要担心竞争条件? [复制]

    这个问题在这里已经有答案了 Flask 的 hello world 演示是 from flask import Flask app Flask name app route def hello return Hello World if n
  • 如何使用 Pandas 将巨大的 CSV 转换为 SQLite?

    我有一个巨大的表 大约 60 GB 采用存档的 CSV 文件形式 我想将其转换为 SQLite 文件 我现在所做的事情如下 import pandas import sqlite3 cnx sqlite3 connect db sqlite
  • 网页抓取 - 前往第 2 页

    如何访问数据集的第二页 无论我做什么 它都只返回第 1 页 import bs4 from urllib request import urlopen as uReq from bs4 import BeautifulSoup as sou
  • 一行Python和SQLite代码,为什么需要加“,”? [复制]

    这个问题在这里已经有答案了 c execute INSERT INTO numbers VALUES random randint 0 100 如果我将上面的代码更改为 c execute INSERT INTO numbers VALUE
  • 在 matplotlib 中使用 yscale('log') 时缺少误差线

    在某些情况下 当使用对数刻度时 matplotlib 会错误地显示带有误差条的图 假设这些数据 例如在 pylab 内 s 19 0 20 0 21 0 22 0 24 0 v 36 5 66 814250000000001 130 177
  • 如何检查列表是否为空?

    这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章 目前不接受新的答案或互动 例如 如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
  • 如何获得没有前缀的虚拟人物?

    我想从两个不同的列中获取虚拟数据 但没有任何前缀 资料说明 X Y 123 AAA 456 BBB 123 AAA 789 CCC 预期结果 X Y 789 456 123 CCC BBB AAA 123 AAA 0 0 1 0 0 1 4
  • Spark中的count和collect函数抛出IllegalArgumentException

    当我使用时抛出此异常时 我尝试在本地 Spark 上加载一个小数据集count 在 PySpark 中 take 似乎有效 我试图搜索这个问题 但没有找到原因 看来RDD的分区有问题 有任何想法吗 先感谢您 sc stop sc Spark
  • smooth_idf 是多余的吗?

    The scikit learn 文档 http scikit learn org stable modules generated sklearn feature extraction text TfidfTransformer html
  • Django 接受 AM/PM 作为表单输入

    我试图弄清楚如何使用 DateTime 字段在 Django 中接受 am pm 作为时间格式 但我遇到了一些麻烦 我尝试在 forms py 文件中这样设置 pickup date time from DateTimeField inpu
  • Spyder 如何在同一线程的后台运行 asyncio 事件循环(或者确实如此?)

    我已经研究 asyncio 模块 功能几天了 因为我想将它用于我的应用程序的 IO 绑定部分 并且我认为我现在对它的工作原理有一个合理的理解 或者在至少我认为我已经理解了以下内容 任一时刻 任一线程中只能运行一个异步事件循环 一旦一切都设置
  • 如何设置 matplotlib 表中列的背景颜色

    我在一个目录中有多个 txt 文件 例如 d memdump 0 txt 1 txt 10 txt 示例文本文件如下 Applications Memory Usage kB Uptime 7857410 Realtime 7857410
  • 从另一个 python 脚本获取返回信息

    我在 Linux 上 我有一个 python 脚本 我想从另一个 python 脚本调用它 我不想将其作为模块导入 为了一层安全性 现在为了学术练习 因为我想弄清楚这一点 我实际上想让一个脚本使用 os system 或另一个类似的函数 并
  • 在游戏中实现功能

    我在完成这部分作业时遇到了麻烦 我必须宣布游戏的获胜者 然后输入到函数中 输入所有 if 语句后 我必须创建一个函数def playGame 这必须包括 showRules user getUserChoice computer getCo

随机推荐

  • 在 listFragment 中实现 OnScrollListener

    我在 ListFragment 中实现了 OnScrollListener 接口 我想在列表的最后一个元素可见时更改文本 但它不起作用 我没有找到类似问题的示例 ListFragment 内的 OnScrollListener 我的例子 p
  • 投掷后生成

    我正在从事一个足球比赛项目 我想要一个球体 在抛出第一个球体后 我必须生成另一个球体 这是我尝试过的 public class spawn MonoBehaviour public Transform SpawnPoints public
  • 将文件流式传输到客户端后,res.end() 永远不会发送

    我基本上试图将文件从 MongoDb 流式传输到客户端 文件接收没有问题 但是当流结束并且我尝试发送 request end 时 客户端永远不会收到它 app post upload function req res var db new
  • Gson 反序列化接口到其 Class 实现

    我在用改造2 1 0 with 转换器 gson 2 1 0并分别格森 2 6 2为了自定义序列化 反序列化 问题是我的 POJO 应该隐藏在接口后面 我想告诉 Gson 哪个类应该是反序列化接口 并且在反序列化 序列化之后Retrofit
  • 游戏开发:如何限制FPS?

    我正在编写一个游戏 我看到 FPS 算法无法正常工作 当他必须计算更多时 他会睡更长的时间 所以 问题很简单 如何计算具有正确 FPS 的睡眠时间 我知道以微秒为单位更新游戏一帧需要多长时间 当然还有我想要达到的 FPS 我正在疯狂地寻找一
  • boost::thread 终止时会自动从 boost::thread_group 中删除吗?

    This question https stackoverflow com questions 3970818 whats the best way to delete boostthread object right after its
  • 从静态 C 库调用函数

    我有一个本机 C 库 静态 即 lib 目标 我希望在我的 C 项目中使用此文件中的一些函数 对于 dll 我可以调用它们 如何对静态库执行此操作 I read 这个问题 https stackoverflow com questions
  • 在ggplot2中添加大括号,然后使用ggsave

    所以这与此非常相关question https stackoverflow com questions 7001799 ggplot2 curly braces on an axis和这个answer https stackoverflow
  • 通过 Twitter API 调用获取用户推文不返回 media_url

    我正在获取用户的推文 但没有在返回的正确 twitter 对象中的实体下获取 media url 甚至在 API 调用中的媒体中也没有获取任何内容 为了测试我使用了这个用户twitterapi https twitter com twitt
  • 在处理递归函数时如何提高(mathematica)性能?

    背景 我想打印 31 1 2 的收敛表 我对该表做了以下递归定义 将 31 1 2 与黄金比例交换 下表将包含斐波那契数列 cf ContinuedFraction tf TableForm p 1 0 p 0 1 q 1 1 q 0 0
  • 如何在多个GWT eclipse项目之间共享代码?

    我希望有多个共享通用代码的 GWT 项目 这可能吗 AFAICT 我的 GWT 项目需要每个都有自己的目录 源代码直接在下面 这似乎排除了代码共享 我尝试使用链接文件夹 但 GWT 似乎不喜欢那样 描述here https stackove
  • 计算 Windows 中字形的位置

    是否有任何简单且兼容的 GDI 或 NET 可访问的 Windows 子系统可以提供字形位置字符 这里的任务是组合符号 例如阿拉伯语中的符号 有时有多个组合符号链堆叠在一起 例如阿拉伯语 Fatha 阿拉伯字母上标 Alef 阿拉伯语 Ma
  • 划分数据框列然后四舍五入

    我一直在操作一些数据框 但不幸的是我有两个百分比列 一个的格式为 61 72 另一个的格式为 0 62 我只想将 61 72 格式的百分比列除以 100 然后将其舍入为 2 dp 以便与数据框一致 有一个简单的方法可以做到这一点吗 我的数据
  • RxJS的combineLatest函数可以从rxjs和rxjs/operators导入,两者有什么区别?

    The 结合最新函数可以从以下位置导入rxjs和来自rxjs 运算符 当我导入它时rxjs 运算符 就像我导入合并所有我收到以下错误 TS2339 Property subscribe does not exist on type Oper
  • 如何解除特定事件处理程序的绑定

    Code Inputfield keyup function e if e which 13 functionXyz else functionZyx document keyup function exit if exit keyCode
  • 连接两个 mysql 表

    我有两个数据库 一个用于文章 另一个用于文章的元信息 如作者 日期 类别和 atc 我在元表中有以下列 ID 文章 ID 元类型和元值 我想知道如何连接这两个表以通过一个 mysql 查询同时获取文章和元信息 文章 ID 在元表中不是唯一的
  • 是什么“魔力”导致在 IE11 中输入“cnn.com”自动启动 Edge (Chromium)?

    I just noticed that when I typed in cnn com into the IE11 address bar Windows 10 that it automatically launched the webs
  • Angular 2:检查反应形式的输入是否为空,如果没有给出输入则输入默认值

    Edit 2 对部分解决方案进行了改进 现在它是一个完整的解决方案 耶 Edit 找到了一个几乎完整的解决方案 它有效 但不完全是我想要的方式 它从加载表单的那一刻起就设置默认值 不理想 如果输入为空 已删除 它不再返回 null 而是返回
  • Chrome 中的 GIF 图像加载缓慢和/或其他问题 [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我在使用 Chrome 和动画 Gif 时遇到问题 它们冻结 加载缓慢 显示屏幕撕裂动画等 1 Type chrome plugins进入
  • 使用 python 按 +- 边距分组

    使用 python 按 边距分组 我想根据边距 1 1 和 10 2 对由 2 列 1 2 组成的数据框进行分组 例如 273 10 274 14 275 15 我希望它的结果是 273 10 274 14 274 14 275 15 但我