快速半正弦近似（Python/Pandas）

2024-01-03

Pandas 数据框中的每一行包含 2 个点的纬度/经度坐标。使用下面的 Python 代码，计算许多（数百万）行的这 2 个点之间的距离需要很长时间！

考虑到这两个点相距不到 50 英里，并且精度不是很重要，是否可以使计算速度更快？

from math import radians, cos, sin, asin, sqrt
def haversine(lon1, lat1, lon2, lat2):
    """
    Calculate the great circle distance between two points 
    on the earth (specified in decimal degrees)
    """
    # convert decimal degrees to radians 
    lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2])
    # haversine formula 
    dlon = lon2 - lon1 
    dlat = lat2 - lat1 
    a = sin(dlat/2)**2 + cos(lat1) * cos(lat2) * sin(dlon/2)**2
    c = 2 * asin(sqrt(a)) 
    km = 6367 * c
    return km


for index, row in df.iterrows():
    df.loc[index, 'distance'] = haversine(row['a_longitude'], row['a_latitude'], row['b_longitude'], row['b_latitude'])

这是同一函数的向量化 numpy 版本：

import numpy as np

def haversine_np(lon1, lat1, lon2, lat2):
    """
    Calculate the great circle distance between two points
    on the earth (specified in decimal degrees)
    
    All args must be of equal length.    
    
    """
    lon1, lat1, lon2, lat2 = map(np.radians, [lon1, lat1, lon2, lat2])
    
    dlon = lon2 - lon1
    dlat = lat2 - lat1
    
    a = np.sin(dlat/2.0)**2 + np.cos(lat1) * np.cos(lat2) * np.sin(dlon/2.0)**2
    
    c = 2 * np.arcsin(np.sqrt(a))
    km = 6378.137 * c
    return km

输入都是值数组，它应该能够立即处理数百万个点。要求是输入是 ndarray，但 pandas 表的列将起作用。

例如，使用随机生成的值：

>>> import numpy as np
>>> import pandas
>>> lon1, lon2, lat1, lat2 = np.random.randn(4, 1000000)
>>> df = pandas.DataFrame(data={'lon1':lon1,'lon2':lon2,'lat1':lat1,'lat2':lat2})
>>> km = haversine_np(df['lon1'],df['lat1'],df['lon2'],df['lat2'])

或者，如果您想创建另一列：

>>> df['distance'] = haversine_np(df['lon1'],df['lat1'],df['lon2'],df['lat2'])

在 python 中循环数据数组非常慢。 Numpy 提供了对整个数据数组进行操作的函数，这可以让您避免循环并显着提高性能。

这是一个例子矢量化 http://en.wikipedia.org/wiki/Array_programming.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pandas

GIS

haversine

快速半正弦近似（Python/Pandas）的相关文章

将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
如何使用Conda下载python包并随后离线安装？

我知道通过 pip 我可以使用以下命令下载 Python 包但 pip install 破坏了我的内部包依赖关系当我做 pip download
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
在f字符串中转义字符[重复]

这个问题在这里已经有答案了我遇到了以下问题f string gt gt gt a hello how to print hello gt gt gt f a a gt gt gt f a File
python获取上传/下载速度

我想在我的计算机上监控上传和下载速度一个名为 conky 的程序已经在 conky conf 中执行了以下操作 Connection quality alignr wireless link qual perc wlan0 downspe
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
导入错误：没有名为 site 的模块 - mac

我已经有这个问题几个月了每次我想获取一个新的 python 包并使用它时我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误实际上我无法使用任何新软件包因为每次我

随机推荐

开发cocos-lua游戏时，Android中string.find中文字符失败，PC上成功

我尝试使用string find 中国中我开发cocos lua游戏时在PC上成功但在Android上失败在安卓上 string find return nil 首先我认为它们的编码可能不同所以我尝试打印出它们的字节 Andr
使用 `*((*(&array + 1)) - 1)` 获取自动数组的最后一个元素是否安全？

假设我想获取大小未知的自动数组的最后一个元素我知道我可以利用sizeof运算符来获取数组的大小并相应地获取最后一个元素正在使用 array 1 1 safe Like char array SOME SIZE printf Last e
从android中的地址获取纬度和经度

我尝试从地址获取纬度和经度问题是当我只给出城市名称时它会给出正确的纬度和经度而当我给出完整的地址如州城市名称街道号码时它会给出正确的纬度和经度没有给我正确的纬度和经度感谢您的配合回复我的代码是 String addre
Ant 任务检查数据库（连接）是否存在？

ANT 是否有可能在不导致构建失败的情况下检查数据库连接是否存在例如
按 utc 日期而不是服务器日期滚动文件

这是我的 log4net xml 文件
pyqt：如何从 QVBoxLayout 中删除元素？

我想要一个多颜色选择小部件我这样做的方式是有一个按钮和一个最初为空的 vbox 当按下时它会向包含按钮和 3 个旋转框的 vbox 添加一个 QHBoxLayout 当按下按钮时我希望该行消失并且所有内容都恢复到添加该行之前
DLib：train_shape_predictor_ex.cpp

我正在尝试通过执行来训练 Dlib 的形状预测器train dlib shape predictor ex cpp http dlib net train shape predictor ex cpp html on 海伦数据集 http
ng-content 选择绑定变量

我正在尝试使用 Angular 2 创建一个表单生成器一个非常基本的示例如下 this fields name Name type text name Age type number 但我也想支持自定义元素例如 this fields
ResourceDictionary 源绑定到模块（用于本地化）

我有一个 XAML 窗口其中有一组绑定到对象的字符串如下所示
Sonarqube：查看涵盖源代码的单元测试

我们在 Bamboo 中有一个 CI 设置它运行 Junit 测试并使用 Jacoco 计算单元测试覆盖率然后我们运行Sonar插件进行源代码分析一切都运行良好我们可以看到 SonarCube 服务器上的分析包括覆盖范围但我们希
Symfony 框架的最佳论坛插件解决方案是什么？

我正在寻找一个好的解决方案整合论坛进入 symfony 应用程序像 phpBB 这样的东西会很棒我见过 phpBB 插件与 symfony 集成但这不足以满足我的目的而且在我看来映射数据库表是一种蹩脚的方法如果有人知道 Sym
如何在微服务/容器/云环境中管理机密？

微服务和云是一回事每个人都在谈论和写作就我个人而言我对这个主题思考了很多如何利用它从中受益可能面临哪些挑战这如何加速日常开发以及如何管理一切几天来困扰我的一个问题是如何在微服务云环境中管理机密想象一下一家拥有 150
如何在 Chrome 上下载文件而不自动将文件重命名为“下载”？

我使用 javascript 生成文件并下载它看来根据 chrome 版本的不同下载文件名可以自动重命名为 download 有办法避免吗这是我的代码 var link document createElement a link s
UISearchBar 使用 Storyboard 实现

我对 iOS 开发非常陌生但也很兴奋我构建了一个应用程序它使用故事板并使用 plist 文件的内容填充 UITableView 到目前为止我设法让一切运行良好但现在我想添加一个搜索栏就像联系人应用程序中的搜索栏一样本质上这就是
如何访问Singleton类的静态方法？

我对单例类有一些困惑以下是我的一些观点单例类可以有静态方法吗如果是的话我们如何调用该方法静态类和单例类之间的主要区别是什么我创建了我的单例类如下所示 public class Singleton private static S
如何修复 RedBlackTree 实现中的删除问题？

这是我正在使用的 RedBlackTree 的实现来自 Mark Allen Weiss 数据结构 public class RedBlackTree
SequenceStyleGenerator，如何使用前缀而不是后缀

我正在休眠中处理序列我们有一个关于序列命名的命名约束格式为 SEQ 我如何自定义参数化类 SequenceStyleGenerator 以便在序列名称中添加前缀最后我创建了一个继承自 SequenceStyleGenerator
如何将 PathCchCanonicalizeEx 与 C++Builder 10.2 一起使用？

我有一个使用旧版 32 位 C 编译器的旧版 Windows 项目由于各种原因我需要使用Windows 8 功能PathCchCanonicalizeEx https stackoverflow com questions 7103864
Grails 2.1.0 不自动重新加载/自动重新编译

看来 Grails 确实会自动重新编译我的 GSP 页面但不会自动重新编译我的控制器它曾经与以前版本的 Grails 一起使用知道我可以寻找什么吗在 OSX Snow Leopard 上使用 Grails 2 1 0 注意这类似于
快速半正弦近似（Python/Pandas）

Pandas 数据框中的每一行包含 2 个点的纬度经度坐标使用下面的 Python 代码计算许多数百万行的这 2 个点之间的距离需要很长时间考虑到这两个点相距不到 50 英里并且精度不是很重要是否可以使计算速度更快 from

快速半正弦近似（Python/Pandas）

快速半正弦近似（Python/Pandas） 的相关文章

随机推荐

热门标签

快速半正弦近似（Python/Pandas）的相关文章