Python 使用新的相机位置创建图像

2024-01-31

我现在正在努力完成一项特定的计算机视觉任务。例如，假设我们有一个道路的相机框架。现在我想用水平平移的假想相机生成一个新帧。此外，还添加了一个微小的摄像角度。为了说明这一点，我上传了一张演示图片：

如何在 python 中从原始框架创建新框架？对于我的其他计算机视觉任务，我已经在使用 OpenCV。

我也为此苦苦挣扎了一段时间，直到我看到这篇有用的帖子 https://stackoverflow.com/questions/23920729/compute-homography-for-a-virtual-camera-with-opencv/23951677#23951677分享一些示例代码。我理论上理解，如果你有单应矩阵，你可以使用 OpenCV 的 warpPerspective 函数获得新的框架。由于您拥有精确的平移和旋转值，因此您可以根据相机的内在参数自行推导矩阵。然而直到我自己尝试了代码，我才完全明白它是如何完成的。

我们知道，对于空间中的 3D 点到 2D 图像的投影，单应性矩阵由下式给出

H = K[R|T]

要将点从一个 2D 图像转换为另一个图像，您只需先将点反向投影到 3D，然后将它们重新投影到新的图像平面。

x’ = K * [R2|T2] * [R1|T1](inv) * K(inv) * x

[R2|T2] * [R1|T1](inv) 相当于单个变换矩阵，它给出从一个相机位姿到另一个相机位姿的相对变换。所有矩阵通过在需要的地方附加 [0, 0, 0, 1] 形成 4x4。

以下是一些示例代码，这些代码改编自同一篇文章的代码。

import cv2
import numpy as np

f = 500
rotXval = 90
rotYval = 90
rotZval = 90
distXval = 500
distYval = 500
distZval = 500

def onFchange(val):
    global f
    f = val
def onRotXChange(val):
    global rotXval
    rotXval = val
def onRotYChange(val):
    global rotYval
    rotYval = val
def onRotZChange(val):
    global rotZval
    rotZval = val
def onDistXChange(val):
    global distXval
    distXval = val
def onDistYChange(val):
    global distYval
    distYval = val
def onDistZChange(val):
    global distZval
    distZval = val

if __name__ == '__main__':

    #Read input image, and create output image
    src = cv2.imread('test.jpg')
    src = cv2.resize(src,(640,480))
    dst = np.zeros_like(src)
    h, w = src.shape[:2]

    #Create user interface with trackbars that will allow to modify the parameters of the transformation
    wndname1 = "Source:"
    wndname2 = "WarpPerspective: "
    cv2.namedWindow(wndname1, 1)
    cv2.namedWindow(wndname2, 1)
    cv2.createTrackbar("f", wndname2, f, 1000, onFchange)
    cv2.createTrackbar("Rotation X", wndname2, rotXval, 180, onRotXChange)
    cv2.createTrackbar("Rotation Y", wndname2, rotYval, 180, onRotYChange)
    cv2.createTrackbar("Rotation Z", wndname2, rotZval, 180, onRotZChange)
    cv2.createTrackbar("Distance X", wndname2, distXval, 1000, onDistXChange)
    cv2.createTrackbar("Distance Y", wndname2, distYval, 1000, onDistYChange)
    cv2.createTrackbar("Distance Z", wndname2, distZval, 1000, onDistZChange)

    #Show original image
    cv2.imshow(wndname1, src)

    k = -1
    while k != 27:

        if f <= 0: f = 1
        rotX = (rotXval - 90)*np.pi/180
        rotY = (rotYval - 90)*np.pi/180
        rotZ = (rotZval - 90)*np.pi/180
        distX = distXval - 500
        distY = distYval - 500
        distZ = distZval - 500

        # Camera intrinsic matrix
        K = np.array([[f, 0, w/2, 0],
                    [0, f, h/2, 0],
                    [0, 0,   1, 0]])

        # K inverse
        Kinv = np.zeros((4,3))
        Kinv[:3,:3] = np.linalg.inv(K[:3,:3])*f
        Kinv[-1,:] = [0, 0, 1]

        # Rotation matrices around the X,Y,Z axis
        RX = np.array([[1,           0,            0, 0],
                    [0,np.cos(rotX),-np.sin(rotX), 0],
                    [0,np.sin(rotX),np.cos(rotX) , 0],
                    [0,           0,            0, 1]])

        RY = np.array([[ np.cos(rotY), 0, np.sin(rotY), 0],
                    [            0, 1,            0, 0],
                    [ -np.sin(rotY), 0, np.cos(rotY), 0],
                    [            0, 0,            0, 1]])

        RZ = np.array([[ np.cos(rotZ), -np.sin(rotZ), 0, 0],
                    [ np.sin(rotZ), np.cos(rotZ), 0, 0],
                    [            0,            0, 1, 0],
                    [            0,            0, 0, 1]])

        # Composed rotation matrix with (RX,RY,RZ)
        R = np.linalg.multi_dot([ RX , RY , RZ ])

        # Translation matrix
        T = np.array([[1,0,0,distX],
                    [0,1,0,distY],
                    [0,0,1,distZ],
                    [0,0,0,1]])

        # Overall homography matrix
        H = np.linalg.multi_dot([K, R, T, Kinv])

        # Apply matrix transformation
        cv2.warpPerspective(src, H, (w, h), dst, cv2.INTER_NEAREST, cv2.BORDER_CONSTANT, 0)

        # Show the image
        cv2.imshow(wndname2, dst)
        k = cv2.waitKey(1)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 使用新的相机位置创建图像的相关文章

使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
从字符串中删除识别的日期

作为输入我有几个包含不同格式日期的字符串例如彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期在下一步中我想从字符串中删除
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
测试 python Counter 是否包含在另一个 Counter 中

如何测试是否是pythonCounter https docs python org 2 library collections html collections Counter is 包含在另一个中使用以下定义柜台a包含在计数器中b当且
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
Pandas：merge_asof() 对多行求和/不重复

我正在处理两个数据集每个数据集具有不同的关联日期我想合并它们但因为日期不完全匹配我相信merge asof 是最好的方法然而有两件事发生merge asof 不理想的数字重复数字丢失以下代码是一个示例 df a pd Da
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
在 Qt 中自动调整标签文本大小 - 奇怪的行为

在 Qt 中我有一个复合小部件它由排列在 QBoxLayouts 内的多个 QLabels 组成当小部件调整大小时我希望标签文本缩放以填充标签区域并且我已经在 resizeEvent 中实现了文本大小的调整这可行但似乎发生了某
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

有没有办法重命名 Keras 模型的指标和损失？

我有一个非常大的模型有很多损失和指标当我做print np array self model metrics names 我明白了 loss autoencoder loss autoencoder loss autoencoder l
错误类型错误：无法读取未定义的属性“长度”

我的这部分代码有错误 img src assets gms logo png alt website icon 但是当我检查资产文件夹时 gms logo png仍然在那里并且在angular cli json 资产也在那里路径也是正确的
Android/iOS OpenCV 眼睛扩张检测

寻找有关 OpenCV 是否可以或已经用于检测 Android 或 iOS 上的眼睛扩张的意见除了使用 OpenCV 的 EyePhone 应用程序进行眼动追踪和眨眼检测之外我没有发现太多其他功能在完美的条件下我确信这是可能的我更
Bootstrap 3 - 显示所有屏幕尺寸的折叠导航

我正在使用 Bootstrap v3 我已经设置了导航栏类这样当我的屏幕大小为移动设备大小时导航会折叠并出现类似网格的小切换按钮所以这可以按预期工作我想要的是这是所有屏幕尺寸的默认操作也就是说即使在桌面上我也希望导航折叠起来
如何从xslt中的java地图获取数据

我需要从 XSLT 中的 Java 地图获取数据我知道使用 xalan 我可以实现它但我们依赖于通用 Transformer 这迫使我们使用 Saxon HE 我将 java 映射传递给变量并在 XSLT 中获取它请建议我们如何实现这
清除或重新创建 Ruby on Rails 数据库

我有一个充满数据的开发 Ruby on Rails 数据库我想删除所有内容并重建数据库我正在考虑使用类似的东西 rake db recreate 这可能吗我知道有两种方法可以做到这一点这将重置您的数据库并重新加载当前架构 rake
选择全日历中的整周

我在使用 fullcalendar 插件时遇到了问题我试图通过单击在月视图中选择整周然后创建一个事件换句话说如果您单击特定周中的任何一天该周将突出显示并创建一个事件此后该事件应输入我的数据库中这是我到目前为止所拥有的
(w)ifstream 支持不同的编码吗

当我使用 wifstream 将文本文件读取为宽字符串 std wstring 时流实现是否支持不同的编码即它可以用于读取例如ASCII UTF 8 和 UTF 16 文件如果没有我该怎么办我需要阅读整个文件如果这有影响的话 C
空响应和未找到响应的 HTTP 状态代码

我们正在实现基于 REST 的 Web 服务并且对某些用例有一些疑问考虑有一个唯一的帐户其中包含一些信息例如添加到购物车信息如果不存在购物车信息我们应该返回什么响应代码例如 0 我们的理解是返回 200 并返回空响应用户将购
assertj：比较 dto 和实体类之间的字段

我需要比较一个DTO类及其Entity class 例如一个AddressDTO类将是 Setter Getter NoArgsConstructor AllArgsConstructor public class AddressDTO
React CRA with CSP：拒绝执行内联脚本

我已经使用以下方式建立了一个新网站Material UI 创建 React 模板 https github com mui org material ui tree master examples create react app 我添加了
agrep：只返回最佳匹配

我在 R 中使用 agrep 函数它返回匹配向量我想要一个类似于 agrep 的函数它只返回最佳匹配或者如果存在平局则返回最佳匹配目前我正在对结果向量的每个元素使用 cba 包中的 sdist 函数来执行此操作但这似乎非常多余
在 IntelliJ 中的弹出 JavaDoc 上隐藏 JetBrains 注释

有没有办法隐藏或turn off those 可用推断注释当我从方法中阅读弹出文档时如下图所示 IntelliJ IDEA 中没有设置可以禁用它 I ve 提交了请求 https youtrack jetbrains com issue
在 Elastic Beanstalk 上部署 NestJS 应用程序

我正在尝试将我的 NestJS 应用程序部署到 AWS elastic beanstalk 但没有取得任何成功有人可以一步步写下我如何实现这一目标吗完整解释我有一个带有 typeorm 的 Nestjs 应用程序但没有将其配置为与
什么允许匿名无参数委托类型不同？

已读入作为 C 3 0 中的委托和 Lambda 表达式系列文章的一部分短语高级主题无参数匿名方法匿名方法可以省略参数列表 delegate return Console ReadLine 例如这是非典型的但确实如此允许相同
RSelenium 与 Tor 在 Windows 上具有新的 RSelenium 版本

我发现 jdarrison 关于如何使用 Tor 启动这个很棒的答案RSelenium在窗户上 https stackoverflow com a 39048970 7837376 https stackoverflow com a 390
与平台特定语言相比，使用 Adobe Air/Java 编写 Web 应用程序的优点/缺点？

我需要为 Windows 和 Mac 也许还有 Linux 编写一个 Web 应用程序也可以离线工作我想知道我是否应该使用像air flash java 这样的东西优点是我只需要编写一次应用程序然而我想知道这样做是否有任何缺点而
Visual Studio 2022 未加载依赖项

升级到 Visual Studio 2022 并安装 Net 6 0 SDK 后我似乎在运行项目时遇到问题每当我打开现有项目甚至创建新项目时我都会收到以下依赖项错误如果我尝试构建项目我会收到错误错误列表中没有任何错误尝试了一些
Node.js 如何响应升级请求？

我正在处理来自 Node js http 服务器的 websocket 升级事件升级处理程序的格式为 function req socket head 如果没有资源我如何发送对此升级请求的响应目的有没有办法使用套接字对象来做到这一点
Python 使用新的相机位置创建图像

我现在正在努力完成一项特定的计算机视觉任务例如假设我们有一个道路的相机框架现在我想用水平平移的假想相机生成一个新帧此外还添加了一个微小的摄像角度为了说明这一点我上传了一张演示图片如何在 python 中从原始框架创建新框架

Python 使用新的相机位置创建图像

Python 使用新的相机位置创建图像 的相关文章

随机推荐

热门标签

Python 使用新的相机位置创建图像的相关文章