使用“VNImageHomographAlignmentObservation”类合并图像

2023-12-14

我正在尝试使用合并两个图像VNImageHomographicAlignmentObservation，我目前得到的 3d 矩阵如下所示：

simd_float3x3([ [0.99229, -0.00451023, -4.32607e-07)],  
                [0.00431724,0.993118, 2.38839e-07)],   
                [-72.2425, -67.9966, 0.999288)]], )

但我不知道如何使用这些值合并成一张图像。似乎没有任何文档说明这些值的含义。我在这里找到了一些关于变换矩阵的信息：使用矩阵.

但到目前为止，没有其他任何东西可以帮助我......有什么建议吗？

我的代码：

func setup() {

    let floatingImage = UIImage(named:"DJI_0333")!
    let referenceImage = UIImage(named: "DJI_0327")!

    let request = VNHomographicImageRegistrationRequest(targetedCGImage: floatingImage.cgImage!, options: [:])

    let handler = VNSequenceRequestHandler()
    try! handler.perform([request], on: referenceImage.cgImage!)

    if let results = request.results as? [VNImageHomographicAlignmentObservation] {
        print("Perspective warp found: \(results.count)")
        results.forEach { observation in
        // A matrix with 3 rows and 3 columns.                         
        let matrix = observation.warpTransform
        print(matrix) }
    }
}

这个单应性矩阵H描述如何将一个图像投影到另一图像的图像平面上。要将每个像素变换到其投影位置，您可以计算其投影位置x' = H * x using 齐次坐标（基本上采用 2D 图像坐标，添加 1.0 作为第三个分量，应用矩阵H，然后除以结果的第三个分量返回二维）。

对每个像素执行此操作的最有效方法是使用以下命令在均匀空间中编写此矩阵乘法核心图像. 核心图像提供多种着色器内核类型：CIColorKernel, CIWarpKernel and CIKernel。对于这个任务，我们只想变换每个像素的位置，所以CIWarpKernel就是你所需要的。使用核心图像着色语言，如下所示：

import CoreImage
let warpKernel = CIWarpKernel(source:
    """
    kernel vec2 warp(mat3 homography)
    {
        vec3 homogen_in = vec3(destCoord().x, destCoord().y, 1.0); // create homogeneous coord
        vec3 homogen_out = homography * homogen_in; // transform by homography
        return homogen_out.xy / homogen_out.z; // back to normal 2D coordinate
    }
    """
)

请注意，着色器需要一个mat3 called homography，这相当于着色语言simd_float3x3 matrix H。调用着色器时，矩阵应存储在 CIVector 中，要对其进行转换，请使用：

let (col0, col1, col2) = yourHomography.columns
let homographyCIVector = CIVector(values:[CGFloat(col0.x), CGFloat(col0.y), CGFloat(col0.z),
                                             CGFloat(col1.x), CGFloat(col1.y), CGFloat(col1.z),
                                             CGFloat(col2.x), CGFloat(col2.y), CGFloat(col2.z)], count: 9)

当您应用CIWarpKernel对于图像，你必须告诉核心图像输出应该有多大。要合并扭曲图像和参考图像，输出应该足够大以覆盖整个投影and原始图像。我们可以通过将单应性应用到图像矩形的每个角来计算投影图像的大小（这次在 Swift 中，CoreImage 将此矩形称为extent):

/**
 * Convert a 2D point to a homogeneous coordinate, transform by the provided homography,
 * and convert back to a non-homogeneous 2D point.
 */
func transform(_ point:CGPoint, by homography:matrix_float3x3) -> CGPoint
{
  let inputPoint = float3(Float(point.x), Float(point.y), 1.0)
  var outputPoint = homography * inputPoint
  outputPoint /= outputPoint.z
  return CGPoint(x:CGFloat(outputPoint.x), y:CGFloat(outputPoint.y))
}

func computeExtentAfterTransforming(_ extent:CGRect, with homography:matrix_float3x3) -> CGRect
{
  let points = [transform(extent.origin, by: homography),
                transform(CGPoint(x: extent.origin.x + extent.width, y:extent.origin.y), by: homography),
                transform(CGPoint(x: extent.origin.x + extent.width, y:extent.origin.y + extent.height), by: homography),
                transform(CGPoint(x: extent.origin.x, y:extent.origin.y + extent.height), by: homography)]

  var (xmin, xmax, ymin, ymax) = (points[0].x, points[0].x, points[0].y, points[0].y)
  points.forEach { p in
    xmin = min(xmin, p.x)
    xmax = max(xmax, p.x)
    ymin = min(ymin, p.y)
    ymax = max(ymax, p.y)
  }
  let result = CGRect(x: xmin, y:ymin, width: xmax-xmin, height: ymax-ymin)
  return result
}

let warpedExtent = computeExtentAfterTransforming(ciFloatingImage.extent, with: homography.inverse)
let outputExtent = warpedExtent.union(ciFloatingImage.extent)

现在您可以创建浮动图像的扭曲版本：

let ciFloatingImage = CIImage(image: floatingImage)
let ciWarpedImage = warpKernel.apply(extent: outputExtent, roiCallback:
    {
        (index, rect) in
        return computeExtentAfterTransforming(rect, with: homography.inverse)
    },
    image: inputImage,
    arguments: [homographyCIVector])!

The roiCallback有什么可说的核心图像需要输入图像的哪一部分来计算输出的某一部分。 CoreImage 使用它来逐块地将着色器应用于图像的各个部分，以便它可以处理巨大的图像。（看创建自定义过滤器在苹果的文档中）。一个快速的破解方法是始终return CGRect.infinite在这里，但是 CoreImage 无法执行任何块方面的魔法。

最后，创建参考图像和扭曲图像的合成图像：

let ciReferenceImage = CIImage(image: referenceImage)
let ciResultImage = ciWarpedImage.composited(over: ciReferenceImage)
let resultImage = UIImage(ciImage: ciResultImage)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用“VNImageHomographAlignmentObservation”类合并图像的相关文章

在哪里实现 Swift 协议？

在 Swift 中实现协议一致性时我有两个选择具有相同的最终结果在类中实现协议也就是说在类定义的顶部声明一致性并将实现放在类体内或者在扩展中实现协议也就是说完全在类之外编写符合协议的代码这是一个例子 public cl
如何在 Swift 泛型中说“同一类”

如果 Swift 泛型类型约束是协议名称我可以要求受该协议约束的两种类型为同一类型例如 protocol Flier struct Bird Flier struct Insect Flier func flockTwoTogether
将两个字符的字符串转换为布尔数组的快速方法是什么？

我有一个很长的字符串有时超过 1000 个字符我想将其转换为布尔值数组它需要非常快速地多次执行此操作 let input String 001 let output Bool false false true 我天真的尝试是这样的 i
如何在不使用 viewWillDisappear 的情况下使 NSTimer 无效/取消初始化？

var faderTimer NSTimer override func viewDidLoad super viewDidLoad self faderTimer NSTimer scheduledTimerWithTimeInterva
在 Swift 中对约束进行动画处理

我有一个UITextField我想在点击时放大它的宽度我设置了约束并确保左侧约束的优先级低于我尝试在右侧设置动画的约束这是我尝试使用的代码 move the input box UIView animateWithDuration 1
MATLAB：在不使用循环的情况下提取矩阵的多个部分

我有一个巨大的 2D 矩阵我想从中提取 15 个不同的 100x100 部分我有两个向量 x 和 y 其中保存了零件的左上角索引我用过这样的东西 result cam1 x 1 end x 1 end 99 y 1 end y 1 e
Swift 3：如何访问48字节CFData中matrix_float3x3的值？

我正在尝试访问内在矩阵answer https stackoverflow com a 48159895 9296667 通过运行下面的命令我能够得到一个 48 字节的任意对象 https developer apple com docu
UIStackView分布均匀填充

所以我有一个UIStackView其中包含四 4 UIViews 如果我删除其中一 1 个UIViews 其他三 3 个将填满UIStackView 我的问题如何添加最大高度UIView这样它就不会填满整个空间UIStackView即使
iOS、通用链接、Swift。 continueUserActivity 未调用

我正在为我们的 iOS 应用程序实现通用链接这是我的一小部分 AppDelegate private func application application UIApplication openURL url URL sourceApp
ReactiveCocoa 将 SignalProducers 合二为一

我正在使用 ReactiveCocoa 并且我有几个 SignalProducers let center NSNotificationCenter defaultCenter let signalProducer1 center rac
根据一个数组对多个数组进行排序

如何根据数组对一堆数组进行排序createdAt 例如 2015 11 02 19 19 35 0000 将它们组合成另一种类型字典以便在 tableView 中使用是否有益如果有的话如何 var comment AnyObject
如何更改 SwiftUI 列表中分隔符的颜色？

我在 SwiftUI 中创建了一个列表我想更改颜色或删除分隔符因为在 UIKit 中我们可以轻松更改 TableView 中分隔符的颜色下面是 SwiftUI 中列表的代码和 UI 图片 State private var user
在 Swift 中有条件导入基于 iOS 版本的框架（如 Speech）？

有没有办法有条件地导入框架Swift基于运行时 iOS 版本特别是我有一个部署目标为的应用程序iOS 8 我想使用新的Apple Speech应用程序中的框架如果在运行时可用我知道 available iOS 10 代码部分的指令
如何在注销并重新登录后保存按钮状态？

我有一个保存按钮点击该按钮后会将标签 quoteLabel 中的文本保存到 Firebase 中的用户帐户然后该按钮将隐藏并且取消保存按钮将不再隐藏以便用户可以根据需要取消保存这两个按钮都可以根据需要发布和删除数据但是如果我
使用 Swift 访问 Twitter

我正在使用 Swifter 库在我的 Swift iOS 8 应用程序中访问 Twitter https github com mattdonnelly Swifter https github com mattdonnelly Swift
将时间舍入到最接近的三十秒

我有一个应用程序它显示每 30 秒过期的数据准确地说在 h m s 11 30 00 11 30 30 11 31 00 等我可以获得当前时间但我不确定如何计算现在到最近的三十秒之间的时间我发现的所有内容都是 Objective
当您从不同的视图控制器进行segue时，如何将数据从一个视图控制器保存（追加）到另一个视图控制器？

抱歉问题有点长请多多包涵基本上我正在尝试使用 swift 编写一个简单的递增递减 ios 应用程序我有三个主视图控制器一个是初始视图控制器即根视图控制器仅包含两个按钮一个以模态方式呈现到实际计数页面第二个视图控制器
Swift 字典映射 - 闭包中的 init

我有 Swift 字典 private var params String AnyObject 这包含查询项目例如 lat 40 lon 100 我想将这本词典映射到NSURLQueryItem大批我想让它迅速 params map
RealityKit – 从中心缩放模型

我想就地缩放 3D 模型一个高大的玩具机器人即从其中心开始它应该在所有维度上增大和缩小而不改变位置我可以缩放玩具机器人模型但该模型从其脚部开始放大或缩小而不是其正确的中心我尝试过通过缩放model scale 我也尝试过使用
在 Swift 中将 xib 分配给 UIView

在 Objective C 中它可以在 init 方法中完成 id init self NSBundle mainBundle loadNibNamed ViewBtnWishList owner 0 options nil object

随机推荐

使用 CORS 的跨域 ajax 请求

我正在尝试发布到我的跨域休息服务通过 javascript 并意识到除非我使用此规范否则这是不可能的 http www w3 org wiki CORS Enabled 但是如何实现这一点的文档非常有限我有几个问题 1 我用玻璃鱼
如何检测由 CATransaction 触发的动画的完成情况

我有一个 CALayer 我只需创建它并将其添加到控制器的 initWithNibName 中的视图控制器主视图的子视图中然后我执行以下动画 CATransaction begin CATransaction setAnimationD
变量参数列表中定义的字符串长度是否有限制

我对变量参数列表有疑问定义为变量列表参数之一的字符字符串的长度是否有任何限制例如 void ShowVar int a char szTypes int main ShowVar 4 Test string size 现在我的问题是这
使用 AngularFire 获取用户电子邮件地址列表

我的 Web 应用程序使用 Firebase JS AngularFire 在应用程序中显示用户报告仅管理员可见如何使用 AngularFire 检索用户的电子邮件地址查看 AngularFire API 参考我没有看到可用的方法来
我需要元素的完整 dom 节点路径

我需要搜索 html 文档 p class content text here p 然后输出完整的节点路径 CSS或XPATH 例如 html gt body gt div class something gt table gt tr gt
gfortran 在 MinGW 下找不到 OpenMP 库 (omp_lib.mod)

我正在尝试编译某人发给我的 Fortran 代码它在我的 Linux 机器上编译得很好现在我尝试在 Windows 上的 MinGW 下编译它但是当我运行gfortran命令编译并链接它它失败并出现以下错误 undumag main
使用 JDBC 连接到 MS SQLServer 时出现 ClassNotFoundException

我正在尝试使用 MS JDBC 驱动程序 Microsoft SQL Server JDBC 驱动程序 3 0 http www microsoft com download en details aspx id 21599 但是当我在 N
两次事件之间的时间

如果有一个跟踪用户某些事件的表 id user id action created at 5 1 create 2016 09 08 11 29 56 325691 6 1 clear 2016 09 08 11 30 00 08604 7
正则表达式从字符串中去除纬度/经度

有人有一个正则表达式来从字符串中去除纬度经度吗例如号码 39 825 86 88333 匹配一个值 d d 对于这两个值 d d d d 如果字符串始终具有以下形式 ID 39 825 86 88333 match ID d d d
Spring Boot、JPA 和 Ignite

原因 org springframework data mapping PropertyReferenceException 找不到类型为 Person 的属性保存 Entity Entity public class Person imp
如何不对连续数据（INTS、FLOATS、DATETIME，...）进行标准化？

根据我的理解如果我错了请纠正我标准化是从数据库设计中删除冗余数据的过程然而当我尝试学习数据库优化调整性能时我遇到了里克詹姆斯先生推荐against标准化连续值例如 INTS FLOATS DATETIME 正常化但不要
将 C++ DLL 与 VB6 结合使用

我刚刚在 MSVC 2010 中为我的老板创建了一个 DLL 我选择了 New Win32 DLL 和 Export Symbols 选项所以一切都是完全标准的新项目文件中有一些预定义的导出一个类它的构造函数一个全局函数和具有虚
Inno Setup 脚本中的基本电子邮件验证

我想在 Inno Setup 脚本中进行基本的字符串验证以相对确定该字符串是电子邮件地址我只想看到有一个字符后跟一个字符并且在这些字符的两侧至少有一个字符与此正则表达式类似的东西 object pascal 中缺少正则表达式和有
最佳实践 - 只下载您需要的 CSS，还是使用缩小过程？

在改善的背景下overall站点性能下载和渲染速度以下两个最佳实践之间似乎存在矛盾仅降低正在查看的页面所需的 CSS 因为CSS规则过多导致渲染速度慢始终缩小 CSS 并将其合并到一个文件中因为更多的请求意味着更慢的页面加载现在
如何在 Selenium 中获得“nth-of-type”

我正在使用 Selenium Webdriver 检查此特定段落的文本此处以蓝色突出显示的段落但我如何查询该段落呢这就是我正在尝试的不起作用 def test intro text self Test that intro te
设置 jwplayer youtube 视频播放质量

我正在使用 jw 播放器播放 youtube 视频但我需要视频开始以高清 720p 播放我使用以下代码 div div 但我收到以下错误回调事件处
基于身份列的 JPA 派生列值

JPA 2 0 Hibernate 4 2 4 Final Spring 3 2 8 Release Mysql 5 6 对于具有自动生成主键的托管实体 E 例如 Id GeneratedValue private int id Colum
SAXParser '&' 连接问题

我目前正在将 SAXParser 与 SAXParserFactory 一起使用并且遇到了字符串在符号处被截断的问题例如国家创造了我们的世界及其中的一切变成其中的一切显然我不希望这种情况发生在 xml 输入中字符被正确转
这个类应该使用数据锁定进行多线程吗？

我有一个包含一些数据的类并且有很多线程使用它 class MyClass static Dictionary
使用“VNImageHomographAlignmentObservation”类合并图像

我正在尝试使用合并两个图像VNImageHomographicAlignmentObservation 我目前得到的 3d 矩阵如下所示 simd float3x3 0 99229 0 00451023 4 32607e 07 0 0043

使用“VNImageHomographAlignmentObservation”类合并图像

使用“VNImageHomographAlignmentObservation”类合并图像 的相关文章

随机推荐

热门标签

使用“VNImageHomographAlignmentObservation”类合并图像的相关文章