为 iOS Metal 中 MTLBuffer 使用的数据分配内存

2023-11-24

作为后续问题这个答案。我正在尝试用 Metal 中的内核函数替换 CPU 上运行的 for 循环，以并行化计算并提高性能。

我的函数基本上是一个卷积。由于我反复收到输入数组值的新数据（数据源于AVCaptureSession）似乎使用newBufferWithBytesNoCopy:length:options:deallocator:是创建MTLBuffer对象。这是相关代码：

id <MTLBuffer> dataBuffer = [device newBufferWithBytesNoCopy:dataVector length:sizeof(dataVector) options:MTLResourceStorageModeShared deallocator:nil];
id <MTLBuffer> filterBuffer = [device newBufferWithBytesNoCopy:filterVector length:sizeof(filterVector) options:MTLResourceStorageModeShared deallocator:nil];
id <MTLBuffer> outBuffer = [device newBufferWithBytesNoCopy:outVector length:sizeof(outVector) options:MTLResourceStorageModeShared deallocator:nil];

运行此程序时，我收到以下错误：

断言“newBufferWithBytesNoCopy：指针 0x16fd0bd48 未 4096 字节对齐”失败。

现在，我没有分配任何内存，但（出于测试目的）只是创建一个固定大小的空浮点数数组并用随机数填充它。所以我的主要问题是：

如何以正确的方式分配这些浮点数组以满足以下要求

该值必须产生页对齐的内存区域。

另外，还有一些补充问题：

创建这个是否有意义MTLBuffer与newBufferWithBytesNoCopy方法，或者复制数据在性能方面并不是真正的问题？（我的实际数据将包含每个视频帧大约 43'000 个浮点值。）
Is MTLResourceStorageModeShared的正确选择MTLResourceOptions
API参考说

返回的新MTLBuffer对象的存储分配与指针输入值相同。现有的内存分配必须由单个 VM 区域覆盖，通常使用 vm_allocate 或 mmap 进行分配。特别禁止使用 malloc 分配的内存。

这是否仅适用于输出缓冲区，或者是否应该对使用的所有对象进行存储分配MTLBuffer不完malloc?

分配页对齐内存的最简单方法是posix_memalign。下面是创建具有页对齐内存的缓冲区的完整示例：

void *data = NULL;
NSUInteger pageSize = getpagesize();
NSUInteger allocationSize = /* required byte count, rounded up to next multiple of page size */ pageSize * 10;
int result = posix_memalign(&data, pageSize, allocationSize);

if (result == noErr && data) {
    id<MTLBuffer> buffer = [device newBufferWithBytesNoCopy:data
                                                     length:allocationSize
                                                    options:MTLResourceStorageModeShared
                                                deallocator:^(void *pointer, NSUInteger length)
                                                            {
                                                                free(pointer);
                                                            }];
    NSLog(@"Created buffer of length %d", (int)buffer.length);
}

由于您无法确保数据将到达页面对齐的指针，因此最好只分配一个MTLBuffer任何大小都可以容纳您的数据，而无需使用无复制变体。如果需要对数据进行实时处理，则应该创建一个缓冲区池并在它们之间循环，而不是等待每个命令缓冲区完成。这Shared存储模式对于这些用例来说是正确的。相关警告malloc仅适用于无复制情况，因为在所有其他情况下，Metal 都会为您分配内存。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为 iOS Metal 中 MTLBuffer 使用的数据分配内存的相关文章

通过 Button Swift 中的标签发送行和部分

我里面有这个cellForRowAtIndexPath cell plusBut tag indexPath row cell plusBut addTarget self action plusHit forControlEvents U
在 Objective-C 中的 Swift 类上调用 NSStringFromClass 返回模块损坏的名称

我知道这个问题 https stackoverflow com questions 24107658 get a user readable version of the class name in swift in objc nsstri
Xcode 异步单元测试在主线程上等待

我正在尝试使用 Xcode 中的单元测试来测试一些异步代码但主线程被阻塞问题在于某些正在测试的代码期望从 iOS 类 AVFoundation 接收回调但是 AVFoundation 类似乎只会在主线程上回调问题是如果我正在进行
为什么当实例化新的游戏对象时，它没有向它们添加标签？ [复制]

这个问题在这里已经有答案了 using System Collections using System Collections Generic using UnityEngine public class Test MonoBehaviou
嵌套接口：将 IDictionary> 转换为 IDictionary>？

我认为投射一个相当简单IDictionary
从Web API同步调用外部api

我需要从我的 Web API 2 控制器调用外部 api 类似于此处的要求使用 HttpClient 从 Web API 操作调用外部 HTTP 服务 https stackoverflow com questions 13222998
OleDbDataAdapter 未填充所有行

嘿我正在使用 DataAdapter 读取 Excel 文件并用该数据填充数据表这是我的查询和连接字符串 private string Query SELECT FROM Sheet1 private string ConnectStr
C# 中通过 Process.Kill() 终止的进程的退出代码

如果在我的 C 应用程序中我正在创建一个可以正常终止或开始行为异常的子进程在这种情况下我通过调用 Process Kill 来终止它但是我想知道该进程是否已退出通常情况下我知道我可以获得终止进程的错误代码但是正常的退出代码是什
带动态元素的 WPF 启动屏幕。如何？

我是 WPF 新手我需要一些帮助我有一个加载缓慢的 WPF 应用程序因此我显示启动屏幕作为权宜之计但是我希望能够在每次运行时更改屏幕并在文本区域中显示不同的引言这是一个生产力应用程序所以我将使用非愚蠢但激励性的引言当然如
重载<<的返回值

include
如何设计以 char* 指针作为类成员变量的类？

首先我想介绍一下我的情况我写了一些类将 char 指针作为私有类成员而且这个项目有 GUI 所以当单击按钮时某些函数可能会执行多次这些类是设计的单班在项目中但是其中的某些函数可以执行多次然后我发现我的项目存在内存泄漏所以我想
转发声明和包含

在使用库时无论是我自己的还是外部的都有很多带有前向声明的类根据情况相同的类也包含在内当我使用某个类时我需要知道该类使用的某些对象是前向声明的还是 include d 原因是我想知道是否应该包含两个标题还是只包含一个标题现在我知
所有 RestKit 项目在归档时都无法构建

这个问题涉及RESTKIT 0 9 x 如果您是 Restkit 新手请考虑使用较新的版本0 10 x https github com RestKit RestKit tree v0 10 1 branch 我最近继承了一个项目使用r
如何序列化/反序列化自定义数据集

我有一个 winforms 应用程序它使用强类型的自定义数据集来保存数据进行处理它由数据库中的数据填充我有一个用户控件它接受任何自定义数据集并在数据网格中显示内容这用于测试和调试为了使控件可重用我将自定义数据集视为普通的 Sy
垃圾收集器是否在单独的进程中运行？

垃圾收集器是否在单独的进程中启动例如如果我们尝试测量某段代码所花费的进程时间并且在此期间垃圾收集器开始收集它会在新进程上启动还是在同一进程中启动它的工作原理如下吗 Code Process 1 gt Garbage Collect
Windows 窗体：如果文本太长，请添加新行到标签

我正在使用 C 有时从网络服务返回的文本我在标签中显示太长并且会在表单边缘被截断如果标签不适合表单是否有一种简单的方法可以在标签中添加换行符 Thanks 如果您将标签设置为autosize 它会随着您输入的任何文本自动增长为
链接器错误：已定义

我尝试在 Microsoft Visual Studio 2012 中编译我的 Visual C 项目使用 MFC 但出现以下错误 error LNK2005 void cdecl operator new unsigned int 2
Unwind segue 的用途是什么以及如何使用它们？

iOS 6 和 Xcode 4 5 有一个称为 Unwind Segue 的新功能展开转场可以允许过渡到故事板中场景的现有实例除了 Xcode 4 5 发行说明中的这个简短条目之外 UIViewController 现在似乎还有几个新
是否可以在 .NET Core 中将 gRPC 与 HTTP/1.1 结合使用？

我有两个网络服务 gRPC 客户端和 gRPC 服务器服务器是用 NET Core编写的然而客户端是托管在 IIS 8 5 上的 NET Framework 4 7 2 Web 应用程序所以它只支持HTTP 1 1 https le
C# - OutOfMemoryException 在 JSON 文件上保存列表

我正在尝试保存压力图的流数据基本上我有一个压力矩阵定义为 double pressureMatrix new double e Data GetLength 0 e Data GetLength 1 基本上我得到了其中之一pressur

随机推荐

如何在运行时更新（添加/修改/删除）web.config 的 AppSettings 部分中的键

我喜欢更新中定义的键值AppSettings的部分Web config在运行时但我不想真正将它们保存到Web config file 我有一个巨大的 Web 应用程序其中包含许多模块 DLL 和源代码文件数据库配置加密密钥 Web
是否有更有效的方法从流设置 std::vector ？

目前我设置了 a 的值std vector
更新标签花费的时间太长（快速）

我是初学者快速开发人员我被这个天气应用程序困住了我正在下载网站数据然后显示在我的标签中不幸的是整个过程大约需要 10 秒才能更新我的标签这可能不是因为网络连接因为控制台会立即更新感谢您的建议发生的情况是代码可能在辅助线程上
iframe 背景图像在 Firefox 中显示正常，但在 IE 中显示不正常

为什么IE在Iframe中不像firefox那样显示BG法师我无权访问 iframed 页面任何 CSS 或 javascript 解决方案以及添加 CSS 样式background color transparent 对于 ifra
Django+Apache ModuleNotFoundError：没有名为“myproject”的模块

我对 Apache2 4 mod wsgi Python3 6 在 win10 x64 上有问题当我尝试访问站点时我在 Apache 中收到此错误 Wed Mar 22 22 52 19 162397 2017 wsgi error
Laravel Passport 自定义密码栏

如何使用 Laravel 的 Passport 包来验证不同的密码列如果我想从不同的用户名列进行身份验证可以使用以下代码完成 public function findForPassport username return this
使用一个代码库为非 Retina 和 Retina 显示器提供服务：用于在 iPhone 或 iOS 设备上缩放 HTML5 应用程序的布局和资源的框架？

我们的目标是模拟开发人员可以使用本机 iOS 应用程序执行的操作即使用基于单位的单一布局来适应 Retina 显示屏 640x960 和非 Retina 显示屏 320x480 所有 iOS 开发人员需要做的就是提供两组资源一组用于 R
java ArrayList 的时间复杂度

Is ArrayListjava中的数组还是列表 get 操作的时间复杂度是多少 O n or O 1 An ArrayList在Java中是一个List这是由一个支持array The get index 方法是恒定时间 O 1 手术直
无法访问 URL：HTTP/1.1 400 错误 URI

我想通过 Composer 创建一个新的 Laravel 项目但出现此错误 Composer Downloader TransportException The http packagist org p fideloper proxy 2
greendao 字符串主键 - 如何使用

在 greendao 常见问题解答中它说从 greenDAO 开始对字符串主键的支持有限 http greendao orm com documentation technical faq 我找不到任何地方说明如何执行此操作我使用
foreach 块缺少结束符“}”

我今天玩 Razor 很开心你能看出这个观点有什么问题并解释为什么它是错误的吗 foreach var item in Model if item ID PreviousOrderId div class orderdetail div
当没有更多工作要做时，防止 boost::asio::io_context 返回

boost asio io context run 当没有待处理的工作时确实返回我想避免这种行为以便run 确实无限期地等待新作品并且可以从另一个线程停止它我想这可以通过在io context 并通过调用cancel 当我们想要的
如何为特定类型的所有实例实现我自己的自定义属性编辑器？

我已经遵循了一些关于创建自定义属性编辑器对话框的教程但是涉及的事情太多我无法让它正常工作我想要完成的是一个带有日期选择器日历时间选择器以及确定和取消按钮的自定义表单该表单完全没有问题但是我将如何实现它以便我可以通过启
解开嵌入式资源的困惑

编辑阅读 Tim Schmelter 的答案 1 然后使用此问题作为如何嵌入资源并在运行时访问它们的示例嵌入式资源的主题经常出现尤其是当人们询问如何在运行时访问嵌入式文件时事情变得更加混乱因为 Visual Studio 为您提供
在 C++ 中打开并显示图像？

基本上我正在自学 C 程序功能的一部分是打开和关闭指定的图像我该怎么做呢或者我会使用什么资源 Thanks 在 C 中无需任何额外的库您可以打开图像但除了一堆二进制数据之外不会有什么特别有用的东西那么你必须使用你自己的解码器
分散数组中的重复项

来源谷歌面试问题编写一个例程以确保输入中的相同元素在输出中最大程度地分布基本上我们需要放置相同的元素以这样的方式TOTAL传播是尽可能最大的 Example Input 1 1 2 3 2 3 Possible Output 1
Linq 列表中的部分匹配？

我有一个需要在表中匹配的部分字符串列表我正在使用谓词构建器 var predicate PredicateBuilder False
Mac 上的 RStudio Python 版本更改

我的问题是如何将 python 版本更改为 anaconda 3 5 并可以在 RStudio 中使用 anaconda 中安装的模块我正在使用 RStudio 版本 0 99 891R版本3 2 3 2015 12 10 平台 x86
保存文件时出现权限错误（沙箱）

我正在尝试将文件保存到沙盒应用程序 OS X 中的路径但到目前为止几乎每次尝试保存时都会遇到错误错误是 Error saving Error Domain NSCocoaErrorDomain Code 513 You don t h
为 iOS Metal 中 MTLBuffer 使用的数据分配内存

作为后续问题这个答案我正在尝试用 Metal 中的内核函数替换 CPU 上运行的 for 循环以并行化计算并提高性能我的函数基本上是一个卷积由于我反复收到输入数组值的新数据数据源于AVCaptureSession 似乎使用newB

为 iOS Metal 中 MTLBuffer 使用的数据分配内存

为 iOS Metal 中 MTLBuffer 使用的数据分配内存 的相关文章

随机推荐

热门标签

为 iOS Metal 中 MTLBuffer 使用的数据分配内存的相关文章