如何使用 avx 指令将 float 向量转换为短整型？

2024-01-22

基本上我如何使用 AVX2 内在函数编写与此等效的内容？我们在这里假设result_in_float属于类型__m256, while result属于类型short int* or short int[8].

for(i = 0; i < 8; i++)
    result[i] = (short int)result_in_float[i];

我知道浮点数可以使用以下命令转换为 32 位整数__m256i _mm256_cvtps_epi32(__m256 m1)固有的，但不知道如何将这些 32 位整数进一步转换为 16 位整数。我不仅想要这样，还想要将这些值（以 16 位整数的形式）存储到内存中，并且我想使用向量指令来完成这一切。

在互联网上搜索，我发现了一个名为_mm256_mask_storeu_epi16，但我不太确定这是否有效，因为我找不到其用法的示例。

_mm256_cvtps_epi32是一个很好的第一步，转换为压缩的短裤向量有点烦人，需要跨切片洗牌（所以最好它不在依赖链中）。

由于可以假设这些值在正确的范围内（根据注释），我们可以使用_mm256_packs_epi32代替_mm256_shuffle_epi8进行转换，无论哪种方式，它都是端口 5 上的 1 周期指令，但使用_mm256_packs_epi32避免必须从某处获取洗牌掩码。

所以把它放在一起（未测试）

__m256i tmp = _mm256_cvtps_epi32(result_in_float);
tmp = _mm256_packs_epi32(tmp, _mm256_setzero_si256());
tmp = _mm256_permute4x64_epi64(tmp, 0xD8);
__m128i res = _mm256_castsi256_si128(tmp);
// _mm_store_si128 that

最后一步（强制转换）是免费的，它只是改变类型。

如果您有两个浮点向量要转换，您可以重复使用大部分指令，例如：（也未测试）

__m256i tmp1 = _mm256_cvtps_epi32(result_in_float1);
__m256i tmp2 = _mm256_cvtps_epi32(result_in_float2);
tmp1 = _mm256_packs_epi32(tmp1, tmp2);
tmp1 = _mm256_permute4x64_epi64(tmp1, 0xD8);
// _mm256_store_si256 this

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 avx 指令将 float 向量转换为短整型？的相关文章

在一个数据访问层中处理多个连接字符串

我有一个有趣的困境我目前有一个数据访问层它必须与多个域一起使用并且每个域都有多个数据库存储库具体取决于所调用的存储过程目前我只需使用 SWITCH 语句来确定应用程序正在运行的计算机并从 Web config 返回适当的连接字
如何在 Cassandra 中存储无符号整数？

我通过 Datastax 驱动程序在 Cassandra 中存储一些数据并且需要存储无符号 16 位和 32 位整数对于无符号 16 位整数我可以轻松地将它们存储为有符号 32 位整数并根据需要进行转换然而对于无符号 64 位整
C++11 删除重写方法

Preface 这是一个关于最佳实践的问题涉及 C 11 中引入的删除运算符的新含义当应用于覆盖继承父类的虚拟方法的子类时背景根据标准引用的第一个用例是明确禁止调用某些类型的函数否则转换将是隐式的例如最新版本第 8 4 3 节
std::vector 与 std::stack

有什么区别std vector and std stack 显然向量可以删除集合中的项目尽管比列表慢得多而堆栈被构建为仅后进先出的集合然而堆栈对于最终物品操作是否更快它是链表还是动态重新分配的数组我找不到关于堆栈的太多信息但
如何在 C# 中打开 Internet Explorer 属性窗口

我正在开发一个 Windows 应用程序我必须向用户提供一种通过打开 IE 设置窗口来更改代理设置的方法 Google Chrome 使用相同的方法当您尝试更改 Chrome 中的代理设置时它将打开 Internet Explorer
free 和 malloc 在 C 中如何工作？

我试图弄清楚如果我尝试从中间释放指针会发生什么例如看下面的代码 char ptr char malloc 10 sizeof char for char i 0 i lt 10 i ptr i i 10 ptr ptr ptr pt
如何连接重叠的圆圈？

我想在视觉上连接两个重叠的圆圈以便 becomes 我已经有部分圆的方法但现在我需要知道每个圆的重叠角度有多大但我不知道该怎么做有人有主意吗 Phi ArcTan Sqrt 4 R 2 d 2 d HTH Edit 对于两个不同的半
如何使从 C# 调用的 C（P/invoke）代码“线程安全”

我有一些简单的 C 代码它使用单个全局变量显然这不是线程安全的所以当我使用 P invoke 从 C 中的多个线程调用它时事情就搞砸了如何为每个线程单独导入此函数或使其线程安全我尝试声明变量 declspec thread 但
访问外部窗口句柄

我当前正在处理的程序有问题这是由于 vista Windows 7 中增强的安全性引起的特别是 UIPI 它阻止完整性级别较低的窗口与较高完整性级别的窗口对话就我而言我想告诉具有高完整性级别的窗口进入我们的应用程序它在 XP 或
在 Unity 中实现 Fur with Shells 技术

我正在尝试在 Unity 中实现皮毛贝壳技术 http developer download nvidia com SDK 10 5 direct3d Source Fur doc FurShellsAndFins pdf Fins 技术被
两个静态变量同名（两个不同的文件），并在任何其他文件中 extern 其中一个

在一个文件中将变量声明为 static 并在另一个文件中进行 extern 声明我认为这会在链接时出现错误因为 extern 变量不会在任何对象中看到因为在其他文件中声明的变量带有限定符 static 但不知何故链接器瑞萨没有显
C 编程：带有数组的函数

我正在尝试编写一个函数该函数查找行为 4 列为 4 的二维数组中的最大值其中二维数组填充有用户输入我知道我的主要错误是函数中的数组但我不确定它是什么如果有人能够找到我出错的地方而不是编写新代码我将不胜感激除非我刚去南方我的尝
LINQ：使用 INNER JOIN、Group 和 SUM

我正在尝试使用 LINQ 执行以下 SQL 最接近的是执行交叉联接和总和计算我知道必须有更好的方法来编写它所以我向堆栈团队寻求帮助 SELECT T1 Column1 T1 Column2 SUM T3 Column1 AS Amoun
C 函数 time() 如何处理秒的小数部分？

The time 函数将返回自 1970 年以来的秒数我想知道它如何对返回的秒数进行舍入例如对于100 4s 它会返回100还是101 有明确的定义吗 ISO C标准没有说太多它只说time 回报该实现对当前日历时间的最佳近似结
使用特定参数从 SQL 数据库填充组合框

我在使用参数从 sql server 获取特定值时遇到问题任何人都可以解释一下为什么它在 winfom 上工作但在 wpf 上不起作用以及我如何修复它我的代码 private void UpdateItems COMBOBOX1 Ite
对于某些 PDF 文件，LoadIFilter() 返回 -2147467259

我正在尝试使用 Adob e IFilter 搜索 PDF 文件我的代码是用 C 编写的我使用 p invoke 来获取 IFilter 的实例 DllImport query dll SetLastError true CharSet
C++ 中的 include 和 using 命名空间

用于使用cout 我需要指定两者 include
C# 中最小化字符串长度

我想减少字符串的长度喜欢这串 string foo Lorem ipsum dolor sit amet consectetur adipiscing elit Aenean in vehicula nulla Phasellus li
C++ 中的参考文献

我偶尔会在 StackOverflow 上看到代码询问一些涉及函数的重载歧义例如 void foo int param 我的问题是为什么会出现这种情况或者更确切地说你什么时候会有对参考的参考这与普通的旧参考有何不同我从未在现
现代编译器是否优化乘以 1 和 -1

如果我写 template

随机推荐

将字符串数组发送到 Web API 方法

这是我的客户端 ajax 调用 var list a b c d var jsonText data list ajax type POST url api scheduledItemPriceStatus updateStatusToDe
gprof 没有输出

我正在尝试使用 gprof 来分析我正在开发的一些数字代码但 gprof 似乎无法从我的程序中收集数据这是我的命令行 g Wall O3 g pg o fftw test fftw test cpp lfftw3 lfftw3 thre
蓝牙适配器不会停止扫描 BLE 设备

在我的应用程序中我有开始和停止按钮当用户按下开始时我调用 startScan 方法 bluetoothAdapter getBluetoothLeScanner startScan getLeScanCallback 当用户按停止时
如何循环遍历数据库的表？

我试图使用以下代码循环数据库的表但出现错误java lang UnsupportedOperationException 我什至尝试过cfloop query and other attributes出现错误复杂值无法转换为简单值谁能告
Lua 无法计算 math.abs(29.7 - 30) <= 0.3 [重复]

这个问题在这里已经有答案了今天早上我在我的 Lua 脚本中发现了一个错误这看起来很奇怪这次评估怎么会失败呢示例可以在以下位置进行测试here http www lua org cgi bin demo 第一个例子 if math a
为什么 Golang 强制大括号不在下一行？

correct if true 不正确 if true 为什么要强制执行这种样式它与语言规范有关还是只是因为他们更喜欢一种样式而不是另一种样式为什么有大括号但没有分号为什么我不能将左大括号放在下一行 Go 使用大括号进行语句分组这
格式化numpy数组中的浮点数[重复]

这个问题在这里已经有答案了如果我有一个像这样的 numpy 数组 2 15295647e 01 8 12531501e 00 3 97113829e 00 1 00777250e 01 如何移动小数点并格式化数字这样我最终会得到一个像这
如何将 fgetcsv 与字符串一起使用[重复]

这个问题在这里已经有答案了如何使用fgetcsv其中输入是字符串而不是资源如何将字符串转换为资源 fgetcsv需要文件句柄资源 str 1981 2992 19191 n392 488 299 n some ntext 199 222
无法拉伸内部 StackPanel

使用下面的设置我可以将窗口的整个宽度着色为紫色内部堆叠面板为黄绿色并移至左侧
在 Rails 3.2 中禁用解释

是否可以通过配置全局禁用 Rails 3 2 中的新解释功能我正在使用 activerecord sqlserver adapter 3 2 1 并且 gem 的解释显示计划部分似乎存在一些错误引用自http weblog ruby
从 C# 以编程方式创建文件到 Onedrive？

我想从 C 直接创建 doc docx pptx 或 excel 文件到我的 Onedrive 帐户我已经尝试过这个但它对我不起作用有人知道我做错了什么吗谢谢 public async Task
是否可以部署独立的 .NET Framework 应用程序？

我正在开发一个使用 Net Framework 的 C Net 应用程序但当用户在其计算机上安装该应用程序时遇到问题他们中的一些人只是不知道如何安装 Net Framework 我正在寻找这个问题的解决方案并且我发现了 Net Cor
如何使用变量而不是文件来让任何命令写入？

我在用着curl cookie jar
Python 中的 RAII：__del__ 有什么意义？

乍一看好像是Python的 del 特殊方法提供了与 C 中析构函数几乎相同的优点但根据Python文档 https docs python org 3 4 reference datamodel html https docs pyt
在 Nexus 上使用 nuget 代理时，dotnet 恢复失败

我在内部网络的 Nexus v 3 9 0 01 上有一个 nuget 代理我自己还没有填充本地 Nexus 存储库并且不知道它是如何完成的或是否出现任何问题但是我可以手动上传新包构建在 Bamboo 代理上进行无法连接到公共存
如何将 Scala 脚本拆分为多个文件

作为脚本语言 Scala 是否有某种 include 指令或者有没有办法从其他脚本启动脚本 The scala命令有 load filename命令以交互方式加载 Scala 文件或者 scala命令的 i filename参数可用于预
Android 中的 Viewpager 底部有固定选项卡，每个选项卡中有图标和文本

我想创建以下布局一个带有 viewpager 的活动以及一个选项卡该选项卡保留在活动的底部以指示用户位于 4 个片段中的哪一个并且所选选项卡通过活动颜色突出显示我花了一些时间在网上查看各种资源来添加此选项卡 http devel
更好地使用验证或离开事件来验证文本框数据？

在为 VB NET 文本框编写验证逻辑时最好使用哪个事件处理程序证实 or Leave 据我了解它们是同时发生的然而根据这篇文章 MSDN Control Leave 事件 http msdn microsoft com en u
CSS 网格。隐藏未使用的区域

我有基于已知元素构建的网格模板区域但并非所有元素都可以从数据库中获取如果我没有从数据库中获取某些内容那么我不会渲染 html 元素并且会得到一个带有间隙的空虚线行请参阅附图空行位于蓝色框下方是否可以隐藏未使用的区域或消除其
如何使用 avx 指令将 float 向量转换为短整型？

基本上我如何使用 AVX2 内在函数编写与此等效的内容我们在这里假设result in float属于类型 m256 while result属于类型short int or short int 8 for i 0 i lt 8 i re

如何使用 avx 指令将 float 向量转换为短整型？

如何使用 avx 指令将 float 向量转换为短整型？ 的相关文章

随机推荐

热门标签

如何使用 avx 指令将 float 向量转换为短整型？的相关文章