将两个 32 位整数向量相乘,生成 32 位结果元素向量

2024-05-05

将每个 32 位条目乘以 2 的最佳方法是什么_mm256i互相注册?

_mm256_mul_epu32不是我正在寻找的,因为它产生 64 位输出。我想要每个 32 位输入元素都有一个 32 位结果。

而且,我确信两个 32 位值的乘法不会溢出。

Thanks!


你想要的_mm256_mullo_epi32()固有的。来自英特尔的优秀在线内在指南 https://software.intel.com/sites/landingpage/IntrinsicsGuide/:

Synopsis

__m256i _mm256_mullo_epi32 (__m256i a, __m256i b)
#include "immintrin.h" 
Instruction: vpmulld ymm, ymm, ymm CPUID Flags: AVX2 

描述

将 a 和 b 中的压缩 32 位整数相乘, 产生中间 64 位整数,并存储低 32 位 dst 中的中间整数。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将两个 32 位整数向量相乘,生成 32 位结果元素向量 的相关文章

随机推荐