将8个16位SSE寄存器转换为8位数据

2024-02-17

假设我有一个包含 16 位数据的 SSE 数组：

{1,2,3,4,5,6,7,8}

现在我需要通过在前 8 个字节中仅存储 16 位数据的低字节来将此 SSE 数组转换为 8 位数据，如下所示：

{1,2,3,4,5,6,7,8,0,0,0,0,0,0,0,0}.

有没有SSE指令来执行这个操作？

As @harold https://stackoverflow.com/users/555045/harold在上面的评论中说，你可以很容易地做到这一点, e.g.

#include <stdio.h>
#include <tmmintrin.h>

static __m128i pack_16_to_8(const __m128i v)
{
    const __m128i vperm = _mm_setr_epi8(0, 2, 4, 6, 8, 10, 12, 14, -1, -1, -1, -1, -1, -1, -1, -1);

    return _mm_shuffle_epi8(v, vperm);
}

int main(void)
{
    const __m128i v = _mm_setr_epi16(1, 2, 3, 4, 5, 6, 7, 8);

    printf("%vhd -> %vd\n", v, pack_16_to_8(v));
    return 0;
}

编译并运行：

$ gcc -Wall -mssse3 pack_16_to_8.c && ./a.out

1 2 3 4 5 6 7 8 -> 1 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

x86

intel

SSE

SIMD

将8个16位SSE寄存器转换为8位数据的相关文章

比“add esp, 4”更小的指令

又是我我的程序中有很多 add esp 4 我正在尝试减小它的大小是否有任何更小的指令可以替代 add esp 4 pop edx 或者您不介意破坏的任何其他整数寄存器这就是现代编译器实际上所做的 https stackoverflo
x86 asm 图形设置的分辨率高于 640x480？

我刚刚开始使用汇编语言感觉像学习新东西并且遇到了一些问题到目前为止我一直在浏览的所有教程都没有回答或者太旧而无法知道 1 我尝试了一些搜索也许我只是不知道正确的关键字但我找不到用于更改屏幕分辨率等的图形模式的更新列表我发现的
气体：内存引用太多

编译时指令如下 movl 4 ebp 8 ebp I got 内存引用过多它出什么问题了括号之前的数字是字节偏移量这会导致发生内存引用并且不能有两个movl 您需要先将值暂时移至寄存器 movl 4 ebp ecx movl ecx
为什么 VC++ 编译器 MOV+PUSH args 而不是仅仅 PUSH 它们？ x86

在 VC 的反汇编中正在进行函数调用编译器在压入本地指针之前将其 MOV 到寄存器 memcpy nodeNewLocation pNode sizeCurrentNode 0041A5DA 8B 45 F8 mov eax dword
对齐与未对齐 x86 SIMD 指令之间的选择

SIMD指令一般有两种类型 A 使用对齐的内存地址如果地址未在操作数大小边界上对齐则会引发一般保护 GP 异常 movaps xmm0 xmmword ptr rax vmovaps ymm0 ymmword ptr rax vmova
内在数组访问比 std::vector 访问快得多——黑魔法？

我已经设置了一个测试程序来将数组访问性能与 std vector 的访问性能进行比较我发现了几个类似的问题但似乎没有一个问题能解决我的具体问题一段时间以来我一直在摸不着头脑为什么数组访问似乎比向量访问快 6 倍而我过去读到它们应
同时使用 SSE2 内在函数和 gcc 内联汇编器

我尝试在 gcc 中混合 SSE2 内在函数和内联汇编器但是如果我将变量指定为 xmm0 register 作为输入那么在某些情况下我会收到编译器错误例子 include
x86 程序执行期间方向标志 (DF) 的默认状态

在反汇编中我经常看到使用字符串操作指令而不考虑方向标志 DF 的状态如下所示 or ecx 0FFFFFFFFh xor eax eax mov edi ebp repne scasb CLD or STD自函数开始以来未找到指令也未
Intel 和 AMD 处理器有相同的汇编程序吗？

C语言被用来编写Unix以实现可移植性使用不同编译器编译的同一个C语言程序会产生不同的机器指令为什么 Windows 操作系统能够在两者上运行Intel https en wikipedia org wiki Intel and AMD
如何使用 LOCK ASM 前缀来读取值？

我知道如何使用 LOCK 来线程安全地递增一个值 lock inc J 但是如何以线程安全的方式读取 J 或任何值 LOCK 前缀不能与 mov 一起使用如果我执行以下操作 xor eax eax lock add eax J mov J
为什么 NASM 在使用有效的指令助记符作为操作数中的符号名称方面没有问题？

我编写了以下简单程序但 nasm 拒绝编译它 section text global start start mov rax 0x01 mov rdi 0x01 mov rsi str mov rdx 0x03 syscall mov r
在 clang 中向量化函数

我正在尝试根据此用 clang 对以下函数进行矢量化铿锵参考 http llvm org docs Vectorizers html 它采用字节数组向量并根据以下条件应用掩码this RFC https www rfc editor org
在 SSE 和 AVX512 寄存器之间移动数据？

我想将四个 xmm 寄存器移动到一个 zmm 寄存器中使用 AVX512 指令执行一些计算并将结果返回到 XMM 寄存器不通过内存来做到这一点的最有效方法是什么 None
给寄存器赋值并加减

我对此完全迷失了我需要使用寄存器来计算以下表达式的编程 varA varA varB varC varD 其中 varA varB 等是变量将整数值分配给上述变量的 EAX EBX ECX 和 EDX 寄存器这意味着您可以对输入进行
汇编：使用数据段寄存器（DS）

目前我正在学习 x86 汇编因为我喜欢微控制器编程所以我熟悉汇编目前我一直在到处寻找这个问题的答案但似乎找不到它 DS寄存器我知道它应该指向我程序中的全局数据但我不知道知道它到底是如何工作的我正在使用 NASM 在大多数简单的
使用 XCHG 解锁的自旋锁

维基百科提供的使用 x86 XCHG 命令的自旋锁的示例实现是 Intel syntax locked The lock variable 1 locked 0 unlocked dd 0 spin lock mov eax 1 Set t
MS-DOS - 是否可以对 24 位图形进行编程？

是否可以在 DOS 机器上以 24 位颜色深度进行编程我知道 VGA 支持 8 位色深但是有没有办法弄出 24 位色深谷歌的研究没有发现任何结果我正在 FreeDOS 而不是 MS DOS 上编程如果这会影响答案的话对的这是可
int 13h 42h 不会在 Bochs 中加载任何内容

我将引导加载程序从 CHS 更改为 LBA 因此我更换了int 13h 02h with int 13h 42h 它在 QEMU 中工作正常但是我在 Bochs 和我的笔记本电脑上运行它时遇到问题我将引导加载程序写入 USB 闪存驱动
段寄存器如何参与内存地址转换？

到目前为止我所学到的有关细分的知识虚拟地址包含段选择器和偏移量段选择器与GDTR配合使用查找段描述符的线性地址段描述符保存有关所选段的信息包括其线性地址所以我的问题是根据我所读到的内容虚拟地址被加载到段寄存器中然后以某种
在汇编中，指令指定数据类型吗？

我是汇编语言编程 x86 的初学者以下说法是否正确在汇编中 BYTE WORD DWORD 等数据类型分别表示 8 位 16 位和 32 位模式而不仅仅是整数它们本身没有意义它们只是位模式使用它们的指令赋予了它们意义汇编代码

随机推荐

保存单个核心数据实体（而不是整个上下文），同时保留 NSFetchedResultsController 功能

唷抱歉标题太长了我有一个托管对象上下文其中存储来自两个不同位置的歌曲我从手机上的持久存储中获取一些歌曲使用 Core Data 并从在线数据库中提取一些歌曲这两首歌曲都属于同一 ManagedObject 子类我希望这两首歌都
迁移 COBOL 代码

我的任务是将 COBOL 代码转换为 NET 有可用的转换器吗我正在尝试高层次地理解 COBOL 代码我无法理解 COBOL 代码有没有流程图生成器我很感激任何帮助谢谢将软件系统从一种语言或操作环境迁移到另一种语言或操作环境始终
如何在Fauxton中使用reduce

我一直在关注一些 Couch 培训但无法弄清楚如何在 Fauxton 中使用reduce 选择地图区域下方的 count 本身不会执行任何操作我尝试将其添加到地图代码下方但我想我需要以某种方式集成它在我的示例中我试图计算每个标签在
git create stash 无需配置 user.email 和 user.name (git stash --author ?)

IN SHORT 是否有可能创建一个存储使用git stash create without需要配置user email and user name 类似的东西git commit author选项一些背景我有几台构建机器上面有一个
如何在内核程序（内核上下文）中访问用户程序创建的bpf映射？

假设有两个程序用户程序和内核程序用户程序通过api制作bpf图bpf create map name 返回 fd 有了这个 fd 我可以通过系统调用访问地图例如 bpf map update FD 但我只能在用户空间程序中执行此操作
在 Rails 和 PostgreSQL 中完全忽略时区

我正在处理 Rails 和 Postgres 中的日期和时间并遇到这个问题数据库采用 UTC 时间用户在 Rails 应用程序中设置选择的时区但仅在获取用户本地时间以比较时间时使用用户存储一个时间比如 2012 年 3 月 17
为什么 unset() 在 PHP 三元运算符中不起作用

所以这有一个问题但我对此视而不见即使阅读文档两次 PHP 比较运算符 http us php net manual en language operators comparison php isset items blog unset
jquery 回调函数仅在最后一个循环中工作

for var i 0 i lt barValues length i actualBarHeight Math floor barValues i chartMaxY barchartHeight var barChartID barCh
Mongodb 连接 _id 字段从 String 到 ObjectId

我有两个收藏 User id ObjectId 584aac38686860d502929b8b name John Role id ObjectId 584aaca6686860d502929b8d role Admin userId 5
在这种情况下，“日期”对于类型查找不明确

在此上下文中日期对于类型查找来说不明确 1 找到该候选人基金会日期 2 找到该候选者 DocuSignESign Date extension Date func isGreaterThanDate dateToCompare Da
String 类型中的方法 format(String, Object[]) 不适用于参数 (...)

这是我的代码 int hoursFormat 1 minsFormat 2 secsFormat 3 String timeFormat String format 02d 02d 02d hoursFormat minsFormat se
读取 jenkins groovy 脚本中的配置文件以获取构建参数

我有一个参数的选择列表选择列表中的值基于登录 jenkins 的用户例如学生选择数学科学和商业科目他应该能够在选择下拉列表中看到自己的科目我将每个学生及其注册科目的映射存储在 json 文件中我用了配置文件提供程序插件 htt
jqGrid 'clearToolbar' 无需重新加载网格

我需要清除toolbar无需重新加载我的网格jqgrid 它应该只是将工具栏重置为其默认值我尝试使用 TransactionsGrid 0 clearToolbar My grid datatype local我不使用loadonce t
如何使用WebClient而不阻塞UI？

有人可以给我指一个教程或提供一些示例代码来调用System Net WebClient DownloadString url 在等待结果时不冻结 UI 的方法我认为这需要用线程来完成是否有一个简单的实现可以使用而不需要太多的开销代码 T
反转字符串的词序，不允许使用 str.split()

执行此操作的 pythonic 方法是什么从这个这是一个要尝试的字符串到这个尝试字符串 a is This 我的第一个猜测是 for w in This is a string to try split 1 print w but
如何使 AWS Data Pipeline ShellCommandActivity 脚本执行 python 文件

我正在使用一个 AWS Data Pipeline 它有一个 ShellCommandActivity 它将脚本 uri 设置为位于 s3 存储桶中的 bash 文件 bash 文件将位于同一 s3 存储桶中的 python 脚本复制到 E
Google 云消息接收器 Intent 未启动（广播 Intent 回调：result=CANCELLED forIntent）

我正在尝试制作一个GCM客户端注册就可以了我也成功从服务器发送消息然而客户端并没有启动意图它说 09 30 08 39 59 795 W GTalkService 4667 DataMsgMgr 广播意图回调 result CAN
从字符串而不是文件渲染 Blade

如何渲染包含刀片语法的字符串 View make directory file name gt with var var Usual usage View render var gt with var var Like this for E
异常调用堆栈被截断，没有任何重新抛出

我有一个不寻常的情况我有一个非常简单的异常被抛出并在同一方法中捕获它不会被重新抛出天真的程序员通常会遇到这样的问题然而它的 StackFrame 只包含一个当前方法它看起来是这样的 at my class MyMethod in
将8个16位SSE寄存器转换为8位数据

假设我有一个包含 16 位数据的 SSE 数组 1 2 3 4 5 6 7 8 现在我需要通过在前 8 个字节中仅存储 16 位数据的低字节来将此 SSE 数组转换为 8 位数据如下所示 1 2 3 4 5 6 7 8 0 0 0 0 0

将8个16位SSE寄存器转换为8位数据

将8个16位SSE寄存器转换为8位数据 的相关文章

随机推荐

热门标签

将8个16位SSE寄存器转换为8位数据的相关文章