我正在复制 N 个字节pSrc
to pDest
。这可以在单个循环中完成:
for (int i = 0; i < N; i++)
*pDest++ = *pSrc++
为什么这比memcpy
or memmove
?他们使用什么技巧来加快速度?
因为 memcpy 使用字指针而不是字节指针,所以 memcpy 实现也经常用SIMD指令可以一次洗牌 128 位。
SIMD 指令是汇编指令,可以对最多 16 字节长的向量中的每个元素执行相同的操作。这包括加载和存储指令。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)