使用 Accelerate 框架的无符号 8 位整数的求和数组

2023-12-03

我可以使用 Accelerate Framework 对无符号 8 位整数数组求和,而不转换为浮点数数组吗?

我目前的做法是:

vDSP_vfltu8(intArray, 1, floatArray, 1, size);
vDSP_sve(floatArray, 1, &result, size);

但 vDSP_vfltu8 相当慢。


  1. 如果这对你很重要vDSP_vfltu8( )请快点提交错误报告。如果有任何疑问,提交错误报告。表现不足is一个错误,如果您报告它,将被视为错误。图书馆作者利用这种反馈来确定如何确定他们工作的优先顺序;您的错误报告是位于优化队列前面的函数与队列中#1937 之间的差异。
  2. 正如已经暗示的那样,整数累加由于溢出问题而变得复杂,但如果 vDSP 库提供的针对特定情况的优化函数很有用,请提交错误报告请求这样的功能(注意到一个模式?)。库编写者没有通灵能力,不会编写不需要的函数。请务必解释您将如何使用这样的函数——根据这些信息,他们可能会想出一个稍微不同的函数,但对您来说更有用。
  3. 如果您决定自己编写一些 NEON 代码,您将需要使用vaddw_u8( )固有的。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Accelerate 框架的无符号 8 位整数的求和数组 的相关文章

随机推荐