我们有一个用霍夫曼编码编码的数据库。这里的目的是将其及其关联的解码器复制到 GPU 上;然后在 GPU 上对数据库进行解码,并在解码后的数据库上执行操作,而无需将其复制回 CPU 上。
我还远远不是霍夫曼专家,但我所知道的少数人表明,它似乎是一种本质上基于控制结构的算法。有了基础算法,恐怕会有很多序列化操作。
我的两个问题是:
- 你知道是否存在用于霍夫曼编码的高效 GPU 版本
- 如果没有,您认为是否存在适用于 GPU 的霍夫曼算法(即控制结构较少)。或者您可能知道(并且您可以提供参考)高效的霍夫曼解码在 GPU 上效率不高。
我看到了其他限制,但它们并不重要:
- GPU 无法非常有效地处理树:二叉树可以存储在经典数组中
- 工作量可能很难平衡:我们会看到之后
霍夫曼编码的问题是不能快进。即:你必须逐位、线性地解码。
因此,它对于并行性来说并不理想。
如果您可以决定编码,则可以完美地逐块编码,以便能够独立解码每个块。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)