导言:
大家都知道CUDA 中PageLocked memory 相比portable memory 有着多种优势:
- 在有front-side bus的系统中,pagelocked memory 所提供的host 与device之间的数据传送速度,快得多。测试结果如图Fig.1 Fig.2所示。
- kernel execution 和 pagelocked memory 与 device memory 间的数据复制可同时进行(具体有待实验)。
- 一些设备(计算能力2.0及以上),pagelocked memory 可以被映射到设备地址空间(mapped memory),从而减少对数据复制的需求,增加程序运行速度,这一项将是本文考察的重点。
当然pageLocked memory 也有缺点,那就是内存如果占用过多将影响程序的运行速度,因为这一块内存被锁定后无法自由分配给其他线程或程序。当然对于主机内存资源足够用的小e来说根本也不成问题(4G)。
![](http://hi.csdn.net/attachment/201103/21/0_1300674685Qxxa.gif)
![](http://hi.csdn.net/attachment/201103/21/0_1300674714c4ac.gif)