image.png

Virtual memory 包括 disk 和 RAM

Pinned,page-locked,non-pageable memory 的访问会更快但是空间没有虚拟空间那么大

当要把数据从 cpu 送往 gpu 时,需要先有一个 page-locked copy

同步与异步拷贝

当调用 to() 时,默认会执行 cudaMemcpyAsync,即异步传输

更多性能优化分析