Virtual memory 包括 disk 和 RAM
Pinned,page-locked,non-pageable memory 的访问会更快但是空间没有虚拟空间那么大
当要把数据从 cpu 送往 gpu 时,需要先有一个 page-locked copy
当调用 to()
时,默认会执行 cudaMemcpyAsync
,即异步传输
non_blocking=False
,会调用 cudaStreamSynchronize
,在主线程阻塞 to()
,这是同步non_blocking=True
时,不会阻塞,从主机的视角看,可以发送多个传输任务,这是异步