簡介 |
---|
GPU 硬體與程式架構 |
第一個程式:向量相加 |
認識你的設備:information Query |
記憶體存取 |
Shared Memory |
Constant Memory |
Texture Memory |
Unified Virtual Addressing |
同步(synchronization) |
Atomics Operation |
效能分析 |
CUDA Event |
Occupancy |
CUDA C Best Practice Guide 中的其他細節們本篇主要為 CUDA C Best Practice Guide 之內容節錄 |
Ch. 11: Instruction Optimization |
Ch. 12: Control Flow |