顯卡規格,GTX 1080 vs GTX 1080 Ti,為什麼 Ti 比較高級?
GPU 基本硬體架構圖:
- SM: streaming multiprocessor
- SP: streaming processor (Fermi 架構之後統稱為 CUDA cores)
- Shared Memory: 同一塊 SM 上可以互通資料
- Global Memory: 所有人都可以互通資料,比 shared memory 慢
- Constant/texture Memory: 對 GPU 來說只能讀不能寫,讀取方式符合條件時速度會快
CUDA (Compute Unified Device Architecture,統一計算架構):Nvidia 發展的平行計算架構
- 可視為 C 的延伸
- 寫 function (kernel),放到 GPU 上面跑
- Thread
- kernel 會被不同的 threads 平行地執行
- 在硬體上,對應到 SP
- 每 32 個 thread 組成一個 warp,其 program counter 必須一致
- Block
- 數個 threads 組合而成
- 在硬體上,對應到 SM