При использовании Nvidia nvprof
для профилирования программы GPU я обнаружил, что есть две метрики, названные dram_read_throughput
и gld_throughput
. Описания:
dram_read_throughput: Device memory read throughput
gld_throughput: Global memory load throughput
В чем разница между этими двумя показателями? Или в чем разница между device memory
и global memory
?