Когда я перечисляю показатели nvprof с помощью
nvprof --query-events
Я понимаю:
thread_inst_executed: количество инструкций, выполненных активными потоками. Для каждой инструкции он увеличивается на количество потоков, включая потоки с предикативным отключением, которые выполняют инструкцию. Он не включает повторы.
Я хотел бы использовать эту метрику, поэтому я собираю метрики, используя:
nvprof --csv --metrics thread_inst_executed,inst_executed,inst_executed_global_loads,inst_executed_global_stores,inst_executed_local_loads,inst_executed_local_stores,inst_executed_shared_loads,inst_executed_shared_stores,gld_transactions,gst_transactions,local_load_transactions,local_store_transactions,shared_load_transactions,shared_store_transactions,l2_read_transactions,l2_write_transactions,dram_read_transactions,dram_write_transactions,sysmem_read_transactions,sysmem_write_transactions ./my_program my arguments
На выходе есть все метрики, которые я просил... кроме thread_inst_executed
. Почему его нет? Как я могу это получить?
--query-metrics
, а не--query-events
docs.nvidia.com/cuda/profiler-users-guide/ - person Robert Crovella   schedule 30.07.2020