Вопросы по теме 'nvprof'

Где я могу найти недостающие формулы в последнем руководстве пользователя Nvidia CUDA Profiler
Я обнаружил, что в предыдущей версии руководства пользователя профилировщика была представлена ​​формула для метрик. Например, Metric Name: branch_efficiency Description: Ratio of non-divergent branches to total branches Formula: 100 * (branch...
92 просмотров
schedule 22.08.2022

Невозможно импортировать данные профиля, сгенерированные nvprof.
Я пытаюсь профилировать код на основе TensorFlow, используя nvprof . Я использую следующую команду для этого nvprof python ass2.py Программа работает успешно, но в конце выдает следующую ошибку. ==49791== Profiling application: python...
3299 просмотров
schedule 29.05.2023

Как профилировать приложение CUDA только с помощью nvprof
Я хочу написать сценарий для профилирования моего приложения cuda, используя только командный инструмент nvprof . В настоящее время я сосредотачиваюсь на двух показателях: использование GPU и GPU flops32 (FP32). Использование графического...
1510 просмотров
schedule 01.05.2022

Выданы инструкции по загрузке/сохранению для воспроизведения
Есть две метрики nvprof относительно инструкций загрузки/сохранения: ldst_executed и ldst_issued . Мы знаем, что executed<=issued . Я ожидаю, что те загрузки/сохранения, которые выдаются, но не выполняются, связаны с предикациями ветвления...
146 просмотров
schedule 11.02.2024

Как остановить запуск сервера TensorRT без использования ctrl-c (для профилирования с помощью nvprof)
Я запускаю nvprof для профилирования использования графического процессора модели сервер-клиент TensorRT. Вот что я делаю: Запустите nvprof на терминале 1 в док-контейнере с включенным TensorRT, nvprof --profile-all-processes -o results%p.nvvp...
92 просмотров
schedule 22.07.2023

Почему я не получаю thread_inst_executed
Когда я перечисляю показатели nvprof с помощью nvprof --query-events Я понимаю: thread_inst_executed: количество инструкций, выполненных активными потоками. Для каждой инструкции он увеличивается на количество потоков, включая потоки с...
57 просмотров
schedule 14.04.2023

Предупреждение nvprof: путь к библиотекам CUPTI и CUDA Injection не может быть установлен в LD_LIBRARY_PATH
Я получаю сообщение в теме, когда пытаюсь запустить программу, разработанную с помощью OpenACC, через профилировщик nvprof Nvidia, например: nvprof ./SFS 4 Если я запускаю nvprof с -o [output_file] , предупреждающее сообщение не...
452 просмотров
schedule 09.09.2022

Разница между памятью устройства и глобальной памятью?
При использовании Nvidia nvprof для профилирования программы GPU я обнаружил, что есть две метрики, названные dram_read_throughput и gld_throughput . Описания: dram_read_throughput: Device memory read throughput gld_throughput: Global...
26 просмотров
schedule 21.08.2023