Вопросы по теме 'nvcc'

CUDA: невыровненный доступ к памяти не поддерживается: что мне не хватает?
Есть несколько вопросов похожих к этому, но в данном случае это немного странно; NVCC 3.1 это не нравится, но 3.2 и 4.0RC нравится; float xtmp[MAT1]; for (i=0; i<MAT1; i++){ xtmp[i]=x[p[i]]; //value that should be here } Где p...
472 просмотров
schedule 17.11.2022

ошибка компиляции библиотеки nvcc и BOOST
nvcc бросает /usr/include/boost/concept/detail/has_constraints.hpp:29: error: ‘&’ cannot appear in a constant-expression /usr/include/boost/concept/detail/has_constraints.hpp:29: error: template argument 2 is invalid в has_constraints.hpp...
1217 просмотров
schedule 02.05.2024

Как я могу скомпилировать код CUDA, а затем связать его с проектом C++?
Я ищу помощи, чтобы начать работу с проектом, включающим CUDA. Моя цель - иметь проект, который я могу скомпилировать в родном компиляторе g++, но с использованием кода CUDA. Я понимаю, что мне нужно скомпилировать свой код CUDA в компиляторе nvcc,...
70517 просмотров
schedule 27.02.2022

Как назначаются регистры при компиляции CUDA
Говорят, что количество регистров на ядро ​​важно для оптимизации CUDA, и верхняя граница этого числа может быть установлена ​​с помощью "-maxrregcount=N" в nvcc. Я не мог этого понять, потому что думал, что количество регистров можно просто...
857 просмотров
schedule 10.04.2022

выборочно компилировать заголовки и функции класса в CUDA
Я пытаюсь использовать свои классы С++ в CUDA. У меня есть класс как таковой: #include<string> #include<stdlib.h> class exampleClass{ int i; __host__ __device__ exampleClass(int _i):i(_i){}; __host__ __device__ void...
378 просмотров
schedule 04.01.2023

Ошибка сегментации при компиляции CUDA hello, world with relocatable-device-code
Я пытаюсь использовать флаг relocatable-device-code . У меня есть большой проект, который было бы легче поддерживать с помощью небольших блоков кода. Мне удалось скомпилировать проект. При попытке запустить его я получаю жесткий сбой. При...
957 просмотров
schedule 30.07.2023

Невозможно запустить код CUDA, который запрашивает NVML — ошибка относительно libnvidia-ml.so
Недавно коллеге понадобилось использовать NVML для запроса информации об устройстве, поэтому я скачал комплект разработки Tesla 3.304.5 и скопировал файл nvml.h в /usr/include. Для проверки я скомпилировал код примера в tdk_3.304.5/nvml/example, и он...
21058 просмотров
schedule 22.10.2022

Связать ядра вместе
У меня есть ядро ​​CUDA в файле .cu и другое ядро ​​CUDA в другом файле .cu. Я знаю, что с динамическим параллелизмом я могу вызвать другое ядро ​​CUDA из родительского ядра, но я хотел бы знать, есть ли способ сделать это с дочерним ядром,...
229 просмотров
schedule 01.08.2023

Ошибка компиляции проекта cuda
У меня возникли проблемы с компиляцией проекта cuda с помощью C Cuda и библиотек lodepng. Мой makefile выглядит так. gpu: super-resolution.cu gcc -g -O -c lodepng.c nvcc -c super-resolution.cu nvcc -o super-resolution-cuda...
5230 просмотров
schedule 19.02.2023

Компиляция NVCC в ptx с помощью CMAKE cuda_compile_ptx
У меня простое ядро ​​в файле kernel.cu __global__ void add1( double * pi, double c ) { *pi += c; } и может легко скомпилировать его в файл ptx kernel.ptx с помощью: nvcc -ptx kernel.cu теперь я хотел воспроизвести такое же...
2474 просмотров
schedule 14.06.2023

CUDA: как использовать -arch и -code и SM против COMPUTE
Я до сих пор не уверен, как правильно указать архитектуры для генерации кода при сборке с помощью nvcc. Я знаю, что в мой двоичный файл встроен машинный код, а также код PTX, и что им можно управлять с помощью переключателей контроллера -code и...
30896 просмотров
schedule 01.07.2022

CUDA SASS в Кубин
С помощью CuObjDump SASS можно сгенерировать из файла Cubin с помощью cuobjdump -sass <input file> , но есть ли способ преобразовать SASS обратно в Cubin.
996 просмотров
schedule 21.12.2023

Nsight Eclipse Edition 7.5 добавляет команду компиляции в библиотеку ссылок
Я хотел бы слинковать библиотеку cusparse с помощью -lcusparse для компилятора nvcc в Nsight, т.е. что-то вроде этого nvcc test_sparse.cu -lcusparse -o test_CUSPARSE . Где именно это можно добавить в Nsight 7.5, я нашел пояснения только для...
100 просмотров
schedule 06.02.2023

Как использовать другие компиляторы С++ с CUDA в Windows?
Я пытаюсь создать простое приложение с CUDA, и я пытался часами подряд, и я просто не могу заставить его работать в Windows. nvcc абсолютно отказывается компилироваться без компилятора Visual Studio, который не поддерживает то, что мне нужно. Я...
3451 просмотров
schedule 24.11.2022

Собственная сумма в пользовательской операции tensorflow C++ с Eigen::half на GPUDevice
Я пытаюсь создать собственный тензорный поток Op. Я получил несколько операций для работы, используя https://www.tensorflow.org/versions/master/how_tos/adding_an_op/index.html и обычный C++. Проблема возникает при использовании фреймворка Eigen...
433 просмотров
schedule 17.02.2023

nvcc fatal: неподдерживаемая архитектура графического процессора «compute_61» при установленном CUDA 8.0
У меня возникла проблема при установке cutorch с luarocks. Ошибка сообщает, что архитектура графического процессора «compute_61» не поддерживается. После некоторого поиска я понял, что проблема может быть вызвана старой версией CUDA. Но это не так,...
5453 просмотров
schedule 11.03.2024

nvcc: получение вычислительных возможностей устройства во время выполнения
У меня есть приложение, которое использует графический процессор и работает на разных машинах. В настоящее время я вручную указываю NVCC параметры -arch=compute_xx -code=sm_xx в соответствии с моделью графического процессора, установленной на...
4045 просмотров
schedule 07.06.2024

создание модуля pybind11 с источниками cpp и cuda с использованием cmake
Я пытаюсь создать привязки python для фиктивного класса, который необходимо скомпилировать с помощью компилятора с поддержкой cuda. Я использую cmake 3.12.0, pybind11 v2.2.3 и nvcc 7.5.17. Компиляция завершается неудачно, потому что такие параметры,...
1982 просмотров
schedule 07.08.2023

Как передать флаг компилятору nvcc в CMAKE
У меня есть проект C в Cmake , в который я встроил cuda модуль ядра . Я хочу передать --ptxas-options=-v только nvcc , чтобы просмотреть количество использованных регистров на поток и использование общей памяти на блок . В поисках...
9215 просмотров
schedule 21.02.2024

Несоответствие версии CUDA
Я попытался удалить CUDA 10 и установить 9.2. Теперь nvcc -V возвращает 9.2, но nvidia-smi говорит, что CUDA 10.0. Есть идеи, почему это может происходить или как это исправить? Не могу найти ничего, связанного с 10.0, еще осталось в моей...
2891 просмотров