Вопросы по теме 'nvcc'
CUDA: невыровненный доступ к памяти не поддерживается: что мне не хватает?
Есть несколько вопросов похожих к этому, но в данном случае это немного странно; NVCC 3.1 это не нравится, но 3.2 и 4.0RC нравится;
float xtmp[MAT1];
for (i=0; i<MAT1; i++){
xtmp[i]=x[p[i]]; //value that should be here
}
Где p...
472 просмотров
schedule
17.11.2022
ошибка компиляции библиотеки nvcc и BOOST
nvcc бросает
/usr/include/boost/concept/detail/has_constraints.hpp:29: error: ‘&’ cannot appear in a constant-expression
/usr/include/boost/concept/detail/has_constraints.hpp:29: error: template argument 2 is invalid
в has_constraints.hpp...
1217 просмотров
schedule
02.05.2024
Как я могу скомпилировать код CUDA, а затем связать его с проектом C++?
Я ищу помощи, чтобы начать работу с проектом, включающим CUDA. Моя цель - иметь проект, который я могу скомпилировать в родном компиляторе g++, но с использованием кода CUDA. Я понимаю, что мне нужно скомпилировать свой код CUDA в компиляторе nvcc,...
70517 просмотров
schedule
27.02.2022
Как назначаются регистры при компиляции CUDA
Говорят, что количество регистров на ядро важно для оптимизации CUDA, и верхняя граница этого числа может быть установлена с помощью "-maxrregcount=N" в nvcc. Я не мог этого понять, потому что думал, что количество регистров можно просто...
857 просмотров
schedule
10.04.2022
выборочно компилировать заголовки и функции класса в CUDA
Я пытаюсь использовать свои классы С++ в CUDA.
У меня есть класс как таковой:
#include<string>
#include<stdlib.h>
class exampleClass{
int i;
__host__ __device__ exampleClass(int _i):i(_i){};
__host__ __device__ void...
378 просмотров
schedule
04.01.2023
Ошибка сегментации при компиляции CUDA hello, world with relocatable-device-code
Я пытаюсь использовать флаг relocatable-device-code . У меня есть большой проект, который было бы легче поддерживать с помощью небольших блоков кода.
Мне удалось скомпилировать проект. При попытке запустить его я получаю жесткий сбой. При...
957 просмотров
schedule
30.07.2023
Невозможно запустить код CUDA, который запрашивает NVML — ошибка относительно libnvidia-ml.so
Недавно коллеге понадобилось использовать NVML для запроса информации об устройстве, поэтому я скачал комплект разработки Tesla 3.304.5 и скопировал файл nvml.h в /usr/include. Для проверки я скомпилировал код примера в tdk_3.304.5/nvml/example, и он...
21058 просмотров
schedule
22.10.2022
Связать ядра вместе
У меня есть ядро CUDA в файле .cu и другое ядро CUDA в другом файле .cu. Я знаю, что с динамическим параллелизмом я могу вызвать другое ядро CUDA из родительского ядра, но я хотел бы знать, есть ли способ сделать это с дочерним ядром,...
229 просмотров
schedule
01.08.2023
Ошибка компиляции проекта cuda
У меня возникли проблемы с компиляцией проекта cuda с помощью C Cuda и библиотек lodepng.
Мой makefile выглядит так.
gpu: super-resolution.cu
gcc -g -O -c lodepng.c
nvcc -c super-resolution.cu
nvcc -o super-resolution-cuda...
5230 просмотров
schedule
19.02.2023
Компиляция NVCC в ptx с помощью CMAKE cuda_compile_ptx
У меня простое ядро в файле kernel.cu
__global__ void add1( double * pi, double c )
{
*pi += c;
}
и может легко скомпилировать его в файл ptx kernel.ptx с помощью:
nvcc -ptx kernel.cu
теперь я хотел воспроизвести такое же...
2474 просмотров
schedule
14.06.2023
CUDA: как использовать -arch и -code и SM против COMPUTE
Я до сих пор не уверен, как правильно указать архитектуры для генерации кода при сборке с помощью nvcc. Я знаю, что в мой двоичный файл встроен машинный код, а также код PTX, и что им можно управлять с помощью переключателей контроллера -code и...
30896 просмотров
schedule
01.07.2022
CUDA SASS в Кубин
С помощью CuObjDump SASS можно сгенерировать из файла Cubin с помощью cuobjdump -sass <input file> , но есть ли способ преобразовать SASS обратно в Cubin.
996 просмотров
schedule
21.12.2023
Nsight Eclipse Edition 7.5 добавляет команду компиляции в библиотеку ссылок
Я хотел бы слинковать библиотеку cusparse с помощью -lcusparse для компилятора nvcc в Nsight, т.е. что-то вроде этого nvcc test_sparse.cu -lcusparse -o test_CUSPARSE .
Где именно это можно добавить в Nsight 7.5, я нашел пояснения только для...
100 просмотров
schedule
06.02.2023
Как использовать другие компиляторы С++ с CUDA в Windows?
Я пытаюсь создать простое приложение с CUDA, и я пытался часами подряд, и я просто не могу заставить его работать в Windows. nvcc абсолютно отказывается компилироваться без компилятора Visual Studio, который не поддерживает то, что мне нужно. Я...
3451 просмотров
schedule
24.11.2022
Собственная сумма в пользовательской операции tensorflow C++ с Eigen::half на GPUDevice
Я пытаюсь создать собственный тензорный поток Op. Я получил несколько операций для работы, используя https://www.tensorflow.org/versions/master/how_tos/adding_an_op/index.html и обычный C++.
Проблема возникает при использовании фреймворка Eigen...
433 просмотров
schedule
17.02.2023
nvcc fatal: неподдерживаемая архитектура графического процессора «compute_61» при установленном CUDA 8.0
У меня возникла проблема при установке cutorch с luarocks. Ошибка сообщает, что архитектура графического процессора «compute_61» не поддерживается. После некоторого поиска я понял, что проблема может быть вызвана старой версией CUDA. Но это не так,...
5453 просмотров
schedule
11.03.2024
nvcc: получение вычислительных возможностей устройства во время выполнения
У меня есть приложение, которое использует графический процессор и работает на разных машинах. В настоящее время я вручную указываю NVCC параметры -arch=compute_xx -code=sm_xx в соответствии с моделью графического процессора, установленной на...
4045 просмотров
schedule
07.06.2024
создание модуля pybind11 с источниками cpp и cuda с использованием cmake
Я пытаюсь создать привязки python для фиктивного класса, который необходимо скомпилировать с помощью компилятора с поддержкой cuda. Я использую cmake 3.12.0, pybind11 v2.2.3 и nvcc 7.5.17. Компиляция завершается неудачно, потому что такие параметры,...
1982 просмотров
schedule
07.08.2023
Как передать флаг компилятору nvcc в CMAKE
У меня есть проект C в Cmake , в который я встроил cuda модуль ядра .
Я хочу передать --ptxas-options=-v только nvcc , чтобы просмотреть количество использованных регистров на поток и использование общей памяти на блок .
В поисках...
9215 просмотров
schedule
21.02.2024
Несоответствие версии CUDA
Я попытался удалить CUDA 10 и установить 9.2. Теперь nvcc -V возвращает 9.2, но nvidia-smi говорит, что CUDA 10.0.
Есть идеи, почему это может происходить или как это исправить? Не могу найти ничего, связанного с 10.0, еще осталось в моей...
2891 просмотров
schedule
09.03.2024