Вопросы по теме 'gpu-shared-memory'
Предотвращает ли чтение массива int из разделяемой памяти конфликты банков?
Я разрабатываю ядро CUDA, которое будет запускаться с 16 потоками на блок потоков. У меня есть массив N int в общей памяти (т.е. на блок потока), который я хочу обработать.
Если шаблон доступа потоков является последовательным в массиве,...
363 просмотров
schedule
14.01.2023
Умножение матриц в CUDA переменных размеров матриц и использование общей памяти
Я хочу реализовать простое умножение матриц в CUDA. Размеры матрицы определяются во время выполнения, и я также хочу использовать общую память для повышения производительности. Я реализовал такую функцию, но каждый раз, когда я ее запускаю, я...
521 просмотров
schedule
13.11.2023
Могу ли я проверить, находится ли адрес в общей памяти?
Я хочу написать следующую функцию CUDA:
void foo(int* a, size_t n)
{
if ( /* MAGIC 1 */ ) {
// a is known to be in shared memory,
// so use it directly
}
else {
// make a copy of a in shared memory...
377 просмотров
schedule
18.08.2023
Как мне настроить мой ноутбук jupyter так, чтобы он использовал доступный графический процессор при работе с keras?
Я искал решения и установил tensorflow-gpu с помощью pip.
tf.config.list_physical_devices('GPU')
Этот код возвращает пустой список. []
Как видите, у меня 2 графических процессора, но ни один из них не используется, когда я обрабатываю...
257 просмотров
schedule
03.11.2023