Вопросы по теме 'gpgpu'
OpenCL, прямой доступ к памяти хоста из ядра графического процессора
Есть ли способ выделить память на хосте, доступную напрямую из GPU, без копирования?
Как cudaHostGetDevicePointer в CUDA.
2522 просмотров
schedule
07.08.2023
Параллелизм, 4 приложения CUDA, конкурирующие за ресурсы графического процессора
Что произойдет, если четыре одновременно работающих приложения CUDA будут конкурировать за ресурсы в одном графическом процессоре, чтобы они могли переложить работу на графическую карту? В Cuda Programming Guide 3.1 упоминается, что есть определенные...
1289 просмотров
schedule
14.05.2023
GPGPU, OpenCL, CUDA, поток ATI
Скажите, пожалуйста, какие технологии GPGPU уже существуют и какие поставщики оборудования реализуют GPGPU?
С утра читаю статьи на разных сайтах и запутался.
1019 просмотров
schedule
21.06.2023
Конфликт банка общей памяти графического процессора
Я пытаюсь понять, как возникают конфликты банков. если у меня есть массив размером 256 в глобальной памяти и у меня есть 256 потоков в одном блоке, и я хочу скопировать массив в общую память. поэтому каждый поток копирует один элемент....
9438 просмотров
schedule
09.07.2022
Раскрытие информации Nvidia / Уязвимость памяти в Linux и общая защита памяти ОС
Я думал, что это ожидаемое поведение?
Из: http://classic.chem.msu.su/cgi-bin/ceilidh.exe/gran/gamess/forum/?C35e9ea936bHW-7675-1380-00.htm
Перефразированное резюме: «Работая над портом Linux, мы обнаружили, что вызовы API...
246 просмотров
schedule
11.10.2022
Помощь с JOCL на Mac
Я пытаюсь запустить это руководство на своем Mac.
Учебное пособие предназначено для Windows и содержит версию 1.3 jocl (JOCL-0.1.3a-beta.jar) и родную dll jocl для Windows (JOCL-windows-x86_64.dll).
Получив код, я в основном избавился от...
723 просмотров
schedule
08.05.2024
CUDA: невыровненный доступ к памяти не поддерживается: что мне не хватает?
Есть несколько вопросов похожих к этому, но в данном случае это немного странно; NVCC 3.1 это не нравится, но 3.2 и 4.0RC нравится;
float xtmp[MAT1];
for (i=0; i<MAT1; i++){
xtmp[i]=x[p[i]]; //value that should be here
}
Где p...
472 просмотров
schedule
17.11.2022
CUDA cudaMalloc
Я начал писать новое приложение CUDA. Однако по пути я попал в забавный крюк. Вызов первого cudaMalloc для переменной x завершается с ошибкой в первый раз. Однако, когда я вызываю его во второй раз, он возвращает cudaSuccess. Недавно обновился...
5324 просмотров
schedule
01.10.2023
OpenCL производит неверные вычисления
Я пытался использовать openCL для некоторых вычислений, но результаты неверны.
Я ввожу три float3, которые выглядят так:
[300000,0,0]
[300000,300000,0]
[300000,300000,300000]
в это ядро:
__kernel void gravitate(__global const float3...
561 просмотров
schedule
22.04.2022
Библиотека CImg в Cuda
Я работаю над кодом в CUDA C на VS2008, Win 7. Я получил матрицу с плавающей запятой, которая должна отображаться как изображение. Я сохранил ее как файл .bin и загрузил в отдельный файл .cpp и успешно сформировал изображение с использованием...
878 просмотров
schedule
07.08.2023
CUDA - копировать в массив внутри массива объектов
У меня есть приложение CUDA, над которым я работаю, с массивом объектов; каждый объект имеет указатель на массив std::pair<int, double> . Я пытаюсь cudaMemcpy массив объектов поверх, затем cudaMemcpy массив пар для каждого из объектов, однако...
3626 просмотров
schedule
16.05.2022
Вопрос по поводу подробностей о раздаче из блоков в СМ в CUDA
Возьмем в качестве примера оборудование с вычислительной мощностью 1,3.
Доступно 30 смс. Тогда одновременно может работать не более 240 блоков (учитывая ограничение на регистр и общую память, ограничение на количество блоков может быть намного...
254 просмотров
schedule
25.11.2023
Странное поведение операции атомарного добавления OpenCL
Для проекта мне пришлось погрузиться в OpenCL: дела идут довольно хорошо, за исключением того, что теперь мне нужны атомарные операции. Я выполняю код OpenCL поверх графического процессора Nvidia с последними драйверами. clGetDeviceInfo() запрос...
2361 просмотров
schedule
04.08.2022
Объявления структуры OpenCL в разных областях памяти
Каковы будут последствия и различия между следующими объявлениями структур в OpenCL. А если они незаконны, то почему?
struct gr_array
{
int ndims;
__global m_integer* dim_size;
__global m_real* data;
};
typedef struct gr_array...
1787 просмотров
schedule
08.06.2022
Почему алгоритмы на основе GPU работают быстрее
Я только что реализовал алгоритм на графическом процессоре, который вычисляет разницу между последовательными индексами массива. Я сравнил его с реализацией на основе процессора и заметил, что для массива большого размера реализация на основе...
647 просмотров
schedule
05.03.2022
Передача инструкций между CPU и GPU
Я ищу информацию, связанную с тем, как CPU перемещает программный код на GPU при работе с вычислениями GPGPU. В Интернете полно инструкций по передаче данных, но не по загрузке инструкций / программ.
Вопрос в следующем: программа обрабатывается...
864 просмотров
schedule
17.05.2023
Декодировать видеокадры на iPhone GPU
Я ищу самый быстрый способ декодировать кадры локального видео в формате mpeg-4 на iPhone. Меня просто интересуют значения яркости пикселей в каждом 10-м кадре. Мне не нужно никуда рендерить видео.
Я пробовал ffmpeg, AVAssetReader,...
7135 просмотров
schedule
29.01.2024
Есть ли новые идеи по использованию openCL с несколькими графическими процессорами?
У меня вопрос:
Было ли что-то новое (или, возможно, разработано средство / библиотека) для использования openCL с несколькими графическими процессорами? Я понимаю, что если кто-то хочет написать код на openCL с целью использования нескольких...
831 просмотров
schedule
19.02.2022
Cuda: используйте глобальную память для хранения смежных данных разного размера.
У меня проблема с использованием буфера байтов в глобальной памяти для хранения целого числа разного размера (8 бит, 16 бит, 32 бит, 64 бит).
Если я сохраняю целое число со значением указателя, не кратным 4 байтам (например, потому что я только что...
481 просмотров
schedule
12.01.2024
неграфические тесты для GPU
Большинство тестов производительности графического процессора и нагрузочного тестирования связаны с графикой. Есть ли какой-нибудь тест, который требует больших вычислительных ресурсов, но не связан с графикой? Я использую ноутбук DELL XPS 15,...
162 просмотров
schedule
25.02.2024