Вопросы по теме 'gpgpu'

OpenCL, прямой доступ к памяти хоста из ядра графического процессора
Есть ли способ выделить память на хосте, доступную напрямую из GPU, без копирования? Как cudaHostGetDevicePointer в CUDA.
2522 просмотров
schedule 07.08.2023

Параллелизм, 4 приложения CUDA, конкурирующие за ресурсы графического процессора
Что произойдет, если четыре одновременно работающих приложения CUDA будут конкурировать за ресурсы в одном графическом процессоре, чтобы они могли переложить работу на графическую карту? В Cuda Programming Guide 3.1 упоминается, что есть определенные...
1289 просмотров
schedule 14.05.2023

GPGPU, OpenCL, CUDA, поток ATI
Скажите, пожалуйста, какие технологии GPGPU уже существуют и какие поставщики оборудования реализуют GPGPU? С утра читаю статьи на разных сайтах и ​​запутался.
1019 просмотров
schedule 21.06.2023

Конфликт банка общей памяти графического процессора
Я пытаюсь понять, как возникают конфликты банков. если у меня есть массив размером 256 в глобальной памяти и у меня есть 256 потоков в одном блоке, и я хочу скопировать массив в общую память. поэтому каждый поток копирует один элемент....
9438 просмотров
schedule 09.07.2022

Раскрытие информации Nvidia / Уязвимость памяти в Linux и общая защита памяти ОС
Я думал, что это ожидаемое поведение? Из: http://classic.chem.msu.su/cgi-bin/ceilidh.exe/gran/gamess/forum/?C35e9ea936bHW-7675-1380-00.htm Перефразированное резюме: «Работая над портом Linux, мы обнаружили, что вызовы API...
246 просмотров
schedule 11.10.2022

Помощь с JOCL на Mac
Я пытаюсь запустить это руководство на своем Mac. Учебное пособие предназначено для Windows и содержит версию 1.3 jocl (JOCL-0.1.3a-beta.jar) и родную dll jocl для Windows (JOCL-windows-x86_64.dll). Получив код, я в основном избавился от...
723 просмотров
schedule 08.05.2024

CUDA: невыровненный доступ к памяти не поддерживается: что мне не хватает?
Есть несколько вопросов похожих к этому, но в данном случае это немного странно; NVCC 3.1 это не нравится, но 3.2 и 4.0RC нравится; float xtmp[MAT1]; for (i=0; i<MAT1; i++){ xtmp[i]=x[p[i]]; //value that should be here } Где p...
472 просмотров
schedule 17.11.2022

CUDA cudaMalloc
Я начал писать новое приложение CUDA. Однако по пути я попал в забавный крюк. Вызов первого cudaMalloc для переменной x завершается с ошибкой в ​​первый раз. Однако, когда я вызываю его во второй раз, он возвращает cudaSuccess. Недавно обновился...
5324 просмотров
schedule 01.10.2023

OpenCL производит неверные вычисления
Я пытался использовать openCL для некоторых вычислений, но результаты неверны. Я ввожу три float3, которые выглядят так: [300000,0,0] [300000,300000,0] [300000,300000,300000] в это ядро: __kernel void gravitate(__global const float3...
561 просмотров
schedule 22.04.2022

Библиотека CImg в Cuda
Я работаю над кодом в CUDA C на VS2008, Win 7. Я получил матрицу с плавающей запятой, которая должна отображаться как изображение. Я сохранил ее как файл .bin и загрузил в отдельный файл .cpp и успешно сформировал изображение с использованием...
878 просмотров
schedule 07.08.2023

CUDA - копировать в массив внутри массива объектов
У меня есть приложение CUDA, над которым я работаю, с массивом объектов; каждый объект имеет указатель на массив std::pair<int, double> . Я пытаюсь cudaMemcpy массив объектов поверх, затем cudaMemcpy массив пар для каждого из объектов, однако...
3626 просмотров
schedule 16.05.2022

Вопрос по поводу подробностей о раздаче из блоков в СМ в CUDA
Возьмем в качестве примера оборудование с вычислительной мощностью 1,3. Доступно 30 смс. Тогда одновременно может работать не более 240 блоков (учитывая ограничение на регистр и общую память, ограничение на количество блоков может быть намного...
254 просмотров
schedule 25.11.2023

Странное поведение операции атомарного добавления OpenCL
Для проекта мне пришлось погрузиться в OpenCL: дела идут довольно хорошо, за исключением того, что теперь мне нужны атомарные операции. Я выполняю код OpenCL поверх графического процессора Nvidia с последними драйверами. clGetDeviceInfo() запрос...
2361 просмотров
schedule 04.08.2022

Объявления структуры OpenCL в разных областях памяти
Каковы будут последствия и различия между следующими объявлениями структур в OpenCL. А если они незаконны, то почему? struct gr_array { int ndims; __global m_integer* dim_size; __global m_real* data; }; typedef struct gr_array...
1787 просмотров
schedule 08.06.2022

Почему алгоритмы на основе GPU работают быстрее
Я только что реализовал алгоритм на графическом процессоре, который вычисляет разницу между последовательными индексами массива. Я сравнил его с реализацией на основе процессора и заметил, что для массива большого размера реализация на основе...
647 просмотров
schedule 05.03.2022

Передача инструкций между CPU и GPU
Я ищу информацию, связанную с тем, как CPU перемещает программный код на GPU при работе с вычислениями GPGPU. В Интернете полно инструкций по передаче данных, но не по загрузке инструкций / программ. Вопрос в следующем: программа обрабатывается...
864 просмотров
schedule 17.05.2023

Декодировать видеокадры на iPhone GPU
Я ищу самый быстрый способ декодировать кадры локального видео в формате mpeg-4 на iPhone. Меня просто интересуют значения яркости пикселей в каждом 10-м кадре. Мне не нужно никуда рендерить видео. Я пробовал ffmpeg, AVAssetReader,...
7135 просмотров
schedule 29.01.2024

Есть ли новые идеи по использованию openCL с несколькими графическими процессорами?
У меня вопрос: Было ли что-то новое (или, возможно, разработано средство / библиотека) для использования openCL с несколькими графическими процессорами? Я понимаю, что если кто-то хочет написать код на openCL с целью использования нескольких...
831 просмотров
schedule 19.02.2022

Cuda: используйте глобальную память для хранения смежных данных разного размера.
У меня проблема с использованием буфера байтов в глобальной памяти для хранения целого числа разного размера (8 бит, 16 бит, 32 бит, 64 бит). Если я сохраняю целое число со значением указателя, не кратным 4 байтам (например, потому что я только что...
481 просмотров
schedule 12.01.2024

неграфические тесты для GPU
Большинство тестов производительности графического процессора и нагрузочного тестирования связаны с графикой. Есть ли какой-нибудь тест, который требует больших вычислительных ресурсов, но не связан с графикой? Я использую ноутбук DELL XPS 15,...
162 просмотров
schedule 25.02.2024