Вопросы по теме 'infiniband'
Передача GPUDirect RDMA с графического процессора на удаленный хост
Сценарий:
У меня есть две машины, клиент и сервер, подключенные к Infiniband. Серверная машина имеет графический процессор NVIDIA Fermi, а клиентская машина не имеет графического процессора. У меня есть приложение, работающее на машине с...
4362 просмотров
schedule
26.09.2023
Как узнать путь установки InfiniBand
Я хочу сам скомпилировать MVAPICH2, но не знаю, где найти файл psm.h , его нельзя найти в местах по умолчанию.
Кто-нибудь знает, какую команду я могу использовать, чтобы найти InfiniBand?
759 просмотров
schedule
31.08.2022
Проблема с подключением Infiniband
Я получаю кластер, узлы которого связаны в толстое дерево IB. Коммутаторы Qlogic 12300.
У меня проблема в том, что некоторые узлы не могут общаться друг с другом. Даже есть другие узлы, которые могут общаться с обоими затронутыми узлами.
Я...
486 просмотров
schedule
22.07.2022
Кто-нибудь может объяснить мне связь между libibverbs и librxe?
Я изо всех сил пытаюсь понять связь между libibverbs и librxe и низкоуровневым драйвером ядра для HCA.
В частности, у меня есть следующие сомнения:
Когда пакет поступает на HCA, низкоуровневый драйвер ядра передает пакет приложению...
666 просмотров
schedule
12.09.2023
Почему отключение IRQ в Linux приводит к сбою rdma_read и rdma_write?
У меня есть две хост-машины, соединенные Mellanox infiniband HCA. Я выполняю простое приложение RDMA для выполнения операций записи и чтения RDMA с одной машины (клиента) на другую машину (сервер). Чтобы узнать, какие прерывания связаны с картами...
416 просмотров
schedule
04.04.2022
Невозможно создать пару очередей с помощью ib_create_qp
Я пишу модуль ядра RDMA (InfiniBand).
До сих пор мне удавалось создавать домен защиты, очереди завершения для очередей отправки и получения.
Но всякий раз, когда я пытаюсь создать пару очереди, вызывая ib_create_qp, мне не удается создать пару...
2801 просмотров
schedule
25.07.2022
Чтобы создать несколько пар очередей в RDMA
Я новичок в программировании RDMA. Мой рабочий процесс выглядит следующим образом.
struct rdma_cm_id *cm_client_id = NULL;
struct rdma_cm_event *cm_event = NULL;
ret = process_rdma_cm_event(cm_event_channel, RDMA_CM_EVENT_CONNECT_REQUEST,...
569 просмотров
schedule
22.10.2023
MPI с поддержкой CUDA для двух графических процессоров в одном K80
Я пытаюсь оптимизировать производительность теста MPI+CUDA под названием LAMMPS ( https://github.com/lammps/lammps ). Прямо сейчас я работаю с двумя процессами MPI и двумя графическими процессорами. Моя система имеет две розетки, и каждая розетка...
563 просмотров
schedule
04.03.2024
Почему MPI использует IpoIB вместо собственного IB?
Я понимаю, что OpenMPI использует OpenIB, а OpenIB использует Ip over Infiniband (IPoIB).
Я не понимаю, почему бы не использовать родной ИБ, если он быстрее, чем IPoIB?
Есть ли реализация MPI, использующая собственный IB?
1003 просмотров
schedule
26.11.2023
Как использовать сеть InfiniBand с Dask?
У меня есть кластер с высокопроизводительной сетью (InfiniBand). Однако, когда я настроил свой планировщик Dask и рабочие процессы, производительность оказалась не такой быстрой, как я ожидал. Как я могу сказать Dask использовать эту сеть?
Отказ...
911 просмотров
schedule
31.05.2024