Вопросы по теме 'infiniband'

Передача GPUDirect RDMA с графического процессора на удаленный хост
Сценарий: У меня есть две машины, клиент и сервер, подключенные к Infiniband. Серверная машина имеет графический процессор NVIDIA Fermi, а клиентская машина не имеет графического процессора. У меня есть приложение, работающее на машине с...
4362 просмотров
schedule 26.09.2023

Как узнать путь установки InfiniBand
Я хочу сам скомпилировать MVAPICH2, но не знаю, где найти файл psm.h , его нельзя найти в местах по умолчанию. Кто-нибудь знает, какую команду я могу использовать, чтобы найти InfiniBand?
759 просмотров
schedule 31.08.2022

Проблема с подключением Infiniband
Я получаю кластер, узлы которого связаны в толстое дерево IB. Коммутаторы Qlogic 12300. У меня проблема в том, что некоторые узлы не могут общаться друг с другом. Даже есть другие узлы, которые могут общаться с обоими затронутыми узлами. Я...
486 просмотров
schedule 22.07.2022

Кто-нибудь может объяснить мне связь между libibverbs и librxe?
Я изо всех сил пытаюсь понять связь между libibverbs и librxe и низкоуровневым драйвером ядра для HCA. В частности, у меня есть следующие сомнения: Когда пакет поступает на HCA, низкоуровневый драйвер ядра передает пакет приложению...
666 просмотров
schedule 12.09.2023

Почему отключение IRQ в Linux приводит к сбою rdma_read и rdma_write?
У меня есть две хост-машины, соединенные Mellanox infiniband HCA. Я выполняю простое приложение RDMA для выполнения операций записи и чтения RDMA с одной машины (клиента) на другую машину (сервер). Чтобы узнать, какие прерывания связаны с картами...
416 просмотров
schedule 04.04.2022

Невозможно создать пару очередей с помощью ib_create_qp
Я пишу модуль ядра RDMA (InfiniBand). До сих пор мне удавалось создавать домен защиты, очереди завершения для очередей отправки и получения. Но всякий раз, когда я пытаюсь создать пару очереди, вызывая ib_create_qp, мне не удается создать пару...
2801 просмотров

Чтобы создать несколько пар очередей в RDMA
Я новичок в программировании RDMA. Мой рабочий процесс выглядит следующим образом. struct rdma_cm_id *cm_client_id = NULL; struct rdma_cm_event *cm_event = NULL; ret = process_rdma_cm_event(cm_event_channel, RDMA_CM_EVENT_CONNECT_REQUEST,...
569 просмотров
schedule 22.10.2023

MPI с поддержкой CUDA для двух графических процессоров в одном K80
Я пытаюсь оптимизировать производительность теста MPI+CUDA под названием LAMMPS ( https://github.com/lammps/lammps ). Прямо сейчас я работаю с двумя процессами MPI и двумя графическими процессорами. Моя система имеет две розетки, и каждая розетка...
563 просмотров
schedule 04.03.2024

Почему MPI использует IpoIB вместо собственного IB?
Я понимаю, что OpenMPI использует OpenIB, а OpenIB использует Ip over Infiniband (IPoIB). Я не понимаю, почему бы не использовать родной ИБ, если он быстрее, чем IPoIB? Есть ли реализация MPI, использующая собственный IB?
1003 просмотров
schedule 26.11.2023

Как использовать сеть InfiniBand с Dask?
У меня есть кластер с высокопроизводительной сетью (InfiniBand). Однако, когда я настроил свой планировщик Dask и рабочие процессы, производительность оказалась не такой быстрой, как я ожидал. Как я могу сказать Dask использовать эту сеть? Отказ...
911 просмотров
schedule 31.05.2024