У меня есть программа для обработки чисел на С++. Структура:
а) ввод данных, подготовка данных
б) "большой" цикл, использует глобальные и локальные данные (много разных переменных в обоих случаях)
c) постобработка результатов и запись данных
Самая интенсивная часть — это «b», которая в основном представляет собой петлю. Мне нужно ускорить программу в кластере. 25 лезвий, по 4 ядра в каждом. Интересно, могу ли я использовать здесь OpenMP и MPI, или вы можете указать мне на учебники, а не на общие случаи, а на сложные и «большие» циклы for.
Спасибо