Вопросы по теме 'fma'

fmad=false дает хорошую производительность
Из примечаний к выпуску Nvidia: The nvcc compiler switch, --fmad (short name: -fmad), to control the contraction of floating-point multiplies and add/subtracts into floating-point multiply-add operations (FMAD, FFMA, or DFMA) has been...
2468 просмотров
schedule 20.04.2023

Использование AVX с GCC: __builtin_ia32_addpd256 не объявлен
Если я #include <immintrin.h> получаю эту ошибку: ошибка: '__builtin_ia32_addpd256' не был объявлен в этой области Я определил макросы __AVX__ и __FMA__ , чтобы сделать AVX доступным, но, видимо, этого недостаточно. Нет ошибки,...
2564 просмотров
schedule 21.12.2022

Можно ли для работы XMM/YMM FP на Intel Haswell использовать FMA вместо ADD?
Этот вопрос предназначен для упакованных плавающих операций с одиночной записью с регистрами XMM/YMM в Haswell. Итак, согласно потрясающей , потрясающей таблице составленный Агнером Фогом, я знаю, что MUL может выполняться как на портах p0,...
278 просмотров
schedule 23.06.2023

Как избежать ошибки AVX2, когда размерность матрицы не кратна 4?
Я сделал программу умножения матрицы на вектор, используя AVX2, FMA на C. Я скомпилировал, используя GCC ver7 с -mfma, -mavx. Однако я получил сообщение об ошибке "неверная контрольная сумма для освобожденного объекта - объект, вероятно, был...
96 просмотров
schedule 24.03.2024