Вопросы по теме 'fma'
fmad=false дает хорошую производительность
Из примечаний к выпуску Nvidia:
The nvcc compiler switch, --fmad (short name: -fmad), to control the contraction of
floating-point multiplies and add/subtracts into floating-point multiply-add
operations (FMAD, FFMA, or DFMA) has been...
2468 просмотров
schedule
20.04.2023
Использование AVX с GCC: __builtin_ia32_addpd256 не объявлен
Если я #include <immintrin.h> получаю эту ошибку:
ошибка: '__builtin_ia32_addpd256' не был объявлен в этой области
Я определил макросы __AVX__ и __FMA__ , чтобы сделать AVX доступным, но, видимо, этого недостаточно. Нет ошибки,...
2564 просмотров
schedule
21.12.2022
Можно ли для работы XMM/YMM FP на Intel Haswell использовать FMA вместо ADD?
Этот вопрос предназначен для упакованных плавающих операций с одиночной записью с регистрами XMM/YMM в Haswell.
Итак, согласно потрясающей , потрясающей таблице составленный Агнером Фогом, я знаю, что MUL может выполняться как на портах p0,...
278 просмотров
schedule
23.06.2023
Как избежать ошибки AVX2, когда размерность матрицы не кратна 4?
Я сделал программу умножения матрицы на вектор, используя AVX2, FMA на C. Я скомпилировал, используя GCC ver7 с -mfma, -mavx.
Однако я получил сообщение об ошибке "неверная контрольная сумма для освобожденного объекта - объект, вероятно, был...
96 просмотров
schedule
24.03.2024