Вопросы по теме 'fpu'

Обработка исключения fpu в windows
Я хотел бы обработать исключение fpu в окнах, например: #include <math.h> #include <fenv.h> #include <stdio.h> int main() { double b = 0; int raised; feclearexcept (FE_ALL_EXCEPT); b /= 0; raised =...
1953 просмотров
schedule 13.07.2023

Почему вместо этого FLD1 загружает NaN?
У меня есть однострочная функция C, которая просто return value * pow(1.+rate, -delay); - она ​​дисконтирует будущую стоимость до текущей стоимости. Самое интересное в разборке 0x080555b9 : neg %eax 0x080555bb : push %eax...
2166 просмотров
schedule 10.10.2023

Как оптимизировать процедуру FPU
У меня есть с-рутина int n_mandelbrot(double c_im, double c_re, int N_ITER) { static double re, im, re2, im2; static int n; im2=im=0; re2=re=0; for(n=0; n<N_ITER; n++) { im = (re+re)*im...
196 просмотров
schedule 30.10.2022

Балансировка SSE и FPU
Итак, у меня есть несколько тяжеловесных алгоритмов, которые я бы предпочел запускать на VPU, но, поскольку происходит так много всего, VPU имеет тенденцию насыщаться. Можно ли как-то сделать что-то вроде «Использовать VPU, если VPU перегружен,...
87 просмотров
schedule 06.12.2023

включить поддержку fpu для aarch64 (armv8-a) в gcc версии 5.0.1
Я измеряю производительность Cortex-a57 в GFLOPS с помощью тестов HPLinpack, и она едва достигает 1 FP/цикл (учитывая ~2,4 GFLOPS при 2,4 ГГц). Поскольку старый компилятор (gcc 4.9.1) жаловался на несколько версий параметра -mfpu=, я попытался...
3010 просмотров
schedule 16.11.2022

Загрузка значения регистра в стек FPU
В настоящее время я работаю над программой сборки, которая использует регистры как ЦП, так и FPU. Мой вопрос касается того, как можно загрузить значение регистра в стек FPU (а именно ecx). mov ecx, 10d ; Load 10 into ECX fldpi...
1233 просмотров
schedule 05.06.2023

Сохраняйте побитовые вычисления с плавающей запятой на AArch64 с O2
Я сравниваю выходные данные библиотеки обработки сигналов с использованием математики с плавающей запятой, которая была создана для AArch64 (ARMv8) с использованием, например. gcc 4.9. Различия возникают в зависимости от уровня оптимизации....
452 просмотров
schedule 01.04.2024

Ленивое объединение FPU в Cortex-M4F
Я пишу код многопоточности для Cortex M4F. Все работает, и теперь я пытаюсь сделать переключение контекста FPU более эффективным с помощью ленивого стекирования. Я прочитал AN298 и I. реализовал альтернативный подход, основанный на отключении...
2168 просмотров
schedule 16.06.2022

Как печатать числа с плавающей запятой из сборки?
Я пытаюсь напечатать число с плавающей запятой, вызвав printf , но кажется, что всегда просто печатается значение pi (3,1415), хотя предполагается, что результат, который должен быть площадью круга для перемещения в переменную pi после...
63 просмотров
schedule 06.11.2022