Вопросы по теме 'fpu'
Обработка исключения fpu в windows
Я хотел бы обработать исключение fpu в окнах, например:
#include <math.h>
#include <fenv.h>
#include <stdio.h>
int main()
{
double b = 0;
int raised;
feclearexcept (FE_ALL_EXCEPT);
b /= 0;
raised =...
1953 просмотров
schedule
13.07.2023
Почему вместо этого FLD1 загружает NaN?
У меня есть однострочная функция C, которая просто return value * pow(1.+rate, -delay); - она дисконтирует будущую стоимость до текущей стоимости. Самое интересное в разборке
0x080555b9 : neg %eax
0x080555bb : push %eax...
2166 просмотров
schedule
10.10.2023
Как оптимизировать процедуру FPU
У меня есть с-рутина
int n_mandelbrot(double c_im, double c_re, int N_ITER)
{
static double re, im, re2, im2;
static int n;
im2=im=0;
re2=re=0;
for(n=0; n<N_ITER; n++)
{
im = (re+re)*im...
196 просмотров
schedule
30.10.2022
Балансировка SSE и FPU
Итак, у меня есть несколько тяжеловесных алгоритмов, которые я бы предпочел запускать на VPU, но, поскольку происходит так много всего, VPU имеет тенденцию насыщаться. Можно ли как-то сделать что-то вроде «Использовать VPU, если VPU перегружен,...
87 просмотров
schedule
06.12.2023
включить поддержку fpu для aarch64 (armv8-a) в gcc версии 5.0.1
Я измеряю производительность Cortex-a57 в GFLOPS с помощью тестов HPLinpack, и она едва достигает 1 FP/цикл (учитывая ~2,4 GFLOPS при 2,4 ГГц). Поскольку старый компилятор (gcc 4.9.1) жаловался на несколько версий параметра -mfpu=, я попытался...
3010 просмотров
schedule
16.11.2022
Загрузка значения регистра в стек FPU
В настоящее время я работаю над программой сборки, которая использует регистры как ЦП, так и FPU. Мой вопрос касается того, как можно загрузить значение регистра в стек FPU (а именно ecx).
mov ecx, 10d ; Load 10 into ECX
fldpi...
1233 просмотров
schedule
05.06.2023
Сохраняйте побитовые вычисления с плавающей запятой на AArch64 с O2
Я сравниваю выходные данные библиотеки обработки сигналов с использованием математики с плавающей запятой, которая была создана для AArch64 (ARMv8) с использованием, например. gcc 4.9.
Различия возникают в зависимости от уровня оптимизации....
452 просмотров
schedule
01.04.2024
Ленивое объединение FPU в Cortex-M4F
Я пишу код многопоточности для Cortex M4F. Все работает, и теперь я пытаюсь сделать переключение контекста FPU более эффективным с помощью ленивого стекирования.
Я прочитал AN298 и I. реализовал альтернативный подход, основанный на отключении...
2168 просмотров
schedule
16.06.2022
Как печатать числа с плавающей запятой из сборки?
Я пытаюсь напечатать число с плавающей запятой, вызвав printf , но кажется, что всегда просто печатается значение pi (3,1415), хотя предполагается, что результат, который должен быть площадью круга для перемещения в переменную pi после...
63 просмотров
schedule
06.11.2022