Вопросы по теме 'micro-architecture'
Как современные процессоры X86 действительно вычисляют умножение?
Я смотрел лекцию по алгоритмам, и профессор использовал умножение как пример того, как можно улучшить наивные алгоритмы ...
Это заставило меня понять, что умножение не так очевидно, хотя, когда я кодирую, я просто считаю это простой атомарной...
432 просмотров
schedule
17.05.2024
Почему jnz требует 2 цикла для завершения во внутреннем цикле
Я на IvyBridge. Я обнаружил, что производительность jnz несовместима во внутреннем и внешнем циклах.
Следующая простая программа имеет внутренний цикл фиксированного размера 16:
global _start
_start:
mov rcx, 100000000
.loop_outer:...
351 просмотров
schedule
03.04.2023
как барьеры / ограждения и семантика приобретения и выпуска реализованы микроархитектурно?
Так много вопросов и статей / книг типа https://mirrors.edge.kernel.org/pub/linux/kernel/people/paulmck/perfbook/perfbook.2018.12.08a.pdf , статьи Preshing, такие как https://preshing.com/20120710/memory-barriers-are-like-source-control-operations/...
412 просмотров
schedule
03.03.2022
Хранит ли буфер хранилища физические или виртуальные адреса на современных x86?
Современные чипы Intel и AMD имеют большие буферы хранилища для буферизации хранилищ перед фиксацией в кэше L1. По сути, эти записи содержат данные магазина и адрес магазина.
Что касается адресной части, содержат ли эти записи буфера...
114 просмотров
schedule
31.01.2023
Intel JCC Erratum - действительно ли JCC следует рассматривать отдельно?
Корпорация Intel запустила обновление микрокода, чтобы исправить ошибку, называемую «Erratum Jump Conditional Code (JCC)». Микрокод обновления привел к неэффективности некоторых операций из-за отключения кода в ICache при определенных условиях....
347 просмотров
schedule
03.08.2022
Кеши L1 обычно имеют раздельную конструкцию, но кеши L2, L3 имеют единую конструкцию, почему?
Я читал плюсы и минусы раздельного дизайна и унифицированного дизайна кешей в Этот поток.
Насколько я понимаю, основное преимущество раздельной конструкции : Раздельная конструкция позволяет нам размещать кэш инструкций рядом с блоком выборки...
499 просмотров
schedule
02.02.2022
как мне получить информацию о процессоре для моего компьютера, т.е. функциональные блоки / время задержки и т. д.
Я пытаюсь изучить сборку, и в книге, которую я читаю, я наткнулся на функциональные блоки и их задержки, показанные в таблицах в учебнике.
Мне было интересно, каковы функциональные блоки моего процессора и каковы задержки? целочисленное сложение,...
73 просмотров
schedule
28.02.2022