Задержка и пропускная способность инструкций AVX2

Меня интересуют свойства производительности следующих встроенных функций/инструкций:

  • _mm256_andnot_si256 / vpandn
  • _mm256_and_si256 / vpand
  • _mm256_cmpgt_epi32 / vpcmpgtd
  • и некоторые другие.

Но, к сожалению, Руководство по внутренним функциям Intel не содержит таблиц с данными о задержке и пропускной способности для этих встроенных функций. /инструкции. Где я могу найти эту информацию?


person user3234005    schedule 05.04.2019    source источник


Ответы (1)


Три источника показателей задержки и пропускной способности:

InstlatX64 перечисляет множество инструкций в различных формах (операнды памяти и/или регистра, разная ширина операнда и т. д.), но не содержит информации о количестве микроопераций для каждого порта выполнения. Для оптимизации производительности интерес представляют не только цифры задержки и пропускной способности, но и количество микроопераций на порт выполнения. Эта информация предоставлена ​​таблицами инструкций Агнера Фога и сайтом uops.info.

person wim    schedule 05.04.2019
comment
Спасибо! Таблица uops.info великолепна! Единственное, чего мне не хватает, так это данных по процессорам AMD. - person user3234005; 05.04.2019
comment
uops.info еще совсем новый. Согласно их статье, они работают над алгоритмами для процессоров AMD x86, чтобы получить задержку, пропускную способность, и информация о порте μops. - person wim; 05.04.2019