Вопросы по теме 'perf'

мониторинг производительности для подмножества выполнения процесса
Я собираюсь собрать статистику приложения Linux для небольшого подмножества его выполнения программы. Это подмножество можно определить как первые n инструкций или первые n циклов. Для определенного подмножества нас интересуют такие статистические...
81 просмотров

Доступ к некэшируемой области с помощью mmap и /proc/mtrr
Я играю с mmap и /proc/mtrr, пытаясь провести углубленный анализ физической памяти. Вот основная идея того, что я пытаюсь сделать, и краткое изложение того, что я сделал до сих пор. У меня версия ядра Ubuntu 3.5.0-54-универсальная. В основном я...
457 просмотров
schedule 15.07.2022

systemtap: как определить события зонда и аргументы
Пытаюсь выяснить причину этих записей на флешку. deathstar> while true > do > dmesg|grep sdc|grep WRITE > sleep 3 > done [17967.580179] kworker/u4:2(6863): WRITE block 20971648 on sdc1 (8 sectors) [17967.580206] kworker/u4:2(6863):...
496 просмотров
schedule 23.05.2023

почему перфоманс запись и аннотация не работают?
Я в тупике, я прочитал учебник по производительности и пытаюсь провести простой тест, помимо «статистики производительности», который работает. Однако первичная запись либо не работает, либо первичная аннотация не показывает записанных образцов....
6543 просмотров
schedule 14.04.2024

perf_event_open всегда возвращает -1
Я запускаю следующую программу, которая вызывает системный вызов perf_event_open: Linux sama-desktop 3.18.0-20-rpi2 # 21-Ubuntu SMP PREEMPT Sun 5 апреля 01:56:02 UTC 2015 armv7l armv7l armv7l GNU / Linux Программа: #define _GNU_SOURCE 1...
2447 просмотров
schedule 10.11.2023

Почему Perf и Papi дают разные значения для ссылок и промахов кэша L3?
Я работаю над проектом, в котором мы должны реализовать алгоритм, который теоретически доказал свою совместимость с кешем. Проще говоря, если N - это вход, а B - это количество элементов, которые передаются между кешем и ОЗУ каждый раз, когда у...
2758 просмотров
schedule 16.07.2023

Использование perf для отслеживания доступа к памяти каждого процессора
Я пытаюсь использовать linux perf tool для выборки обращений к памяти в моей программе. В частности, я использую perf для отслеживания доступа для чтения / записи каждого процессора в NUMA. Теперь я могу контролировать каждый доступ ЦП для...
2013 просмотров
schedule 21.09.2022

Что такое std::__detail::_Map_base в отчете о производительности?
Значительная часть времени выполнения моей программы посвящена std::__detail::_Map_base, и я понятия не имею, к чему это относится. Я немного поискал в Интернете, и, похоже, это какая-то структура, но я не вижу, как она занимает время, не...
335 просмотров
schedule 11.01.2024

perf-events не показывает StackTraces в Debian 8 Jessie
Я пытаюсь профилировать простую программу C с perf-событиями на debian 8 jessie. Я вижу символы, но не могу получить трассировку стека. Та же процедура генерирует хорошие трассировки стека в Ubuntu 16.04. Я установил linux-image-amd64-dbg и...
78 просмотров

Можно ли поднять частоту дискретизации perf stat?
Я использую perf для профилирования, но количество отслеживаемых событий PMU превышает количество аппаратных счетчиков, поэтому срабатывает стратегия циклического мультиплексирования. Однако некоторые из моих тестовых примеров могут выполняться...
1251 просмотров
schedule 24.07.2022

perf отчет о системном вызове
У меня есть следующий вывод для отчета о производительности (о malloc) для процесса A, B: записано: perf record -e cycles:u Процесс А: 0.00% 1833448 Test-Recv libc-2.17.so [.] malloc 0.00% 1833385...
259 просмотров
schedule 09.11.2023

снижение производительности при включенном PTI в Linux-4.4.0
Я выполняю тест Java на Ubuntu 16.04 и обнаружил разницу в производительности при включении и выключении PTI. Моя хост-система использует ЦП Ivybridge (2 ядра, 4 HT) 1,6 ГГц с памятью 16 ГБ. Я попытался использовать perf, чтобы проанализировать,...
165 просмотров
schedule 09.10.2023

linux perf record: разница между параметрами count (-c) и Frequency (-F)
Я пытаюсь понять, что на самом деле делают параметры -c и -F команды perf record , но не могу объяснить, что вижу. Я запускаю эти команды: perf record -a -F <frequency> sleep 1 а также perf record -a -c <count> sleep 1...
1846 просмотров
schedule 23.04.2024

Измерение энергопотребления производительности: как это работает?
Я заметил, что perf list теперь имеет возможность измерять энергопотребление. Вы можете использовать его следующим образом: $ perf stat -e power/energy-cores/ ./a.out Performance counter stats for 'system wide': 8.55 Joules...
1178 просмотров
schedule 08.10.2023

Что означают события Perf: dTLB-загрузки и dTLB-store?
Пытаюсь понять смысл событий perf: dTLB-load и dTLB-store?
1039 просмотров
schedule 13.03.2023

Лучший счетчик событий для измерения времени настенных часов с помощью инструментов perf
Простой, но сложный вопрос: Какой счетчик использовать, чтобы получить инструменты для измерения времени на настенных часах? В качестве базовой линии первое, что я думаю при профилировании кода, мне нужно измерить, - это просто время настенных...
167 просмотров

FLOPS в Python с использованием процессора Haswell (процессор Intel Core (Haswell, без TSX))
Мне нужно измерить количество операций в секунду для анализа написанной мной программы на Python. Судя по тому, что я нашел в Интернете, кажется, что есть два основных варианта: Включение счетчиков в программу (что, как я понимаю, может иметь...
215 просмотров
schedule 10.01.2023

Я не вижу параметр power/energy-cores perf для измерения энергопотребления.
В моей системе используется процессор Intel(R) Xeon(R) Gold и Centos, версия ядра Linux 5.5.2. вывод версии perf: 5.5.2-1.el7.elrepo.x86_64 Я не буду получать энергопотребление каждого ядра. поэтому я попробовал это. >>> sudo...
386 просмотров
schedule 23.04.2022

Чтение аппаратных счетчиков из списка perf_event_uncore с помощью PAPI
Я пытаюсь прочитать один из счетчиков оборудования с помощью PAPI. Когда я пытаюсь прочитать события из списка perf_event , все работает нормально. Однако теперь мне нужно прочитать один из счетчиков из списка perf_event_uncore , который...
189 просмотров
schedule 01.11.2022

Когда фильтровать детали функций в linux perf?
При использовании linux perf для записи трассировки с использованием события intel_pt можно отфильтровать трассировку определенной функции (func1) . perf record -e intel_pt/branch_type=call/u --filter ' filter func1 @ a.out ' -- ./a.out...
382 просмотров
schedule 02.05.2023