Вопросы по теме 'perf'
мониторинг производительности для подмножества выполнения процесса
Я собираюсь собрать статистику приложения Linux для небольшого подмножества его выполнения программы. Это подмножество можно определить как первые n инструкций или первые n циклов.
Для определенного подмножества нас интересуют такие статистические...
81 просмотров
schedule
09.01.2024
Доступ к некэшируемой области с помощью mmap и /proc/mtrr
Я играю с mmap и /proc/mtrr, пытаясь провести углубленный анализ физической памяти. Вот основная идея того, что я пытаюсь сделать, и краткое изложение того, что я сделал до сих пор. У меня версия ядра Ubuntu 3.5.0-54-универсальная.
В основном я...
457 просмотров
schedule
15.07.2022
systemtap: как определить события зонда и аргументы
Пытаюсь выяснить причину этих записей на флешку.
deathstar> while true
> do
> dmesg|grep sdc|grep WRITE
> sleep 3
> done
[17967.580179] kworker/u4:2(6863): WRITE block 20971648 on sdc1 (8 sectors)
[17967.580206] kworker/u4:2(6863):...
496 просмотров
schedule
23.05.2023
почему перфоманс запись и аннотация не работают?
Я в тупике, я прочитал учебник по производительности и пытаюсь провести простой тест, помимо «статистики производительности», который работает. Однако первичная запись либо не работает, либо первичная аннотация не показывает записанных образцов....
6543 просмотров
schedule
14.04.2024
perf_event_open всегда возвращает -1
Я запускаю следующую программу, которая вызывает системный вызов perf_event_open: Linux sama-desktop 3.18.0-20-rpi2 # 21-Ubuntu SMP PREEMPT Sun 5 апреля 01:56:02 UTC 2015 armv7l armv7l armv7l GNU / Linux
Программа:
#define _GNU_SOURCE 1...
2447 просмотров
schedule
10.11.2023
Почему Perf и Papi дают разные значения для ссылок и промахов кэша L3?
Я работаю над проектом, в котором мы должны реализовать алгоритм, который теоретически доказал свою совместимость с кешем. Проще говоря, если N - это вход, а B - это количество элементов, которые передаются между кешем и ОЗУ каждый раз, когда у...
2758 просмотров
schedule
16.07.2023
Использование perf для отслеживания доступа к памяти каждого процессора
Я пытаюсь использовать linux perf tool для выборки обращений к памяти в моей программе. В частности, я использую perf для отслеживания доступа для чтения / записи каждого процессора в NUMA.
Теперь я могу контролировать каждый доступ ЦП для...
2013 просмотров
schedule
21.09.2022
Что такое std::__detail::_Map_base в отчете о производительности?
Значительная часть времени выполнения моей программы посвящена std::__detail::_Map_base, и я понятия не имею, к чему это относится.
Я немного поискал в Интернете, и, похоже, это какая-то структура, но я не вижу, как она занимает время, не...
335 просмотров
schedule
11.01.2024
perf-events не показывает StackTraces в Debian 8 Jessie
Я пытаюсь профилировать простую программу C с perf-событиями на debian 8 jessie. Я вижу символы, но не могу получить трассировку стека. Та же процедура генерирует хорошие трассировки стека в Ubuntu 16.04.
Я установил linux-image-amd64-dbg и...
78 просмотров
schedule
28.02.2023
Можно ли поднять частоту дискретизации perf stat?
Я использую perf для профилирования, но количество отслеживаемых событий PMU превышает количество аппаратных счетчиков, поэтому срабатывает стратегия циклического мультиплексирования. Однако некоторые из моих тестовых примеров могут выполняться...
1251 просмотров
schedule
24.07.2022
perf отчет о системном вызове
У меня есть следующий вывод для отчета о производительности (о malloc) для процесса A, B:
записано: perf record -e cycles:u
Процесс А:
0.00% 1833448 Test-Recv libc-2.17.so [.] malloc
0.00% 1833385...
259 просмотров
schedule
09.11.2023
снижение производительности при включенном PTI в Linux-4.4.0
Я выполняю тест Java на Ubuntu 16.04 и обнаружил разницу в производительности при включении и выключении PTI. Моя хост-система использует ЦП Ivybridge (2 ядра, 4 HT) 1,6 ГГц с памятью 16 ГБ.
Я попытался использовать perf, чтобы проанализировать,...
165 просмотров
schedule
09.10.2023
linux perf record: разница между параметрами count (-c) и Frequency (-F)
Я пытаюсь понять, что на самом деле делают параметры -c и -F команды perf record , но не могу объяснить, что вижу. Я запускаю эти команды:
perf record -a -F <frequency> sleep 1
а также
perf record -a -c <count> sleep 1...
1846 просмотров
schedule
23.04.2024
Измерение энергопотребления производительности: как это работает?
Я заметил, что perf list теперь имеет возможность измерять энергопотребление. Вы можете использовать его следующим образом:
$ perf stat -e power/energy-cores/ ./a.out
Performance counter stats for 'system wide':
8.55 Joules...
1178 просмотров
schedule
08.10.2023
Что означают события Perf: dTLB-загрузки и dTLB-store?
Пытаюсь понять смысл событий perf: dTLB-load и dTLB-store?
1039 просмотров
schedule
13.03.2023
Лучший счетчик событий для измерения времени настенных часов с помощью инструментов perf
Простой, но сложный вопрос:
Какой счетчик использовать, чтобы получить инструменты для измерения времени на настенных часах?
В качестве базовой линии первое, что я думаю при профилировании кода, мне нужно измерить, - это просто время настенных...
167 просмотров
schedule
26.05.2024
FLOPS в Python с использованием процессора Haswell (процессор Intel Core (Haswell, без TSX))
Мне нужно измерить количество операций в секунду для анализа написанной мной программы на Python.
Судя по тому, что я нашел в Интернете, кажется, что есть два основных варианта:
Включение счетчиков в программу (что, как я понимаю, может иметь...
215 просмотров
schedule
10.01.2023
Я не вижу параметр power/energy-cores perf для измерения энергопотребления.
В моей системе используется процессор Intel(R) Xeon(R) Gold и Centos, версия ядра Linux 5.5.2.
вывод версии perf: 5.5.2-1.el7.elrepo.x86_64
Я не буду получать энергопотребление каждого ядра. поэтому я попробовал это.
>>> sudo...
386 просмотров
schedule
23.04.2022
Чтение аппаратных счетчиков из списка perf_event_uncore с помощью PAPI
Я пытаюсь прочитать один из счетчиков оборудования с помощью PAPI. Когда я пытаюсь прочитать события из списка perf_event , все работает нормально. Однако теперь мне нужно прочитать один из счетчиков из списка perf_event_uncore , который...
189 просмотров
schedule
01.11.2022
Когда фильтровать детали функций в linux perf?
При использовании linux perf для записи трассировки с использованием события intel_pt можно отфильтровать трассировку определенной функции (func1) .
perf record -e intel_pt/branch_type=call/u --filter ' filter func1 @ a.out ' -- ./a.out...
382 просмотров
schedule
02.05.2023