Быстрый и грязный способ профилировать ваш код

Какой метод вы используете, когда хотите получить данные о производительности по конкретным путям кода?

Motti 14.09.2008 источник

comment

Вам не нужны классы, инструменты или что-то еще. Проверьте это - Mike Dunlavey 05.11.2008

Ответы (7)

arrow_upward
11
arrow_downward

У этого метода есть несколько ограничений, но я все же считаю его очень полезным. Я перечислю ограничения (которые я знаю) заранее и позволю тем, кто хочет использовать это, делать это на свой страх и риск.

В исходной версии я опубликовал завышенное время, потраченное на рекурсивные вызовы (как указано в комментариях к ответу).
Он не потокобезопасен, он не был потокобезопасен, пока я не добавил код для игнорирования рекурсии, и теперь он еще менее потокобезопасен.
Хотя это очень эффективно, если его вызывать много раз (миллионы), это окажет измеримое влияние на результат, так что области, которые вы измеряете, займут больше времени, чем те, которые вы не делаете.

Я использую этот класс, когда возникшая проблема не оправдывает профилирование всего моего кода или когда я получаю от профилировщика некоторые данные, которые хочу проверить. По сути, он суммирует время, проведенное вами в определенном блоке, и в конце программы выводит его в поток отладки (можно просмотреть с помощью DbgView), включая количество выполнений кода (и, конечно, среднее время, затраченное на это)).

#pragma once
#include <tchar.h>
#include <windows.h>
#include <sstream>
#include <boost/noncopyable.hpp>

namespace scope_timer {
    class time_collector : boost::noncopyable {
        __int64 total;
        LARGE_INTEGER start;
        size_t times;
        const TCHAR* name;

        double cpu_frequency()
        { // cache the CPU frequency, which doesn't change.
            static double ret = 0; // store as double so devision later on is floating point and not truncating
            if (ret == 0) {
                LARGE_INTEGER freq;
                QueryPerformanceFrequency(&freq);
                ret = static_cast<double>(freq.QuadPart);
            }
            return ret;
        }
        bool in_use;

    public:
        time_collector(const TCHAR* n)
            : times(0)
            , name(n)
            , total(0)
            , start(LARGE_INTEGER())
            , in_use(false)
        {
        }

        ~time_collector()
        {
            std::basic_ostringstream<TCHAR> msg;
            msg << _T("scope_timer> ") <<  name << _T(" called: ");

            double seconds = total / cpu_frequency();
            double average = seconds / times;

            msg << times << _T(" times total time: ") << seconds << _T(" seconds  ")
                << _T(" (avg ") << average <<_T(")\n");
            OutputDebugString(msg.str().c_str());
        }

        void add_time(__int64 ticks)
        {
            total += ticks;
            ++times;
            in_use = false;
        }

        bool aquire()
        {
            if (in_use)
                return false;
            in_use = true;
            return true;
        }
    };

    class one_time : boost::noncopyable {
        LARGE_INTEGER start;
        time_collector* collector;
    public:
        one_time(time_collector& tc)
        {
            if (tc.aquire()) {
                collector = &tc;
                QueryPerformanceCounter(&start);
            }
            else
                collector = 0;
        }

        ~one_time()
        {
            if (collector) {
                LARGE_INTEGER end;
                QueryPerformanceCounter(&end);
                collector->add_time(end.QuadPart - start.QuadPart);
            }
        }
    };
}

// Usage TIME_THIS_SCOPE(XX); where XX is a C variable name (can begin with a number)
#define TIME_THIS_SCOPE(name) \
    static scope_timer::time_collector st_time_collector_##name(_T(#name)); \
    scope_timer::one_time st_one_time_##name(st_time_collector_##name)

Motti 14.09.2008

comment

Вот метод с необычным отношением эффективности к неверию: stackoverflow.com/questions/266373/ - Mike Dunlavey; 23.11.2008

comment

похоже, что может быть div на ноль, если add_time () не вызывается - Andrey; 18.05.2009

comment

Единственный способ, которым add_time не вызывается, - это если one_time никогда не уничтожается, то есть one_time никогда не создается. И поскольку one_time создается тогда и только тогда, когда создается time_collector, то не может быть случая, в котором time_collector будет уничтожен до того, как экземпляр one_time будет разрушен (по порядку постройки). - Motti; 19.05.2009

comment

верно для one_time; но не для time_collector - Andrey; 26.05.2009

comment

Предполагается, что time_collector создается только с one_time для его подачи (как это делается с помощью макросов). - Motti; 26.05.2009

comment

@Motti: для инструментария рекурсивного кода вам нужно измерять только самые внешние вызовы. - Mike Dunlavey; 10.07.2009

comment

@Mike, это правда, и когда будет доступен спецификатор хранилища thread_local C ++ 0x, я обновлю код, чтобы учесть это. - Motti; 11.07.2009

comment

@Motti: Некоторые люди думают, что рекурсия портит измерения. Но общее время активности подпрограммы - это то, что вы бы сэкономили, если бы на это не требовалось время. Чтобы увидеть, как долго он активен, вам нужно только измерить его внешние вызовы. Лично я предпочитаю применять это мышление к операторам, а не к функциям, потому что операторы - это то, что вы действительно можете исправить. - Mike Dunlavey; 14.07.2009

comment

К вашему сведению: мне пришлось удалить макросы tchar, чтобы это работало с Qt, но оно работает. - dwj; 19.08.2009

comment

Разве это не Windows? Если да, то, может быть, об этом стоит упомянуть в ответе? - Peter Mortensen; 24.08.2012

comment

@PeterMortensen реализация зависит от Windows, но ее легко преобразовать в другие ОС. - Motti; 26.08.2012

arrow_upward
2
arrow_downward

Я делаю свои профили, создавая два класса: cProfile и cProfileManager.

cProfileManager будет содержать все данные, полученные в результате cProfile.

cProfile со следующими требованиями:

cProfile имеет конструктор, который инициализирует текущее время.
cProfile имеет деконструктор, который отправляет общее время существования класса в cProfileManager

Чтобы использовать эти классы профиля, я сначала создаю экземпляр cProfileManager. Затем я помещаю блок кода, который хочу профилировать, в фигурные скобки. Внутри фигурных скобок я создаю экземпляр cProfile. Когда блок кода закончится, cProfile отправит время, которое потребовалось для завершения блока кода, на cProfileManager.

Пример кода Вот пример кода (упрощенный):

class cProfile
{
    cProfile()
    {
        TimeStart = GetTime();
    };

    ~cProfile()
    {
        ProfileManager->AddProfile (GetTime() - TimeStart);
    }

    float TimeStart;
}

Чтобы использовать cProfile, я бы сделал что-то вроде этого:

int main()
{
    printf("Start test");
    {
        cProfile Profile;
        Calculate();
    }
    ProfileManager->OutputData();
}

или это:

void foobar()
{
    cProfile ProfileFoobar;

    foo();
    {
        cProfile ProfileBarCheck;
        while (bar())
        {
            cProfile ProfileSpam;
            spam();
        }
    }
}

Техническое примечание

Этот код на самом деле представляет собой злоупотребление способами работы области видимости, конструкторов и деконструкторов в C ++. cProfile существует только внутри области блока (блок кода, который мы хотим протестировать). Как только программа покидает область видимости блока, cProfile записывает результат.

Дополнительные улучшения

Вы можете добавить строковый параметр в конструктор, чтобы сделать что-то вроде этого: cProfile Profile («Профиль для сложных вычислений»);
Вы можете использовать макрос, чтобы код выглядел чище (будьте осторожны, чтобы не злоупотреблять этим. В отличие от других наших злоупотреблений в отношении языка, использование макросов может быть опасным).

Пример:

#define START_PROFILE Профиль cProfile (); {#define END_PROFILE}
cProfileManager может проверить, сколько раз вызывается блок кода. Но вам понадобится идентификатор для блока кода. Первое улучшение может помочь идентифицировать блок. Это может быть полезно в тех случаях, когда код, который вы хотите профилировать, находится внутри цикла (например, во втором примере). Вы также можете добавить среднее, самое быстрое и максимальное время выполнения блока кода.
Не забудьте добавить проверку, чтобы пропустить профилирование, если вы находитесь в режиме отладки.

MrValdez 14.09.2008

comment

Ваш макрос START_PROFILE должен начинаться с открытой фигурной скобки и не иметь скобок (в противном случае это объявление функции, а не переменная {cProfile Profile; также ctor и dtor в cProfile должны быть общедоступными. - Motti; 15.09.2008

comment

Повлияет ли оптимизация компилятора на измерения? Другими словами, есть ли гарантия, что деструктор вызывается только после выхода из области видимости? - mhernandez; 05.11.2018

arrow_upward
2
arrow_downward

Обратите внимание: все нижесказанное написано специально для Windows.

У меня также есть класс таймера, который я написал для быстрого и грязного профилирования, который использует QueryPerformanceCounter () для получения высокоточных таймингов, но с небольшой разницей. Мой класс таймера не сбрасывает истекшее время, когда объект Timer выпадает из области видимости. Вместо этого он накапливает истекшее время в коллекции. Я добавил статическую функцию-член Dump (), которая создает таблицу прошедшего времени, отсортированную по категории времени (указанной в конструкторе Timer в виде строки) вместе с некоторым статистическим анализом, таким как среднее прошедшее время, стандартное отклонение, максимальное и минимальное значение. Я также добавил статическую функцию-член Clear (), которая очищает коллекцию и позволяет вам начать заново.

Как использовать класс Timer (псудокод):

int CInsertBuffer::Read(char* pBuf)
{
       // TIMER NOTES: Avg Execution Time = ~1 ms
       Timer timer("BufferRead");
       :      :
       return -1;
}

Пример вывода:

Timer Precision = 418.0095 ps

=== Item               Trials    Ttl Time  Avg Time  Mean Time StdDev    ===
    AddTrade           500       7 ms      14 us     12 us     24 us
    BufferRead         511       1:19.25   0.16 s    621 ns    2.48 s
    BufferWrite        516       511 us    991 ns    482 ns    11 us
    ImportPos Loop     1002      18.62 s   19 ms     77 us     0.51 s
    ImportPosition     2         18.75 s   9.38 s    16.17 s   13.59 s
    Insert             515       4.26 s    8 ms      5 ms      27 ms
    recv               101       18.54 s   0.18 s    2603 ns   1.63 s

файл Timer.inl:

#include <map>
#include "x:\utils\stlext\stringext.h"
#include <iterator>
#include <set>
#include <vector>
#include <numeric>
#include "x:\utils\stlext\algorithmext.h"
#include <math.h>

    class Timer
    {
    public:
        Timer(const char* name)
        {
            label = std::safe_string(name);
            QueryPerformanceCounter(&startTime);
        }

        virtual ~Timer()
        {
            QueryPerformanceCounter(&stopTime);
            __int64 clocks = stopTime.QuadPart-startTime.QuadPart;
            double elapsed = (double)clocks/(double)TimerFreq();
            TimeMap().insert(std::make_pair(label,elapsed));
        };

        static std::string Dump(bool ClipboardAlso=true)
        {
            static const std::string loc = "Timer::Dump";

            if( TimeMap().empty() )
            {
                return "No trials\r\n";
            }

            std::string ret = std::formatstr("\r\n\r\nTimer Precision = %s\r\n\r\n", format_elapsed(1.0/(double)TimerFreq()).c_str());

            // get a list of keys
            typedef std::set<std::string> keyset;
            keyset keys;
            std::transform(TimeMap().begin(), TimeMap().end(), std::inserter(keys, keys.begin()), extract_key());

            size_t maxrows = 0;

            typedef std::vector<std::string> strings;
            strings lines;

            static const size_t tabWidth = 9;

            std::string head = std::formatstr("=== %-*.*s %-*.*s %-*.*s %-*.*s %-*.*s %-*.*s ===", tabWidth*2, tabWidth*2, "Item", tabWidth, tabWidth, "Trials", tabWidth, tabWidth, "Ttl Time", tabWidth, tabWidth, "Avg Time", tabWidth, tabWidth, "Mean Time", tabWidth, tabWidth, "StdDev");
            ret += std::formatstr("\r\n%s\r\n", head.c_str());
            if( ClipboardAlso ) 
                lines.push_back("Item\tTrials\tTtl Time\tAvg Time\tMean Time\tStdDev\r\n");
            // dump the values for each key
            {for( keyset::iterator key = keys.begin(); keys.end() != key; ++key )
            {
                time_type ttl = 0;
                ttl = std::accumulate(TimeMap().begin(), TimeMap().end(), ttl, accum_key(*key));
                size_t num = std::count_if( TimeMap().begin(), TimeMap().end(), match_key(*key));
                if( num > maxrows ) 
                    maxrows = num;
                time_type avg = ttl / num;

                // compute mean
                std::vector<time_type> sortedTimes;
                std::transform_if(TimeMap().begin(), TimeMap().end(), std::inserter(sortedTimes, sortedTimes.begin()), extract_val(), match_key(*key));
                std::sort(sortedTimes.begin(), sortedTimes.end());
                size_t mid = (size_t)floor((double)num/2.0);
                double mean = ( num > 1 && (num % 2) != 0 ) ? (sortedTimes[mid]+sortedTimes[mid+1])/2.0 : sortedTimes[mid];
                // compute variance
                double sum = 0.0;
                if( num > 1 )
                {
                    for( std::vector<time_type>::iterator timeIt = sortedTimes.begin(); sortedTimes.end() != timeIt; ++timeIt )
                        sum += pow(*timeIt-mean,2.0);
                }
                // compute std dev
                double stddev = num > 1 ? sqrt(sum/((double)num-1.0)) : 0.0;

                ret += std::formatstr("    %-*.*s %-*.*s %-*.*s %-*.*s %-*.*s %-*.*s\r\n", tabWidth*2, tabWidth*2, key->c_str(), tabWidth, tabWidth, std::formatstr("%d",num).c_str(), tabWidth, tabWidth, format_elapsed(ttl).c_str(), tabWidth, tabWidth, format_elapsed(avg).c_str(), tabWidth, tabWidth, format_elapsed(mean).c_str(), tabWidth, tabWidth, format_elapsed(stddev).c_str()); 
                if( ClipboardAlso )
                    lines.push_back(std::formatstr("%s\t%s\t%s\t%s\t%s\t%s\r\n", key->c_str(), std::formatstr("%d",num).c_str(), format_elapsed(ttl).c_str(), format_elapsed(avg).c_str(), format_elapsed(mean).c_str(), format_elapsed(stddev).c_str())); 

            }
            }
            ret += std::formatstr("%s\r\n", std::string(head.length(),'=').c_str());

            if( ClipboardAlso )
            {
                // dump header row of data block
                lines.push_back("");
                {
                    std::string s;
                    for( keyset::iterator key = keys.begin(); key != keys.end(); ++key )
                    {
                        if( key != keys.begin() )
                            s.append("\t");
                        s.append(*key);
                    }
                    s.append("\r\n");
                    lines.push_back(s);
                }

                // blow out the flat map of time values to a seperate vector of times for each key
                typedef std::map<std::string, std::vector<time_type> > nodematrix;
                nodematrix nodes;
                for( Times::iterator time = TimeMap().begin(); time != TimeMap().end(); ++time )
                    nodes[time->first].push_back(time->second);

                // dump each data point
                for( size_t row = 0; row < maxrows; ++row )
                {
                    std::string rowDump;
                    for( keyset::iterator key = keys.begin(); key != keys.end(); ++key )
                    {
                        if( key != keys.begin() )
                            rowDump.append("\t");
                        if( nodes[*key].size() > row )
                            rowDump.append(std::formatstr("%f", nodes[*key][row]));
                    }
                    rowDump.append("\r\n");
                    lines.push_back(rowDump);
                }

                // dump to the clipboard
                std::string dump;
                for( strings::iterator s = lines.begin(); s != lines.end(); ++s )
                {
                    dump.append(*s);
                }

                OpenClipboard(0);
                EmptyClipboard();
                HGLOBAL hg = GlobalAlloc(GMEM_MOVEABLE, dump.length()+1);
                if( hg != 0 )
                {
                    char* buf = (char*)GlobalLock(hg);
                    if( buf != 0 )
                    {
                        std::copy(dump.begin(), dump.end(), buf);
                        buf[dump.length()] = 0;
                        GlobalUnlock(hg);
                        SetClipboardData(CF_TEXT, hg);
                    }
                }
                CloseClipboard();
            }

            return ret;
        }

        static void Reset()
        {
            TimeMap().clear();
        }

        static std::string format_elapsed(double d) 
        {
            if( d < 0.00000001 )
            {
                // show in ps with 4 digits
                return std::formatstr("%0.4f ps", d * 1000000000000.0);
            }
            if( d < 0.00001 )
            {
                // show in ns
                return std::formatstr("%0.0f ns", d * 1000000000.0);
            }
            if( d < 0.001 )
            {
                // show in us
                return std::formatstr("%0.0f us", d * 1000000.0);
            }
            if( d < 0.1 )
            {
                // show in ms
                return std::formatstr("%0.0f ms", d * 1000.0);
            }
            if( d <= 60.0 )
            {
                // show in seconds
                return std::formatstr("%0.2f s", d);
            }
            if( d < 3600.0 )
            {
                // show in min:sec
                return std::formatstr("%01.0f:%02.2f", floor(d/60.0), fmod(d,60.0));
            }
            // show in h:min:sec
            return std::formatstr("%01.0f:%02.0f:%02.2f", floor(d/3600.0), floor(fmod(d,3600.0)/60.0), fmod(d,60.0));
        }

    private:
        static __int64 TimerFreq()
        {
            static __int64 freq = 0;
            static bool init = false;
            if( !init )
            {
                LARGE_INTEGER li;
                QueryPerformanceFrequency(&li);
                freq = li.QuadPart;
                init = true;
            }
            return freq;
        }
        LARGE_INTEGER startTime, stopTime;
        std::string label;

        typedef std::string key_type;
        typedef double time_type;
        typedef std::multimap<key_type, time_type> Times;
//      static Times times;
        static Times& TimeMap()
        {
            static Times times_;
            return times_;
        }

        struct extract_key : public std::unary_function<Times::value_type, key_type>
        {
            std::string operator()(Times::value_type const & r) const
            {
                return r.first;
            }
        };

        struct extract_val : public std::unary_function<Times::value_type, time_type>
        {
            time_type operator()(Times::value_type const & r) const
            {
                return r.second;
            }
        };
        struct match_key : public std::unary_function<Times::value_type, bool>
        {
            match_key(key_type const & key_) : key(key_) {};
            bool operator()(Times::value_type const & rhs) const
            {
                return key == rhs.first;
            }
        private:
            match_key& operator=(match_key&) { return * this; }
            const key_type key;
        };

        struct accum_key : public std::binary_function<time_type, Times::value_type, time_type>
        {
            accum_key(key_type const & key_) : key(key_), n(0) {};
            time_type operator()(time_type const & v, Times::value_type const & rhs) const
            {
                if( key == rhs.first )
                {
                    ++n;
                    return rhs.second + v;
                }
                return v;
            }
        private:
            accum_key& operator=(accum_key&) { return * this; }
            const Times::key_type key;
            mutable size_t n;
        };
    };

файл stringext.h (предоставляет функцию formatstr ()):

namespace std
{
    /*  ---

    Formatted Print

        template<class C>
        int strprintf(basic_string<C>* pString, const C* pFmt, ...);

        template<class C>
        int vstrprintf(basic_string<C>* pString, const C* pFmt, va_list args);

    Returns :

        # characters printed to output


    Effects :

        Writes formatted data to a string.  strprintf() works exactly the same as sprintf(); see your
        documentation for sprintf() for details of peration.  vstrprintf() also works the same as sprintf(), 
        but instead of accepting a variable paramater list it accepts a va_list argument.

    Requires :

        pString is a pointer to a basic_string<>

    --- */

    template<class char_type> int vprintf_generic(char_type* buffer, size_t bufferSize, const char_type* format, va_list argptr);

    template<> inline int vprintf_generic<char>(char* buffer, size_t bufferSize, const char* format, va_list argptr)
    {
#       ifdef SECURE_VSPRINTF
        return _vsnprintf_s(buffer, bufferSize-1, _TRUNCATE, format, argptr);
#       else
        return _vsnprintf(buffer, bufferSize-1, format, argptr);
#       endif
    }

    template<> inline int vprintf_generic<wchar_t>(wchar_t* buffer, size_t bufferSize, const wchar_t* format, va_list argptr)
    {
#       ifdef SECURE_VSPRINTF
        return _vsnwprintf_s(buffer, bufferSize-1, _TRUNCATE, format, argptr);
#       else
        return _vsnwprintf(buffer, bufferSize-1, format, argptr);
#       endif
    }

    template<class Type, class Traits>
    inline int vstringprintf(basic_string<Type,Traits> & outStr, const Type* format, va_list args)
    {
        // prologue
        static const size_t ChunkSize = 1024;
        size_t curBufSize = 0;
        outStr.erase(); 

        if( !format )
        {
            return 0;
        }

        // keep trying to write the string to an ever-increasing buffer until
        // either we get the string written or we run out of memory
        while( bool cont = true )
        {
            // allocate a local buffer
            curBufSize += ChunkSize;
            std::ref_ptr<Type> localBuffer = new Type[curBufSize];
            if( localBuffer.get() == 0 )
            {
                // we ran out of memory -- nice goin'!
                return -1;
            }
            // format output to local buffer
            int i = vprintf_generic(localBuffer.get(), curBufSize * sizeof(Type), format, args);
            if( -1 == i )
            {
                // the buffer wasn't big enough -- try again
                continue;
            }
            else if( i < 0 )
            {
                // something wierd happened -- bail
                return i;
            }
            // if we get to this point the string was written completely -- stop looping
            outStr.assign(localBuffer.get(),i);
            return i;
        }
        // unreachable code
        return -1;
    };

    // provided for backward-compatibility
    template<class Type, class Traits>
    inline int vstrprintf(basic_string<Type,Traits> * outStr, const Type* format, va_list args)
    {
        return vstringprintf(*outStr, format, args);
    }

    template<class Char, class Traits>
    inline int stringprintf(std::basic_string<Char, Traits> & outString, const Char* format, ...)
    {
        va_list args;
        va_start(args, format);
        int retval = vstringprintf(outString, format, args);
        va_end(args);
        return retval;
    }

    // old function provided for backward-compatibility
    template<class Char, class Traits>
    inline int strprintf(std::basic_string<Char, Traits> * outString, const Char* format, ...)
    {
        va_list args;
        va_start(args, format);
        int retval = vstringprintf(*outString, format, args);
        va_end(args);
        return retval;
    }

    /*  ---

    Inline Formatted Print

        string strprintf(const char* Format, ...);

    Returns :

        Formatted string


    Effects :

        Writes formatted data to a string.  formatstr() works the same as sprintf(); see your
        documentation for sprintf() for details of operation.  

    --- */

    template<class Char>
    inline std::basic_string<Char> formatstr(const Char * format, ...)
    {
        std::string outString;

        va_list args;
        va_start(args, format);
        vstringprintf(outString, format, args);
        va_end(args);
        return outString;
    }
};

Файл algorithmmext.h (предоставляет функцию transform_if ()):

/*  ---

Transform
25.2.3

    template<class InputIterator, class OutputIterator, class UnaryOperation, class Predicate>
        OutputIterator transform_if(InputIterator first, InputIterator last, OutputIterator result, UnaryOperation op, Predicate pred)

    template<class InputIterator1, class InputIterator2, class OutputIterator, class BinaryOperation, class Predicate>
        OutputIterator transform_if(InputIterator first, InputIterator last, OutputIterator result, BinaryOperation binary_op, Predicate pred)

Requires:   

    T is of type EqualityComparable (20.1.1) 
    op and binary_op have no side effects

Effects :

    Assigns through every iterator i in the range [result, result + (last1-first1)) a new corresponding value equal to one of:
        1:  op( *(first1 + (i - result)) 
        2:  binary_op( *(first1 + (i - result), *(first2 + (i - result))

Returns :

    result + (last1 - first1)

Complexity :

    At most last1 - first1 applications of op or binary_op

--- */

template<class InputIterator, class OutputIterator, class UnaryFunction, class Predicate>
OutputIterator transform_if(InputIterator first, 
                            InputIterator last, 
                            OutputIterator result, 
                            UnaryFunction f, 
                            Predicate pred)
{
    for (; first != last; ++first)
    {
        if( pred(*first) )
            *result++ = f(*first);
    }
    return result; 
}

template<class InputIterator1, class InputIterator2, class OutputIterator, class BinaryOperation, class Predicate>
OutputIterator transform_if(InputIterator1 first1, 
                            InputIterator1 last1, 
                            InputIterator2 first2, 
                            OutputIterator result, 
                            BinaryOperation binary_op, 
                            Predicate pred)
{
    for (; first1 != last1 ; ++first1, ++first2)
    {
        if( pred(*first1) )
            *result++ = binary_op(*first1,*first2);
    }
    return result;
}

John Dibling 23.10.2008

comment

Прямо из коробки этот код выдает несколько ошибок, в частности, нет ни std :: safe_string, ни std :: ref_ptr (по крайней мере, в стандартной установке) - B. Decoster; 12.05.2011

arrow_upward
2
arrow_downward

Ну, у меня есть два фрагмента кода. В псевдокоде они выглядят так (это упрощенная версия, я использую QueryPerformanceFrequency на самом деле):

Первый фрагмент:

Timer timer = new Timer
timer.Start

Второй фрагмент:

timer.Stop
show elapsed time

Немного горячих клавиш кунг-фу, и я могу сказать, сколько времени этот фрагмент кода украл у моего процессора.

aku 14.09.2008

arrow_upward
0
arrow_downward

В статье Профилировщик кода и оптимизации содержится много информации о профилировании кода C ++, а также есть бесплатная ссылка для загрузки программы / класса, которая покажет вам графическое представление для различных путей / методов кода.

Espo 14.09.2008

arrow_upward
0
arrow_downward

У меня есть класс быстрого и грязного профилирования, который можно использовать при профилировании даже в самых узких внутренних циклах. Акцент делается на чрезвычайно легкий и простой код. Класс выделяет двумерный массив фиксированного размера. Затем я повсюду добавляю вызовы "контрольной точки". Когда контрольная точка N достигается сразу после контрольной точки M, я добавляю прошедшее время (в микросекундах) к элементу массива [M, N]. Поскольку это предназначено для профилирования жестких циклов, у меня также есть вызов «начала итерации», который сбрасывает переменную «последней контрольной точки». В конце теста вызов dumpResults() создает список всех пар контрольных точек, следующих друг за другом, вместе с общим учтенным и неучтенным временем.

Community 23.10.2008

arrow_upward
0
arrow_downward

По этой причине я написал простой кросс-платформенный класс под названием nanotimer. Цель заключалась в том, чтобы быть как можно более легким, чтобы не мешать реальной производительности кода, добавляя слишком много инструкций и тем самым влияя на кеш инструкций. Он способен обеспечить точность до микросекунд в Windows, Mac и Linux (и, возможно, в некоторых вариантах Unix).

Основное использование:

plf::timer t;
timer.start();

// stuff

double elapsed = t.get_elapsed_ns(); // Get nanoseconds

start () также перезапускает таймер при необходимости. «Приостановить» таймер можно, запомнив прошедшее время, затем перезапустив таймер при «снятии паузы» и добавив к сохраненному результату при следующей проверке прошедшего времени.

metamorphosis 12.06.2017

Быстрый и грязный способ профилировать ваш код

Ответы (7)

Первый фрагмент:

Второй фрагмент:

Похожие вопросы