Многопоточное управление кучей

В C/C++ я могу выделить память в одном потоке и удалить ее в другом потоке. Тем не менее всякий раз, когда кто-то запрашивает память из кучи, распределителю кучи необходимо пройтись по куче, чтобы найти свободную область подходящего размера. Как два потока могут эффективно обращаться к одной и той же куче без повреждения кучи? (Это делается путем блокировки кучи?)

operating-system memory heap

doron 28.01.2010 источник

comment

С измененным тегом, так как это действительно не имеет ничего общего с каким-либо конкретным языком программирования. - T.E.D. 29.01.2010

comment

Не совсем верно. ОС задействована только при увеличении кучи (что включает подкачку новых страниц памяти). Фактически управление кучей зависит от реализации malloc/new на C/C++. - doron 29.01.2010

Ответы (6)

arrow_upward
11
arrow_downward

В общем, вам не нужно беспокоиться о потокобезопасности вашего распределителя памяти. Все стандартные распределители памяти, то есть поставляемые с MacOS, Windows, Linux и т. д., являются потокобезопасными. Блокировки — это стандартный способ обеспечения потокобезопасности, хотя можно написать распределитель памяти, который использует только атомарные операции, а не блокировки.

Теперь совершенно другой вопрос, масштабируются эти распределители памяти; то есть их производительность не зависит от количества потоков, выполняющих операции с памятью? В большинстве случаев ответ отрицательный; они либо замедляют работу, либо потребляют намного больше памяти. Первым масштабируемым распределителем памяти в обоих измерениях (скорости и пространства) является Hoard (который Я написал); аллокатор Mac OS X вдохновлен им — и цитирует его в документации — но Hoard работает быстрее. Есть и другие, включая tcmalloc от Google.

EmeryBerger 09.01.2011

comment

Можете ли вы предоставить некоторую информацию об общей стратегии, используемой Хоардом? - doron; 10.01.2011

comment

Память управляется блоками, называемыми суперблоками, которые содержат объекты одинакового размера. Каждый поток получает некоторое их количество (локальное для потока), что означает отсутствие блокировок или состязаний. Потоки мультиплексируются в кучи для каждого процессора, которые содержат суперблоки. Выделение из суперблока выполняется только одним потоком за раз, что ограничивает ложное совместное использование. Hoard ограничивает потребление памяти, перемещая практически пустые суперблоки в общую кучу по мере того, как кучи для каждого ЦП становятся пустыми, что ограничивает конкуренцию и обеспечивает асимптотически оптимальное потребление памяти. См. cs.umass.edu/~emery/hoard/asplos2000.pdf. - EmeryBerger; 10.01.2011

arrow_upward
3
arrow_downward

Да, «обычная» реализация кучи, поддерживающая многопоточный код, обязательно будет включать какую-то блокировку для обеспечения правильной работы. В довольно экстремальных условиях (много активности кучи) это может стать узким местом; доступны более специализированные кучи (обычно предоставляющие некую локальную куче потока), которые могут помочь в этой ситуации. Я использовал Intel TBB "масштабируемый распределитель" на хороший эффект. tcmalloc и jemalloc — другие примеры malloc, реализованные с учетом многопоточного масштабирования.

Некоторое сравнение времени между однопоточными и многопотоковыми malloc здесь.

timday 28.01.2010

comment

Просто из интереса, каковы стратегии malloc для gcc и MSVC? - doron; 31.01.2010

comment

Хороший вопрос. Не много знаю о CRT MSVC, но gcc обычно ассоциируется с glibc, который использует ptmalloc: en.wikipedia.org/wiki/Malloc#dlmalloc_.28the_glibc_allocator.29 . Приведенная выше ссылка на тайминги довольно хорошо показывает это масштабирование, что объясняет, почему мои собственные эксперименты с аллокатором TBB иногда улучшают ситуацию, а иногда ухудшают. - timday; 01.02.2010

comment

@doron В Windows Vista и новее используется куча с низкой фрагментацией, что предположительно позволяет стандартному malloc хорошо работать в многопоточных программах. - ; 06.07.2012

arrow_upward
3
arrow_downward

Это вопрос об операционных системах, поэтому ответ будет зависеть от ОС.

В Windows каждый процесс получает свою собственную кучу. Это означает, что несколько потоков в одном процессе (по умолчанию) совместно используют кучу. Таким образом, ОС должна синхронизировать потоки своих вызовов выделения и освобождения, чтобы предотвратить повреждение кучи. Если вам не нравится идея возможного конфликта, который может возникнуть, вы можете обойти его с помощью Подпрограммы Heap*. Вы даже можете перегрузить malloc (в C) и new (в C++) для их вызова.

T.E.D. 28.01.2010

arrow_upward
2
arrow_downward

Я нашел эту ссылку.

В принципе, кучу можно разделить на арены. При запросе памяти каждая арена по очереди проверяется, не заблокирована ли она. Это означает, что разные потоки могут одновременно безопасно обращаться к разным частям кучи. С бесплатными немного сложнее, потому что каждый бесплатный должен быть освобожден с той арены, из которой он был выделен. Я предполагаю, что хорошая реализация заставит разные потоки по умолчанию использовать разные арены, чтобы попытаться минимизировать конкуренцию.

doron 29.01.2010

arrow_upward
1
arrow_downward

Да, обычно доступ к куче должен быть заблокирован. Каждый раз, когда у вас есть общий ресурс, этот ресурс необходимо защищать; память - это ресурс.

GManNickG 28.01.2010

comment

Даже когда каждый поток управляет своей собственной памятью? Это звучит ужасно неэффективно. - doron; 29.01.2010

comment

@deus: Нет, но это не та ситуация, которую вы описали. Вы сказали, что потоки разделяют память. (удаление в другой теме). - GManNickG; 29.01.2010

arrow_upward
0
arrow_downward

Это будет сильно зависеть от вашей платформы/ОС, но я считаю, что в большинстве систем это нормально. C/C++ не определяет потоки, поэтому по умолчанию я считаю, что ответ "куча не защищена", что у вас должна быть какая-то многопоточная защита для доступа к куче.

Однако, по крайней мере, с linux и gcc, я считаю, что включение -pthread автоматически даст вам эту защиту...

Кроме того, вот еще один связанный с этим вопрос:

Безопасность потоков нового оператора C++ в Linux и gcc 4

Matthew Eshleman 28.01.2010

Многопоточное управление кучей

Ответы (6)

Похожие вопросы