Доклад

LLVM MemProf + TCMalloc hot/cold на практике

В прошлый раз рассмотрели то, как LLVM MemProf собирает профиль использования памяти и как затем LLVM может использовать этот профиль для PGO, автоматически расставляя подсказки менеджеру памяти, какая аллокация будет часто использоваться (hot), а какая редко (cold).

В этот же раз я покажу, во что в реальности превращается эта оптимизация при использовании TCMalloc (который как раз умеет и знает про hot и cold аллокации), насколько приложение становится быстрее или медленнее. И за счет чего. Продемонстрирую как результаты микробенчмарков, так и результаты тестов реальных библиотек и приложений с PGO и без.

Расписание