Авторизуйтесь для просмотра видео

ДокладДата: 23.05 / Начало: 00:00 – Конец: 00:00

Ускоряем синтез: от TensorRT до CUDA C++

Производительность

Сложность -

Презентация pdf

Выступление будет посвящено оптимизации одного из компонентов сервиса SberDevices, который превращает текст в человеческую речь. Артём подробно рассмотрит способы оптимизации ML inference, начиная от применения высокоуровневой библиотеки TensorRT, заканчивая самостоятельной оптимизацией на CUDA C++. Доклад будет интересен как тем, кто сталкивается с машинным обучением в продакшене, так и тем, кто хочет получить максимум от используемого железа.

#gpu
#tenzorrt
#algorithms

Спикеры

Артем Хорошев
SberDevices

Приглашенные эксперты

Дмитрий Изволов

Другие доклады по теме «Производительность»
- Смотреть запись
  Техники оптимизации производительности
  Максим Кита
  Яндекс
  Зал 3Сложность -
- Смотреть запись
  GPU Driven Rendering Pipeline, или Как пишется графика в современных видеоиграх
  Евгений Григорчук
  Elverils
  Зал 1Сложность -
- Смотреть запись
  Учим Кукушку Летать, или ConcurrentHashMap with Seqlocks
  Антон Малахов
  Huawei
  Антон Потапов
  Huawei
  Сложность -
- Смотреть запись
  Advanced Linux Kernel Bypass Techniques in 2023
  Ashot Vardanian
  Unum
  На английском языкеСложность -
- Смотреть запись
  Идея по улучшению многопоточного кода
  Александр Корнилов
  Лаборатория Касперского
  Зал 2Сложность -
- Смотреть запись
  Практика программирования тензорных ядер
  Михаил Лукин
  Судо
  Зал 3Сложность -
- Смотреть запись
  Максимально быстрый и максимально удобный С++ msgpack-кодек
  Александр Ляпунов
  VK
  Зал 3Сложность -
- Смотреть запись
  Эффективное использование GPU на примере разработки игр
  Ростислав Михеев
  Elverils
  Зал 2Сложность -

Расписание