Дмитрий Болотов | Расстановка пунктуации в системе распознавания речи от LSTM до Whisper

Аватар автора
OPEN DATA SCIENCE (ODS.AI)
Спикер: Дмитрий Болотов, ML Engineer - SaluteSpeech, ASR Описание: Расстановка знаков пунктуации в системах распознавания речи играет важную роль. От неё зависит качество решения последующих задач, а так же восприятие пользователем распознанного текста. Мы сравним два подхода к решению данной задачи: Е2Е и каскадную систему. Для каскадной системы мы покажем основные архитектуры моделей пунктуации, выделим плюсы и минусы каждой архитектуры. Расскажем про перенос знаний из Whisper в LSTM и мультимодальную модель пунктуации. ______ Наши соц.сети:

0/0


0/0

0/0

0/0