В программе живые истории о том, как исследования становятся работающими сервисами:
- prod-ready распознавание речи на ограниченном наборе данных
- speaker diarization: распознавание по голосам в реальном времени
- быстрые команды с произвольной структурой для low-resource сценария колонок
- суммаризация трёхчасовых видео в GigaChat
Для специалистов уровня middle+/senior в области ML, NLP и SpeechTech, а также для data-аналитиков, которые работают с большими массивами данных, качеством разметки и метриками моделей. Будет интересно всем, кому близки задачи распознавания речи и эмоций, оптимизация ML-моделей под умные устройства и построение мультимодальных диалоговых систем.
Подробности и регистрация по ссылке