Данный репозиторий содержит веб-приложение, которое позволяет обращаться к сервису Yandex SpeechKit и работать с ним через веб-интерфейс.
Приложение позволяет ознакомиться с возможностями асихронного и потокового распознавания, а также – синтеза речи – с различными параметрами, доступными при распознавании и синтезе:
- Можно выбрать и проверить различные доступные голоса;
- Можно использовать TTS-разметку;
- Доступны возможности Speaker Labeling для моноканального аудио;
- Добавлены возможности для суммаризации и классификации.
Приложение можно развернуть локально при помощи Docker Compose, либо в Yandex Cloud, при помощи Terraform.
Потоковый режим распознавания через микрофон доступен только при локальном развертывании через docker compose, так как необходима поддержка WebSockets, недоступная в Serverless Containers.
Результат синтеза речи сохраняется в бакет.
