Skip to content

Latest commit

 

History

History
109 lines (94 loc) · 5.15 KB

File metadata and controls

109 lines (94 loc) · 5.15 KB

Движки Speech-To-Text (STT)

Подробные инструкции по настройке и ссылки на сайты можно найти в документации Mycroft по STT.

Таблица сравнения

Название Русский Лицензия Локально Стоимость
Google Cloud 💔 ☁️ нет 💰 платно: 0,4-0,9 ¢ (0,28-0,65 ₽) за 15 секунд
GoVivace 💔 ? 💰 платно, подробностей нет
Houndify ☁️ нет
IBM Cloud ☁️ нет
Kaldi ✅ Apache v2 ✅ бесплатно
Mozilla DeepSpeech возможно ✅ MPL v2 ✅ да ✅ бесплатно
Microsoft Azure
Wit.ai ✅ да 💔 ☁️ нет ✅ бесплатно
Yandex Cloud ✅ да 💔 ☁️ нет 💰 платно: 0,15 ₽ за 15 секунд
VK Cloud ✅ да 💔 ☁️ нет 💰 платно: 0,12 ₽ за 15 секунд
Vosk ✅ да ✅ Apache v2 ✅ да ✅ бесплатно

VK Cloud

Неплохой и достаточно быстрый в настройке способ. Требует постоянного подключения к интернету, а также наличия аккаунта в облаке VK. При регистрации даётся 100 рублей (можно получить до 3000 на два месяца для тестирования), дальше требует оплаты.

Установка: mycroft-pip install mycroft-plugin-vk-cloud

Конфиг будет выглядеть примерно вот так:

{
  "lang": "ru-ru",
  "stt": {
    "module": "vk",
    "vk": {
      "credential": {
        "service_token": "YOUR_SERVICE_TOKEN"
      }
    }
  }
}

См. также VK Cloud TTS.

Vosk

«Воск» — локальный STT от рускоязычных разработчиков. Есть компактная модель на 45 МБ, подходящая для Raspberry Pi.

Установка (см. OpenVoiceOS/ovos-stt-plugin-vosk):

pip install ovos-stt-plugin-vosk

Конфиг: В случае использования Яндекса голоса Филиппа итоговый вариант конфига будет выглядеть примерно вот так:

{
  "lang": "ru-ru",
  "stt": {
    "module": "ovos-stt-plugin-vosk",
    "ovos-stt-plugin-vosk": {
        "model": "https://alphacephei.com/vosk/models/vosk-model-small-ru-0.22.zip"
    }
  }
}

Wit.ai

Неплохой и достаточно быстрый в настройке способ. Требует постоянного подключения к интернету, а также регистрацию в сервисе через логин Facebook. Не требует оплаты.

В случае использования Яндекса голоса Филиппа итоговый вариант конфига будет выглядеть примерно вот так:

{
  "lang": "ru-ru",
  "stt": {
    "module": "wit",
    "wit": {
      "credential": {
        "token": "YOUR_TOKEN"
      }
    }
  }
}

Yandex SpeechKit

Качественный и достаточно быстрый в настройке способ. Требует постоянного подключения к интернету, а также наличия аккаунта в облаке Яндекса. Первый месяц бесплатно, после этого требует оплаты.

Ссылки:

В случае использования Яндекса голоса Филиппа итоговый вариант конфига будет выглядеть примерно вот так:

{
  "lang": "ru-ru",
  "stt": {
    "module": "yandex",
    "yandex": {
      "lang": "ru-RU",
      "credential": {
        "api_key": "YOUR_API_KEY"
      }
    }
  }
}

См. также Yandex SpeechKit TTS.