Модули преобразования речи в текст




Сравнение основных функций (opensource и коммерческий)

|
ВозможностиКоммерческий
Аудиоканалы *
Распознавание голосовой активности (Advanced VAD) +
Извлечение голосовых характеристик (ivectors) +
Автоматическая регулировка усиления (AGC) +
Таймер тайм-аута начала разговора +
Результаты в формате JSON с доп.инф. (аудио фрагмент, продолжительность и т. д.) +
Возврат ошибок сервиса +
Сохранение аудио фрагментов +
Исходный код -
Цена $950
ВозможностиOpensourceКоммерческий
Аудиоканалы 1*
Распознавание голосовой активности (VAD) ++
Автоматическая регулировка усиления (AGC) -+
Таймер тайм-аута начала разговора -+
Результаты в формате JSON с доп.инф. (аудио фрагмент, продолжительность и т. д.) -+
Возврат ошибок сервиса -+
Сохранение аудио фрагментов -+
Противодействие идентификации по голосу --
Гибкие настройки HTTP (proxy/timeouts/etc...) ++
Исходный код +-
Цена free$250
ВозможностиOpensourceКоммерческий
Аудиоканалы 1*
Распознавание голосовой активности (VAD) ++
Автоматическая регулировка усиления (AGC) -+
Таймер тайм-аута начала разговора -+
Результаты в формате JSON с доп.инф. (аудио фрагмент, продолжительность и т. д.) -+
Возврат ошибок сервиса -+
Сохранение аудио фрагментов -+
Противодействие идентификации по голосу --
Гибкие настройки HTTP (proxy/timeouts/etc...) ++
Исходный код +-
Цена free$250