Страница 1 из 2
плагин потокового распознавания речи через Yandex Cloud Kit
Добавлено: 19 фев 2018, 22:17
kefiller
Коллеги, приветствую.
Интересует сабж. Основной смысл - потоковое распознавание речи в режиме онлайн, во время разговора, а не по принципу "проговорил/распознал". Чтобы можно было в речи вычленить слово "бомба" и оборвать разговор/доложить товарищу майору. Также нужно определение языка речи(достаточно на уровне русский/не русский). Сильно хочется чтобы работало с популярными API Yandex/Google, первый в приоритете. Решение должно быть бесплатное, и без программирования каких-то функций, т.е. некий готовый плагин, который можно несложными телодвижениями прикрутить к астеру. Есть подозрение, что что-то такое рядом валяется, не могу найти. Подскажите, люди добрые, может кто с чем-то подобным сталкивался?
Re: плагин потокового распознавания речи через Yandex Cloud
Добавлено: 20 фев 2018, 08:55
april22
Re: плагин потокового распознавания речи через Yandex Cloud
Добавлено: 20 фев 2018, 09:15
awsswa
Все решения где можно добавить свою модель разговора:
Бомба, Бумба, Боомба, Бомбааа, Бббоммба = интерпретировать как бомба
Платные
Re: плагин потокового распознавания речи через Yandex Cloud
Добавлено: 20 фев 2018, 10:01
virus_net
Да и сам API платный.
https://tech.yandex.ru/speechkit/cloud/
Стоимость лицензии зависит от количества обращений и в среднем составляет 200 рублей за 1000 запросов или 60 копеек за 1 минуту.
API и некий "готовый плагин", да ещё и простой, подать бесплатно...
Чем больше идет время тем люди все больше и больше борзеют. Инет им бесплатно подавай, телефонию тоже, api, программный код...
Re: плагин потокового распознавания речи через Yandex Cloud
Добавлено: 21 фев 2018, 00:01
whoim
Интересно, как много "инновационных стартапов" разбилось о реальность?)
На моей памяти уже парочка
Re: плагин потокового распознавания речи через Yandex Cloud
Добавлено: 22 фев 2018, 12:15
virus_net
whoim, тут самое интересное в том, что они ищут бесплатного, чтобы потом на этом денег зарабатывать.
kefiller, вообщем как решите потратить денег на реализацию - обращайтесь. сразу скажу - дорого.
Re: плагин потокового распознавания речи через Yandex Cloud
Добавлено: 26 фев 2018, 15:32
virus_net
Потестил я Yandex Speechkit.
Могу сказать
Яндексу -
МОЛОДЦЫ ! Очень хорошая работа. Снимаю шляпу перед разрабами, работает просто на ура.
Подумал, что хорошим и простым примером для теста работы speechkit может стать банальное:
Вызов сотрудника по фамилии или имени, т.е. вместо ввода добавочного номера мы просто называем в трубку фамилию и/или имя.
Итог:
- - Speechkit произносит "Назовите фамилию или имя сотрудника"
- записываем произнесенное
- распознаем записанное в Speechkit
- делаем запрос в БД с поиском
- если сотрудник найден, то набираем его номер
- если сотрудник не найден Speechkit произносит "К сожалению такого сотрудника не найдено. Досвидания."
Диалплан в итоге получился не сложным:
Код: Выделить всё
[yandex_speechkit]
exten => s,1,Wait(1)
exten => s,n,AGI(yandex_speechkit/yandex_speechkit.php,generate,Назовите фамилию или имя сотрудника)
exten => s,n,Set(RECORD=/var/spool/asterisk/monitor/tmp_${CALLERID(num)}.wav)
exten => s,n,Record(${RECORD},1,10,qx)
exten => s,n,AGI(yandex_speechkit/yandex_speechkit.php,recognize,${RECORD})
exten => s,n,Hangup()
Собственно далее уже можно просто усложнять логику работы робота, делать его потоковым и расширять обработчик ошибок.
Re: плагин потокового распознавания речи через Yandex Cloud
Добавлено: 26 фев 2018, 16:02
ded
- если сотрудник не найден Speechkit произносит "К сожалению такого сотрудника не найдено. До свидания."
.. а лучше бы -
-" К сожалению такого сотрудника не найдено. Попробуйте ещё раз." и дать возможность хотя бы две попытки, назвать другого сотрудника.
Re: плагин потокового распознавания речи через Yandex Cloud
Добавлено: 26 фев 2018, 16:34
virus_net
Ну это в продакшене так надо делать.Тестирование Goto в задачу не входило, да и тестировать в Goto нечего, т.к. заранее известно, что Goto работает.
Посему для тестовой песочницы вполне сойдет и до свидания
Re: плагин потокового распознавания речи через Yandex Cloud
Добавлено: 26 фев 2018, 18:27
ded
для тестовой песочницы Speechkit тогда пусть произносит "Я сожалею..."