VIDEOCHAT  ::   FAQ  ::   Поиск  ::   Регистрация  ::   Вход

плагин потокового распознавания речи через Yandex Cloud Kit

Проблемы Asterisk без вэб-оболочек и их решения

Модераторы: april22, Zavr2008

kefiller
Сообщения: 2
Зарегистрирован: 28 дек 2010, 23:05

плагин потокового распознавания речи через Yandex Cloud Kit

Сообщение kefiller »

Коллеги, приветствую.

Интересует сабж. Основной смысл - потоковое распознавание речи в режиме онлайн, во время разговора, а не по принципу "проговорил/распознал". Чтобы можно было в речи вычленить слово "бомба" и оборвать разговор/доложить товарищу майору. Также нужно определение языка речи(достаточно на уровне русский/не русский). Сильно хочется чтобы работало с популярными API Yandex/Google, первый в приоритете. Решение должно быть бесплатное, и без программирования каких-то функций, т.е. некий готовый плагин, который можно несложными телодвижениями прикрутить к астеру. Есть подозрение, что что-то такое рядом валяется, не могу найти. Подскажите, люди добрые, может кто с чем-то подобным сталкивался?
april22
Сообщения: 2187
Зарегистрирован: 09 июл 2012, 09:47

Re: плагин потокового распознавания речи через Yandex Cloud

Сообщение april22 »

PRIME_BBCODE_SPOILER_SHOW PRIME_BBCODE_SPOILER:
Изображение
Своими вопросами , вы загоняете меня в ГУГЛЬ.
awsswa
Сообщения: 2390
Зарегистрирован: 09 июн 2012, 10:52
Откуда: Россия, Пермь skype: yarick_perm

Re: плагин потокового распознавания речи через Yandex Cloud

Сообщение awsswa »

Все решения где можно добавить свою модель разговора:
Бомба, Бумба, Боомба, Бомбааа, Бббоммба = интерпретировать как бомба
Платные
платный суппорт по мере возможностей
virus_net
Сообщения: 2337
Зарегистрирован: 05 июн 2013, 08:12
Откуда: Москва

Re: плагин потокового распознавания речи через Yandex Cloud

Сообщение virus_net »

Да и сам API платный.
https://tech.yandex.ru/speechkit/cloud/
Стоимость лицензии зависит от количества обращений и в среднем составляет 200 рублей за 1000 запросов или 60 копеек за 1 минуту.
API и некий "готовый плагин", да ещё и простой, подать бесплатно...
Чем больше идет время тем люди все больше и больше борзеют. Инет им бесплатно подавай, телефонию тоже, api, программный код...
мой SIP URI sip:virus_net@asterisk.ru
bitname.ru - Домены .bit (namecoin) .emc .coin .lib .bazar (emercoin)

ENUMER - звони бесплатно и напрямую.
whoim
Сообщения: 766
Зарегистрирован: 26 ноя 2013, 23:25
Откуда: Краснодар
Контактная информация:

Re: плагин потокового распознавания речи через Yandex Cloud

Сообщение whoim »

Интересно, как много "инновационных стартапов" разбилось о реальность?)
На моей памяти уже парочка
облачные и локальные сервера asterisk/freepbx/a2billing/crm с полной техподдержкой. skype: whoim2, sipuri: whoim@asterisk.ru
virus_net
Сообщения: 2337
Зарегистрирован: 05 июн 2013, 08:12
Откуда: Москва

Re: плагин потокового распознавания речи через Yandex Cloud

Сообщение virus_net »

whoim, тут самое интересное в том, что они ищут бесплатного, чтобы потом на этом денег зарабатывать.

kefiller, вообщем как решите потратить денег на реализацию - обращайтесь. сразу скажу - дорого.
мой SIP URI sip:virus_net@asterisk.ru
bitname.ru - Домены .bit (namecoin) .emc .coin .lib .bazar (emercoin)

ENUMER - звони бесплатно и напрямую.
virus_net
Сообщения: 2337
Зарегистрирован: 05 июн 2013, 08:12
Откуда: Москва

Re: плагин потокового распознавания речи через Yandex Cloud

Сообщение virus_net »

Потестил я Yandex Speechkit.
Могу сказать Яндексу - МОЛОДЦЫ ! Очень хорошая работа. Снимаю шляпу перед разрабами, работает просто на ура.

Подумал, что хорошим и простым примером для теста работы speechkit может стать банальное:
Вызов сотрудника по фамилии или имени, т.е. вместо ввода добавочного номера мы просто называем в трубку фамилию и/или имя.
Итог:
  • - Speechkit произносит "Назовите фамилию или имя сотрудника"
    - записываем произнесенное
    - распознаем записанное в Speechkit
    - делаем запрос в БД с поиском
    - если сотрудник найден, то набираем его номер
    - если сотрудник не найден Speechkit произносит "К сожалению такого сотрудника не найдено. Досвидания."
Диалплан в итоге получился не сложным:

Код: Выделить всё

[yandex_speechkit]
exten => s,1,Wait(1)
exten => s,n,AGI(yandex_speechkit/yandex_speechkit.php,generate,Назовите фамилию или имя сотрудника)
exten => s,n,Set(RECORD=/var/spool/asterisk/monitor/tmp_${CALLERID(num)}.wav)
exten => s,n,Record(${RECORD},1,10,qx)
exten => s,n,AGI(yandex_speechkit/yandex_speechkit.php,recognize,${RECORD})
exten => s,n,Hangup()
Собственно далее уже можно просто усложнять логику работы робота, делать его потоковым и расширять обработчик ошибок.
мой SIP URI sip:virus_net@asterisk.ru
bitname.ru - Домены .bit (namecoin) .emc .coin .lib .bazar (emercoin)

ENUMER - звони бесплатно и напрямую.
ded
Сообщения: 15626
Зарегистрирован: 26 авг 2010, 19:00

Re: плагин потокового распознавания речи через Yandex Cloud

Сообщение ded »

- если сотрудник не найден Speechkit произносит "К сожалению такого сотрудника не найдено. До свидания."
.. а лучше бы -
-" К сожалению такого сотрудника не найдено. Попробуйте ещё раз." и дать возможность хотя бы две попытки, назвать другого сотрудника.
virus_net
Сообщения: 2337
Зарегистрирован: 05 июн 2013, 08:12
Откуда: Москва

Re: плагин потокового распознавания речи через Yandex Cloud

Сообщение virus_net »

Ну это в продакшене так надо делать.Тестирование Goto в задачу не входило, да и тестировать в Goto нечего, т.к. заранее известно, что Goto работает.
Посему для тестовой песочницы вполне сойдет и до свидания :)
мой SIP URI sip:virus_net@asterisk.ru
bitname.ru - Домены .bit (namecoin) .emc .coin .lib .bazar (emercoin)

ENUMER - звони бесплатно и напрямую.
ded
Сообщения: 15626
Зарегистрирован: 26 авг 2010, 19:00

Re: плагин потокового распознавания речи через Yandex Cloud

Сообщение ded »

для тестовой песочницы Speechkit тогда пусть произносит "Я сожалею..." :)
Ответить
© 2008 — 2025 Asterisk.ru
Digium, Asterisk and AsteriskNOW are registered trademarks of Digium, Inc.
Design and development by PostMet-Netzwerk GmbH