freeswitchforum.com
https://freeswitchforum.com/

Синтез и распознование речи
https://freeswitchforum.com/viewtopic.php?f=6&t=309
Страница 1 из 1

Автор:  vlad_6233 [ 02 июн 2014 10:32 ]
Заголовок сообщения:  Синтез и распознование речи

Может кто работал с такими системами? Есть ли адекватные Open-Source решения для русского языка?

Автор:  sugiura [ 02 июн 2014 11:30 ]
Заголовок сообщения:  Re: Синтез и распознование речи

Среди модулей fs синтезатора русской речи нет. Есть festival (если не путаю), по-умолчанию русского нет, но есть это: http://festlang.berlios.de/docu/doku.php?id=russianru

Для распознавания можно использовать что-то подобное (правда, только небольшие аудиозаписи), пример скрипта (лишнее удалить):
[+] 
Код:
#!/bin/sh
cd /usr/local/freeswitch/scripts/
sox tmp.wav message.flac pad .1 0 rate 16k > /dev/null 2>&1
sox tmp.wav message.mp3 pad .1 0 rate 16k > /dev/null 2>&1
wget -q -U "Mozilla/5.0" --post-file message.flac --header="Content-Type: audio/x-flac; rate=16000" -O - "http://www.google.com/speech-api/v1/recognize?lang=ru-RU&client=chromium" > message.ret
cat message.ret | sed 's/.*utterance":"//' | sed 's/","confidence.*//' >> messages.log
#cat message.ret | sed 's/.*utterance":"//' | sed 's/","confidence.*//' | iconv -f UTF8 -t KOI8-U | mutt -x -s "new voice mail" -- тут_моя_почта
cat message.ret | sed 's/.*utterance":"//' | sed 's/","confidence.*//' | iconv -f UTF8 | mutt -x -a message.mp3 -s "new voice mail" -- тут_моя_почта
rm message.flac
rm tmp.wav
rm message.ret
rm message.mp3


Надеюсь, правильно понял вопрос.:)

Автор:  vlad_6233 [ 02 июн 2014 12:25 ]
Заголовок сообщения:  Re: Синтез и распознование речи

Google API да, хорошее решение.
А что вообще из адекватно работающего с русским языком существует в природе?

Автор:  sugiura [ 03 июн 2014 06:39 ]
Заголовок сообщения:  Re: Синтез и распознование речи

voicenavigator, но он платный

http://habrahabr.ru/company/speechpro/blog/129811/

Автор:  joohny [ 18 июн 2014 09:46 ]
Заголовок сообщения:  Re: Синтез и распознование речи

Синтез:
Вполне удобно от Google использовать, причем ранее я пользовался скриптом на BASH, который это делал, сейчас же нашел решение "из коробки"
Код:
<action application="playback" data="shout://translate.google.com/translate_tts?tl=en&q=slovo"/>

Если писать русскими буквами в плане набора и выставлять tl=ru - пока не вышло, Google "ерунду" зачитывает. Возможно необходимо какие-то данные в http заголовке передавать. Не знаю умеет ли это mod_shout.

Автор:  alex_sibtone [ 19 июн 2014 09:51 ]
Заголовок сообщения:  Re: Синтез и распознование речи

Синтез и распознавание появилось и у Яндекс: Yandex SpeechKit.

wget -qO - 'http://tts.voicetech.yandex.net/tts?format=mp3&quality=hi&platform=web&application=translate&lang=ru_RU&text=Яндекс синтез, что то в этом есть' > /tmp/1.mp3; mplayer /tmp/1.mp3

Автор:  joohny [ 19 июн 2014 11:56 ]
Заголовок сообщения:  Re: Синтез и распознование речи

Показанный выше пример можно напрямую из FreeSWITCH использовать(И это здорово):
Код:
          <action application="answer" data=""/>
          <action application="playback" data="shout://tts.voicetech.yandex.net/tts?format=mp3&quality=hi&platform=web&application=translate&lang=ru_RU&text=${url_encode FreeSWITCHforum.com помогает находить коллективные решения и делает жизнь чуть-чуть интереснее!}"/>

Спасибо, alex_sibtone, я давно себе в todo записал изучить api от tts.yandex.ru, но благодаря вашему "Hello world!" теперь есть готовый пример его использования напрямую.

Где вы черпали информацию? Может и про распознавание что-то есть?

Автор:  Vlad1983 [ 19 июн 2014 12:05 ]
Заголовок сообщения:  Re: Синтез и распознование речи

есть чуток здесь

Страница 1 из 1 Часовой пояс: UTC + 4 часа
Powered by phpBB® Forum Software © phpBB Group
http://www.phpbb.com/