售前電話(huà)
135-3656-7657
售前電話(huà) : 135-3656-7657
在如何在XSwitch中使用ASR及TTS中提到,XSwitch內(nèi)置了很多ASR/TTS模塊,但大多數(shù)的ASR/TTS服務(wù)都是云廠商提供的。使用這些服務(wù)不僅需要有相應(yīng)的賬號(hào),而且大部分也需要付費(fèi)才能使用。在開(kāi)發(fā)測(cè)試時(shí),有時(shí)用起來(lái)就不能隨心所欲。 各類(lèi)通信方案定制咨詢(xún):028-83110277
為方便大家開(kāi)發(fā)與測(cè)試,XSwitch也提供了離線(xiàn)的ASR與TTS。
tts_commandline:該模塊是XSwitch內(nèi)置的模塊,XSwitch提供了配套的espeak-ng,可以支持中文。
在命令行上加載模塊:
當(dāng)然,也可以在XUI界面上加載,殊途同歸。
到【呼叫】?【路由】中,新建一條路由:
• 名稱(chēng):tts,也可以隨意
• 被叫字冠:tts,也可以是其它號(hào)碼,如1234等
• 呼叫源:default
• 目的地類(lèi)型:高級(jí)功能/系統(tǒng)
新出現(xiàn)的“文本”框中填入以下內(nèi)容:
其中,zh表示是中文。
然后就可以呼叫tts進(jìn)行測(cè)試了。
注意,espeak-ng放出來(lái)的聲音不好聽(tīng),但對(duì)于開(kāi)發(fā)測(cè)試來(lái)說(shuō),有總比沒(méi)有好。我們后續(xù)會(huì)給出一個(gè)更“好聽(tīng)”的使用方法,敬請(qǐng)期待。
mod_ai:XSwitch在mod_ai中提供了一個(gè)asr服務(wù),可離線(xiàn)使用,效果還不錯(cuò)。使用開(kāi)源的Vosk引擎。Vosk引擎比較小,但是模型文件比較大,因而需要單獨(dú)下載。
首先,進(jìn)入宿主機(jī)上的storage目錄,創(chuàng)建vosk目錄,如下:
到以下地址下載模型文件,解壓后放到剛剛創(chuàng)建的vosk目錄。
目前測(cè)試了以下幾個(gè)模型:
• vosk-model-cn-0.1 8k
• vosk-model-small-cn-0.3 16k
• vosk-model-small-en-us-0.15 16k
• vosk-model-en-us-daanzu-20200328 16k
然后,到XUI上【AI】?【AI】?【default】中,配置Asr-Models,啟用相應(yīng)的模型配置。配置完成后【重載】模塊。
簡(jiǎn)單使用:到【呼叫】?【路由】中,新建一條路由:
• 名稱(chēng):asr,也可以隨意
• 被叫字冠:asr,也可以是其它號(hào)碼,如1234等
• 呼叫源:default
• 目的地類(lèi)型:高級(jí)功能/系統(tǒng)
新出現(xiàn)的“文本”框中填入以下內(nèi)容:
打開(kāi)【高級(jí)】?【擴(kuò)展功能】?【終端】就可以看到日志。上面使用了err級(jí)別的日志是為了紅色能顯示得更醒目。
上述命令中,也可以通過(guò)asr:ai:vosk-model-cn-0.1指定使用的模型。
使用方法:其中,asr engine參數(shù)語(yǔ)法為:
其中:model可以省略,如果省略,則使用能找到的第一個(gè)模型,如:
XCC中,不需要asr:前綴,用起來(lái)更高效。
在Lua中使用:
FreeSWITCH兼容用法(Lua):
其它:
mod_ai模塊實(shí)現(xiàn)了:
• AI API:類(lèi)似mod_httapi,但是用JSON代替XML
• ai ASR Interface:是一個(gè)XCC的ASR,僅用于xcc_detect_speech,不適用于在核心中調(diào)用。