售前電話
135-3656-7657
售前電話 : 135-3656-7657
話音處理技術(shù)
IP網(wǎng)絡(luò)電路中的話音處理主要需解決兩個(gè)問題。一是在保證一定話音質(zhì)量的前提下盡可能降低編碼比特率,二是在IP網(wǎng)絡(luò)環(huán)境下保證一定的通話質(zhì)量。前者主要是話音編碼技術(shù),包括靜音檢測;后者包括分組丟失補(bǔ)償和回波抵消技術(shù)。歐洲電信標(biāo)準(zhǔn)化委員會(huì)(ETSI)提出了關(guān)于IP網(wǎng)絡(luò)電話QoS的分級要求,如表1.1所示:
表中,MOS為話音質(zhì)量的主觀評測分,最高分為5分。在話音通信中,時(shí)延指標(biāo)是主要的,時(shí)延過大會(huì)使聽話者有不連續(xù)的感覺,而時(shí)延抖動(dòng)是次要的,聽話音對此感覺不很靈敏。
1.低比特率話音編碼
話音編碼算法需要考慮三個(gè)方面的問題:編碼比特率、話音質(zhì)量和算法復(fù)雜度,一般說來這些指標(biāo)是有矛盾的。比特率越低,線路利用率越高,但話音質(zhì)量會(huì)受到影響;在同樣比特率情況下,算法設(shè)計(jì)越復(fù)雜,話音質(zhì)量會(huì)有所提高,但處理時(shí)延將增加。因此,制訂一個(gè)編碼標(biāo)準(zhǔn),首先必需確定其應(yīng)用環(huán)境,據(jù)此給出其性能要求,然后才能設(shè)計(jì)出編碼方案和算法,實(shí)際上就是在上述三個(gè)指標(biāo)中取得某種折衷。
目前在PSTN中廣泛應(yīng)用的是PCM話音編碼,其比特率為64-kbit/s,話音采樣頻率是8kHz。它屬于波形編碼類型。一般說來,這類編碼的最低比特率為32khit/s,即ADPCM。若要進(jìn)一步降低其比特率,特別是低于16kbit/s的低比特率編碼方案,必須采用新的編碼原理,這就是參數(shù)編碼,又稱作聲碼器(Vocoder)技術(shù)。它是通過模擬人的發(fā)聲器官,提取模型參數(shù)來降低話音信息編碼率的。這種技術(shù)雖然早就提出,但是由于其算法太復(fù)雜未能實(shí)用。直至90年代,微電子業(yè)研制出了高性能的數(shù)字信號處理(DSP)專用芯片,其定點(diǎn)運(yùn)算能力可高達(dá)幾十個(gè)MIPS,才使聲碼器技術(shù)得以實(shí)際應(yīng)用。首先廣泛使用的是第二代移動(dòng)通信系統(tǒng),其比特率為2.4-13kbit/s。IP網(wǎng)絡(luò)電話推薦使用ITU-T定義的低比特率編碼標(biāo)準(zhǔn),其比特率為5.3-16kbit/s,均為中低復(fù)雜度編碼算法,話音分組長度在30ms以下,話音質(zhì)量較好。
2.靜音檢測
靜音檢測又稱話音活動(dòng)性檢測(VAI)--VoiceActivityDetection),它是一種靜音壓縮技術(shù)。
在電話通信中,平均說來,每一方說話的時(shí)間和聽對方說話的時(shí)間大體上各占一半,即使在說話時(shí)也還有停頓間隙,因此任一方對線路的占用率,也就是話音活動(dòng)度大約只有40%左右。在電路交換中,即使通話者不說話,也要占用64-kbit/s的信道;在分組交換中,由于傳輸通道是統(tǒng)計(jì)復(fù)用的,因此在通話者不講話時(shí)就可以不發(fā)送話音分組,從而進(jìn)一步降低話音比特率。這一技術(shù)的關(guān)鍵就是如何檢測說話者處于不發(fā)聲狀態(tài),即VAD。檢測的基本原理是判斷話音信號能量,當(dāng)?shù)陀谝欢ㄩT限值就認(rèn)為是靜默狀態(tài)。
靜音檢測有兩個(gè)技術(shù)難點(diǎn)。一是如何在噪聲較大的環(huán)境中檢測靜音,二是"剪音"(clipping)問題。所謂剪音指的是話音還原時(shí)有一部分被剪切掉了,使人感到失真。其原因是通話者從說話到靜默以及從靜默到說話的檢測都是要有一定時(shí)間和一定判定門限的,因此當(dāng)通話者從靜默剛剛轉(zhuǎn)為說話時(shí),開始一段微弱話音部分就可能被作為靜默而丟棄了。解決這一問題的方法是在一組突發(fā)話音分組前增加一個(gè)話音分組進(jìn)行平滑,話音突發(fā)后沿剪音也可用同樣方法解決。
在實(shí)際使用中還有一個(gè)問題,如果靜音期不發(fā)任何分組,即完全無聲,收聽者反而會(huì)感到不自然,因此實(shí)用的靜音壓縮算法由兩部分組成:
.話音活動(dòng)性檢測器(VAD):制定輸入信號是話音還是背景噪聲。如果信號被確認(rèn)為話音,就以編碼算法規(guī)定的固定比特率對其編碼;如果信號被確認(rèn)為噪聲,就以非常低的比特率對其編碼,或者根本就不發(fā)送任何比特。
·舒適噪聲生成器(CNG):接收方采用某種機(jī)制重構(gòu)背景噪聲的主要特征。噪聲生成方法的設(shè)計(jì)必須保證解碼器和編碼器之間的同步;即使在某段時(shí)間內(nèi)編碼器未發(fā)出任何比特,解碼器也能正確理解,使得復(fù)原后話音的有音段和無音段之間有平滑的過渡。
3.分組丟失補(bǔ)償
在IP網(wǎng)絡(luò)中分組丟失是不可避免的,丟失的原因可能是線路誤碼或者網(wǎng)絡(luò)路由故障,更常見的原因則是傳輸時(shí)延過長或網(wǎng)絡(luò)擁塞導(dǎo)致分組被丟棄。由于低比特率聲碼器都是基于線性預(yù)測編碼原理,其當(dāng)前值是通過以前歷史值線性組合而得,因此通過內(nèi)插的方法不難得到丟失分組的近似估計(jì)值。mJ-T定義的標(biāo)準(zhǔn)編碼的解碼器部分都已包含分組丟失補(bǔ)償這一功能。實(shí)際試驗(yàn)表明,如果Internet電話話音分組丟失兩個(gè)以上,則可能此時(shí)網(wǎng)絡(luò)連接狀態(tài)很差,將會(huì)有一大堆分組丟失。所以Internet電話分組丟失補(bǔ)償以處理一個(gè)分組丟失為主要目的。所幸的是,話音通信對分組丟失的容忍性遠(yuǎn)比數(shù)據(jù)通信強(qiáng),一般不會(huì)影響通話的可懂度。
4.回波抵消