在线永久免费观看丝袜黄网站-凹凸国产熟女精品视频国语-日韩亚洲午夜精品一区二区三区-日韩欧美国产另类一区二区

<i id="7uh7n"></i>

返回欄目

智慧醫(yī)院 > 新聞資訊 >

醫(yī)院排隊叫號大屏系統(tǒng)廠家-預測語音

2023-10-20 12:07

釋放雙眼，帶上耳機，聽聽看~！

00:00

00:00

當輸入模擬波形是調(diào)制解調(diào)器信號、傳真機信號或任意語音時，采用波形編碼的效果最好。波形的形狀越多，變化越?jīng)]規(guī)律，就越有必要在量化噪聲限制范圍內(nèi)盡可能貼切地模擬輸入波形。

不過，如果假定輸入波形僅限于人的語音，為了進一步降低必需的數(shù)字語音比特率，還能除去更多的冗余嗎？事實上，在語音中還有許多冗余，根據(jù)這一特性，在語音數(shù)字化過程中可以使其速率降至2.4kbit/s。
聲碼器：對于模擬波形的信源特點人們作出了特定的假設，這些假定有：人的語音完全由清音和濁音組成，而且濁音和清音都有各自持續(xù)的時，間；不可能成串地出現(xiàn)許多清音和濁音；濁音中含有被稱作“音程”的重復，形式，等等。根據(jù)這些假設，產(chǎn)生了被稱為“源編碼”的語音編碼技術(shù)。

這些特點使我們能夠?qū)φZ音進行預測。換句話說，如果一個說話人正在發(fā)出濁音，那么他（或她）很快就會發(fā)出清音。一旦有一個音程被檢測出，就有理由預測它會重復出現(xiàn)三到四次。源編碼或混合編碼的實質(zhì)就在于對語音進行預測，如今這兩種編碼方法都在VoIP中得到普遍運用。采用源編碼或混合編碼的設備稱作語音編碼器或簡稱為聲碼器。采用聲碼器這一名詞是為了表明這種方法僅適用于語音的數(shù)字化，要復制任意的波形，就得采用編碼解碼器。

在實踐中，預測編碼把語音波形描述為帶有數(shù)個參數(shù)的模型。人們根據(jù)預測編碼的特定規(guī)則設計出某種預測算法，信源和信宿的語音編碼器都采用這一算法。發(fā)端和收端之間所要傳送的是預測波形，與實際波形不同（不過有可能出現(xiàn)這種情況：當我們以為說話人會停止發(fā)出清音時，他們不但沒有停下，反而繼續(xù)發(fā)出清音?。?。只要預測器能夠很好地模擬說話人的發(fā)音機制，就可用許多參數(shù)值來表示這種體現(xiàn)波形差異的信息，從而天大減少發(fā)送語音的比特數(shù)。

既然源編碼有利于增加網(wǎng)絡的容量，為什么多年前不使用它呢？這是因為聲碼器的成本較高，把它縮減比特長度的優(yōu)點給抵銷了。波形編碼簡單而快捷，源編碼卻不然，它必須對輸入波形進行分析，還必須調(diào)整和發(fā)送參數(shù)。預測是發(fā)送器和接收器的基礎，它必需連續(xù)地工作并在發(fā)送器和接收器之間保持同步。所有這些需要大容量存儲器，對聲碼器芯片的處理能力要求很高，而且聲碼器中的軟件相當復雜。

直到80年代后期，聲碼器技術(shù)一直都很昂貴而且原始。聲碼器產(chǎn)生的聲音盡管清晰可懂，但聽起來卻很機械化且感覺是人工合成的。得克薩斯儀器公司的老式“說話拼讀”玩具內(nèi)有一個芯片式的聲碼器，一按按鈕，它就會把存在存儲器中的比特以語音的形式發(fā)送出來。但是，除非迫不得以，沒有人會愿意在電話中用那種方式交談。

現(xiàn)有幾種形式的聲碼器，它們都假定語音通過一個線性系統(tǒng)（例如，個輸出等于輸入疊加的系統(tǒng)就是線性系統(tǒng)）產(chǎn)生，且人的聲道正是這樣個系統(tǒng)。線性系統(tǒng)不時地受到一系列脈沖的激勵，它根據(jù)音程來判斷輸入的聲音是不是語音。

所有的線性系統(tǒng)都用不同的技術(shù)來模仿人的聲道及其參數(shù)，所采用技術(shù)的不同形成了不同的聲碼器。但是它們的目的都是產(chǎn)生比特流，使得聲音聽起來與聲源差不多，而不關心輸出波形與輸入波形到底有幾分相似（這正是聲碼器聽起來很不自然，卻仍舊好懂的原因）。發(fā)送器分析輸入的語，音并決定模型參數(shù)和激勵，接收器則合成語音。

聲碼器質(zhì)量不盡如人意是因為所用的算法性能簡單。所有的聲音不是高幅就是低幅，在兩者之間卻什么也沒有。更糟的是，人耳對濁音的音高十分敏感，但是所有的聲碼器的注意力都集中在音程上，且至今也未令人滿意地解決好音程這個問題。聲碼器對差錯很敏感，這些差錯是由于聲道模型參數(shù)的計算問題，以及線路上的比特差錯而產(chǎn)生的。

在語音和音樂合成器中都使用聲碼器，但這里的討論只限于它在電話中的應用。關于聲碼器的構(gòu)思早在1939年就有了，但只是簡單的通道聲碼器；與此同時，數(shù)字語音也誕生了。注意到耳朵對較小的相位失真并不敏感，信道聲碼器把語音分成20ms長的一些小段，它只關心各段的幅度大小，最后產(chǎn)生2.4kbit/s的語音。對這種聲碼器改進后形成同型性聲碼器，它把音高信息加入了幅度之中，付出的代價是把比特率提高到4kbit/so如果芯片處理能力有了質(zhì)的飛躍，還有一種共振峰聲碼器來處理語音，理論上可以獲得1kbit/s或更低速率的語音。就有如語音的音程一樣，共振峰也是語音的一個特征。然而，在實際中難以精確地測定語音共振峰，這使得共振峰聲碼器很難普及。

上一篇：醫(yī)護呼叫對講系統(tǒng)廠家-語音質(zhì)量的說明; 返回
下一篇：ICU探視方案系統(tǒng)廠家-X.25分組交換

全國熱線

400-6333-661

售前電話

135-3656-7657

全國熱線 : 400-6333-661

售前電話 : 135-3656-7657

總部地址

廣東省珠海市香洲區(qū)金鼎工業(yè)園金恒一路9號1棟

熱推信息 | 企業(yè)分站

網(wǎng)站地圖 | RSS | TAG標簽

微信客服
瀏覽更多產(chǎn)品 >