1. <rt id="e600n"></rt>
      1. <pre id="e600n"><strong id="e600n"><pre id="e600n"></pre></strong></pre>
      2. 岛国免费AV,无码人妻精品一区二区三区夜夜嗨,又大又粗又硬又爽黄毛少妇,精品国产AV二区,91视频最新网址,久操无码,久久无码人妻一区二区三区午夜,国产精品视频中文字幕

        語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備、方法和系統(tǒng)的制作方法

        文檔序號(hào):2828086研發(fā)日期:2014年閱讀:177來(lái)源:國(guó)知局
        技術(shù)簡(jiǎn)介:
        本專利提出一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備及方法,通過(guò)對(duì)比用戶語(yǔ)音與參考語(yǔ)音的韻律特征差異,解決傳統(tǒng)語(yǔ)音評(píng)估中無(wú)法精準(zhǔn)量化韻律表現(xiàn)的問題。該方法利用聲學(xué)模型實(shí)現(xiàn)語(yǔ)音與文本的強(qiáng)制對(duì)齊,提取基頻信息并進(jìn)行多項(xiàng)式擬合,最終計(jì)算語(yǔ)音質(zhì)量相關(guān)性,提升語(yǔ)音識(shí)別、教學(xué)等場(chǎng)景的評(píng)估精度。
        關(guān)鍵詞:語(yǔ)音質(zhì)量評(píng)價(jià),韻律特征,參考語(yǔ)音
        語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備、方法和系統(tǒng)的制作方法
        【專利摘要】本發(fā)明提供了一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備、方法和系統(tǒng),數(shù)據(jù)處理設(shè)備和方法,語(yǔ)音處理設(shè)備和方法,以及移動(dòng)終端,以克服現(xiàn)有的語(yǔ)音技術(shù)在評(píng)價(jià)用戶的發(fā)音情況時(shí)未考慮有關(guān)語(yǔ)音韻律的信息的問題。語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備包括:存儲(chǔ)單元,適于存儲(chǔ)預(yù)定文本和預(yù)定文本對(duì)應(yīng)的參考韻律特征,該預(yù)定文本包括一個(gè)或者多個(gè)語(yǔ)句,且每個(gè)語(yǔ)句包括一個(gè)或者多個(gè)詞;用戶語(yǔ)音接收單元,適于接收用戶針對(duì)預(yù)定文本所錄入的用戶語(yǔ)音;特征獲取單元,適于獲取用戶語(yǔ)音的用戶韻律特征;以及語(yǔ)音質(zhì)量計(jì)算單元,適于基于參考韻律特征與用戶韻律特征之間的相關(guān)性,計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量。本發(fā)明的上述技術(shù)可應(yīng)用于語(yǔ)音【技術(shù)領(lǐng)域】。
        【專利說(shuō)明】語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備、方法和系統(tǒng)

        【技術(shù)領(lǐng)域】
        [0001]本發(fā)明涉及語(yǔ)音【技術(shù)領(lǐng)域】,尤其涉及一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備、方法和系統(tǒng),數(shù)據(jù)處理設(shè)備和方法,語(yǔ)音處理設(shè)備和方法,以及移動(dòng)終端。

        【背景技術(shù)】
        [0002]隨著互聯(lián)網(wǎng)的發(fā)展,基于互聯(lián)網(wǎng)的語(yǔ)言學(xué)習(xí)應(yīng)用也得到了快速的發(fā)展。在一些語(yǔ)言學(xué)習(xí)應(yīng)用中,應(yīng)用提供商通過(guò)互聯(lián)網(wǎng)將學(xué)習(xí)材料發(fā)送到客戶端,用戶經(jīng)由客戶端獲取學(xué)習(xí)材料,并根據(jù)學(xué)習(xí)材料的指示而在客戶端上進(jìn)行操作,例如輸入文字、輸入語(yǔ)音或者進(jìn)行選擇等,并獲得反饋,從而提高自己的語(yǔ)言能力。
        [0003]對(duì)于語(yǔ)言學(xué)習(xí),除了學(xué)習(xí)語(yǔ)法和詞匯等之外,一個(gè)重要的方面是學(xué)習(xí)語(yǔ)言的聽說(shuō)能力,尤其是說(shuō)的能力。對(duì)于每種語(yǔ)言來(lái)說(shuō),會(huì)根據(jù)不同的場(chǎng)景而在說(shuō)話時(shí)具有不同的說(shuō)話韻律。這里,韻律是指對(duì)發(fā)音抑揚(yáng)頓挫的表示,既可以針對(duì)整句話確定句子的韻律(下文中稱為說(shuō)話韻律),也可以針對(duì)每個(gè)詞確定詞的韻律(下文中稱為發(fā)音韻律)。因此,用戶在學(xué)習(xí)用該語(yǔ)言說(shuō)話時(shí),還需要學(xué)習(xí)這種說(shuō)話韻律和/或發(fā)音韻律。
        [0004]在現(xiàn)有的語(yǔ)音技術(shù)中,用戶通過(guò)客戶端的錄音設(shè)備錄制語(yǔ)音,系統(tǒng)根據(jù)與該語(yǔ)音相對(duì)應(yīng)的文本,對(duì)用戶錄制的語(yǔ)音進(jìn)行拆分,并逐個(gè)單詞地就用戶的語(yǔ)音和現(xiàn)有聲學(xué)模型進(jìn)行比較,從而向用戶提供該單詞讀音是否正確的反饋。然而,現(xiàn)有的語(yǔ)音技術(shù)在評(píng)價(jià)用戶的發(fā)音情況時(shí)并未考慮有關(guān)語(yǔ)音韻律方面的任何信息,因此也不能夠讓學(xué)習(xí)者學(xué)習(xí)說(shuō)話和/或發(fā)音的韻律。


        【發(fā)明內(nèi)容】

        [0005]在下文中給出了關(guān)于本發(fā)明的簡(jiǎn)要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡(jiǎn)化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
        [0006]鑒于此,本發(fā)明提供了一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備、方法和系統(tǒng),數(shù)據(jù)處理設(shè)備和方法,語(yǔ)音處理設(shè)備和方法,以及移動(dòng)終端,以至少解決現(xiàn)有的語(yǔ)音技術(shù)在評(píng)價(jià)用戶的發(fā)音情況時(shí)未考慮有關(guān)語(yǔ)音韻律的信息的問題。
        [0007]根據(jù)本發(fā)明的一個(gè)方面,提供了一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,該設(shè)備包括:存儲(chǔ)單元,適于存儲(chǔ)預(yù)定文本和預(yù)定文本對(duì)應(yīng)的參考韻律特征,該預(yù)定文本包括一個(gè)或者多個(gè)語(yǔ)句,且每個(gè)語(yǔ)句包括一個(gè)或者多個(gè)詞;用戶語(yǔ)音接收單元,適于接收用戶針對(duì)預(yù)定文本所錄入的用戶語(yǔ)音;特征獲取單元,適于獲取用戶語(yǔ)音的用戶韻律特征;以及語(yǔ)音質(zhì)量計(jì)算單元,適于基于參考韻律特征與用戶韻律特征之間的相關(guān)性,計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量。
        [0008]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種數(shù)據(jù)處理設(shè)備,該設(shè)備適于在服務(wù)器中執(zhí)行,并包括:服務(wù)器存儲(chǔ)單元,適于存儲(chǔ)預(yù)定文本以及與預(yù)定文本對(duì)應(yīng)的參考語(yǔ)音;以及韻律計(jì)算單元,適于計(jì)算參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,并將所獲得的各個(gè)分段多項(xiàng)式與預(yù)定文本中的每個(gè)語(yǔ)句相關(guān)聯(lián)地保存在服務(wù)器存儲(chǔ)單元中,或根據(jù)所獲得的各個(gè)分段多項(xiàng)式計(jì)算參考語(yǔ)音的參考韻律特征并將該參考韻律特征保存在服務(wù)器存儲(chǔ)單元中。
        [0009]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種語(yǔ)音處理設(shè)備,該設(shè)備適于在計(jì)算機(jī)中執(zhí)行,并包括:參考語(yǔ)音接收單元,適于接收特定用戶針對(duì)預(yù)定文本所錄入的語(yǔ)音作為參考語(yǔ)音,并將參考語(yǔ)音發(fā)送給預(yù)定服務(wù)器;以及韻律計(jì)算單元,適于計(jì)算參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,以將獲得的各個(gè)分段多項(xiàng)式與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器,或根據(jù)獲得的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征,以將參考韻律特征與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器。
        [0010]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)方法,該方法包括如下步驟:接收用戶針對(duì)預(yù)定文本所錄入的用戶語(yǔ)音,該預(yù)定文本包括一個(gè)或者多個(gè)語(yǔ)句,且每個(gè)語(yǔ)句包括一個(gè)或者多個(gè)詞;獲取用戶語(yǔ)音的用戶韻律特征;以及基于預(yù)定文本對(duì)應(yīng)的參考韻律特征與用戶韻律特征之間的相關(guān)性,計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量。
        [0011]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種數(shù)據(jù)處理方法,該方法適于在服務(wù)器中執(zhí)行,并包括如下步驟:存儲(chǔ)預(yù)定文本和與預(yù)定文本對(duì)應(yīng)的參考語(yǔ)音;以及計(jì)算參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,并將所計(jì)算的各個(gè)分段多項(xiàng)式與預(yù)定文本中的每個(gè)語(yǔ)句相關(guān)聯(lián)地存儲(chǔ),或根據(jù)所計(jì)算的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征并保存該參考韻律特征。
        [0012]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種語(yǔ)音處理方法,該方法適于在計(jì)算機(jī)中執(zhí)行,并包括如下步驟:接收特定用戶針對(duì)預(yù)定文本所錄入的語(yǔ)音作為參考語(yǔ)音,并將參考語(yǔ)音發(fā)送給預(yù)定服務(wù)器;以及計(jì)算參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,以將計(jì)算到的各個(gè)分段多項(xiàng)式與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器,或根據(jù)計(jì)算到的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征,以將參考韻律特征與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器。
        [0013]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種移動(dòng)終端,包括如上所述的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備。
        [0014]根據(jù)本發(fā)明的又一個(gè)方面,還提供了一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)系統(tǒng),包括如上所述的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備和如上所述的數(shù)據(jù)處理設(shè)備。
        [0015]上述根據(jù)本發(fā)明實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)方案,其基于獲取的用戶語(yǔ)音的用戶韻律特征和參考韻律特征之間的相關(guān)性,來(lái)計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量,能夠獲得至少以下益處之一:在計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量的過(guò)程中考慮了有關(guān)語(yǔ)音韻律的信息,能夠使用戶根據(jù)計(jì)算結(jié)果來(lái)獲知自己所錄制的語(yǔ)音在韻律方面的準(zhǔn)確度,進(jìn)而有利于用戶判斷是否需要糾正自己的說(shuō)話韻律和/或發(fā)音韻律;對(duì)用戶語(yǔ)音的計(jì)算和評(píng)價(jià)在客戶端計(jì)算機(jī)或客戶端移動(dòng)終端上完成,使用戶可以進(jìn)行離線學(xué)習(xí);計(jì)算量較??;節(jié)省時(shí)間;操作更加簡(jiǎn)單、方便;以及當(dāng)用戶韻律特征的表示形式改變時(shí),能夠方便地將根據(jù)參考語(yǔ)音的韻律信息所計(jì)算的參考韻律特征表示成與用戶韻律特征相同的形式,使得語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備的處理更加靈活、方便,實(shí)用性更強(qiáng)。
        [0016]通過(guò)以下結(jié)合附圖對(duì)本發(fā)明的最佳實(shí)施例的詳細(xì)說(shuō)明,本發(fā)明的這些以及其他優(yōu)點(diǎn)將更加明顯。

        【專利附圖】

        【附圖說(shuō)明】
        [0017]本發(fā)明可以通過(guò)參考下文中結(jié)合附圖所給出的描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標(biāo)記來(lái)表示相同或者相似的部件。所述附圖連同下面的詳細(xì)說(shuō)明一起包含在本說(shuō)明書中并且形成本說(shuō)明書的一部分,而且用來(lái)進(jìn)一步舉例說(shuō)明本發(fā)明的優(yōu)選實(shí)施例和解釋本發(fā)明的原理和優(yōu)點(diǎn)。在附圖中:
        [0018]圖1是示意性地示出移動(dòng)終端100的結(jié)構(gòu)框圖;
        [0019]圖2是示意性地示出根據(jù)本發(fā)明一個(gè)實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200的一種示例性結(jié)構(gòu)的框圖;
        [0020]圖3是示意性地示出圖2所示的特征獲取單元230的一種可能結(jié)構(gòu)的框圖;
        [0021]圖4是示意性地示出根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備400的一種示例性結(jié)構(gòu)的框圖;
        [0022]圖5是示意性地示出根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)處理設(shè)備500的一種示例性結(jié)構(gòu)的框圖;
        [0023]圖6是示意性地示出根據(jù)本發(fā)明一個(gè)實(shí)施例的語(yǔ)音處理設(shè)備600的一種示例性結(jié)構(gòu)的框圖;
        [0024]圖7是示意性地示出根據(jù)本發(fā)明的實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)方法的一種示例性處理的流程圖;
        [0025]圖8是示意性地示出根據(jù)本發(fā)明的實(shí)施例的數(shù)據(jù)處理方法的一種示例性處理的流程圖;
        [0026]圖9是示意性地示出根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音處理方法的一種示例性處理的流程圖;以及
        [0027]圖10是示意性地示出根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音處理方法的另一種示例性處理的流程圖。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,附圖中的元件僅僅是為了簡(jiǎn)單和清楚起見而示出的,而且不一定是按比例繪制的。例如,附圖中某些元件的尺寸可能相對(duì)于其他元件放大了,以便有助于提高對(duì)本發(fā)明實(shí)施例的理解。

        【具體實(shí)施方式】
        [0028]在下文中將結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施例進(jìn)行描述。為了清楚和簡(jiǎn)明起見,在說(shuō)明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施例的過(guò)程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與系統(tǒng)及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會(huì)隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時(shí)的,但對(duì)得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來(lái)說(shuō),這種開發(fā)工作僅僅是例行的任務(wù)。
        [0029]在此,還需要說(shuō)明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。
        [0030]本發(fā)明的實(shí)施例提供了一種語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,該設(shè)備包括:存儲(chǔ)單元,適于存儲(chǔ)預(yù)定文本和所述預(yù)定文本對(duì)應(yīng)的參考韻律特征,該預(yù)定文本包括一個(gè)或者多個(gè)語(yǔ)句,且每個(gè)語(yǔ)句包括一個(gè)或者多個(gè)詞;用戶語(yǔ)音接收單元,適于接收用戶針對(duì)所述預(yù)定文本所錄入的用戶語(yǔ)音;特征獲取單元,適于獲取所述用戶語(yǔ)音的用戶韻律特征;以及語(yǔ)音質(zhì)量計(jì)算單元,適于基于所述參考韻律特征與所述用戶韻律特征之間的相關(guān)性,計(jì)算所述用戶語(yǔ)音的語(yǔ)音質(zhì)量。
        [0031]根據(jù)本發(fā)明的實(shí)施例的上述基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備可以是在傳統(tǒng)的桌面型或者膝上型計(jì)算機(jī)(未示出)等中執(zhí)行處理的應(yīng)用,也可以是在移動(dòng)終端(如圖1所示)中執(zhí)行處理的客戶端應(yīng)用(如圖1所示的移動(dòng)終端100中的應(yīng)用154的一種),或者也可以是在上述傳統(tǒng)的桌面型、膝上型計(jì)算機(jī)用戶或移動(dòng)終端上通過(guò)瀏覽器來(lái)訪問的網(wǎng)頁(yè)應(yīng)用坐寸ο
        [0032]圖1是移動(dòng)終端100的結(jié)構(gòu)框圖。具有多點(diǎn)觸摸能力的移動(dòng)終端100可以包括存儲(chǔ)器接口 102、一個(gè)或多個(gè)數(shù)據(jù)處理器、圖像處理器和/或中央處理單元104,以及外圍接口106。
        [0033]存儲(chǔ)器接口 102、一個(gè)或多個(gè)處理器104和/或外圍接口 106既可以是分立元件,也可以集成在一個(gè)或多個(gè)集成電路中。在移動(dòng)終端100中,各種元件可以通過(guò)一條或多條通信總線或信號(hào)線來(lái)耦合。傳感器、設(shè)備和子系統(tǒng)可以耦合到外圍接口 106,以便幫助實(shí)現(xiàn)多種功能。例如,運(yùn)動(dòng)傳感器110、光傳感器112和距離傳感器114可以耦合到外圍接口106,以方便定向、照明和測(cè)距等功能。其他傳感器116同樣可以與外圍接口 106相連,例如定位系統(tǒng)(例如GPS接收機(jī))、溫度傳感器、生物測(cè)定傳感器或其他感測(cè)設(shè)備,由此可以幫助實(shí)施相關(guān)的功能。
        [0034]相機(jī)子系統(tǒng)120和光學(xué)傳感器122可以用于方便諸如記錄照片和視頻剪輯的相機(jī)功能的實(shí)現(xiàn),其中所述相機(jī)子系統(tǒng)和光學(xué)傳感器例如可以是電荷耦合器件(CCD)或互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)光學(xué)傳感器。
        [0035]可以通過(guò)一個(gè)或多個(gè)無(wú)線通信子系統(tǒng)124來(lái)幫助實(shí)現(xiàn)通信功能,其中無(wú)線通信子系統(tǒng)可以包括射頻接收機(jī)和發(fā)射機(jī)和/或光(例如紅外)接收機(jī)和發(fā)射機(jī)。無(wú)線通信子系統(tǒng)124的特定設(shè)計(jì)和實(shí)施方式可以取決于移動(dòng)終端100所支持的一個(gè)或多個(gè)通信網(wǎng)絡(luò)。例如,移動(dòng)終端100可以包括被設(shè)計(jì)成支持GSM網(wǎng)絡(luò)、GPRS網(wǎng)絡(luò)、EDGE網(wǎng)絡(luò)、W1-Fi或WiMax網(wǎng)絡(luò)以及BlueboothTM網(wǎng)絡(luò)的通信子系統(tǒng)124。
        [0036]音頻子系統(tǒng)126可以與揚(yáng)聲器128以及麥克風(fēng)130相耦合,以便幫助實(shí)施啟用語(yǔ)音的功能,例如語(yǔ)音識(shí)別、語(yǔ)音復(fù)制、數(shù)字記錄和電話功能。
        [0037]I/O子系統(tǒng)140可以包括觸摸屏控制器142和/或一個(gè)或多個(gè)其他輸入控制器144。
        [0038]觸摸屏控制器142可以耦合到觸摸屏146。舉例來(lái)說(shuō),該觸摸屏146和觸摸屏控制器142可以使用多種觸摸感測(cè)技術(shù)中的任何一種來(lái)檢測(cè)與之進(jìn)行的接觸和移動(dòng)或是暫停,其中感測(cè)技術(shù)包括但不局限于電容性、電阻性、紅外和表面聲波技術(shù)。
        [0039]一個(gè)或多個(gè)其他輸入控制器144可以耦合到其他輸入/控制設(shè)備148,例如一個(gè)或多個(gè)按鈕、搖桿開關(guān)、拇指旋輪、紅外端口、USB端口、和/或指示筆之類的指點(diǎn)設(shè)備。一個(gè)或多個(gè)按鈕(未顯不)可以包括用于控制揚(yáng)聲器128和/或麥克風(fēng)130音量的向上/向下按鈕。
        [0040]存儲(chǔ)器接口 102可以與存儲(chǔ)器150相耦合。該存儲(chǔ)器150可以包括高速隨機(jī)存取存儲(chǔ)器和/或非易失性存儲(chǔ)器,例如一個(gè)或多個(gè)磁盤存儲(chǔ)設(shè)備,一個(gè)或多個(gè)光學(xué)存儲(chǔ)設(shè)備,和/或閃存存儲(chǔ)器(例如NAND,N0R)。
        [0041]存儲(chǔ)器150可以存儲(chǔ)操作系統(tǒng)152,例如Android、1S或是Windows Phone之類的操作系統(tǒng)。該操作系統(tǒng)152可以包括用于處理基本系統(tǒng)服務(wù)以及執(zhí)行依賴于硬件的任務(wù)的指令。存儲(chǔ)器150還可以存儲(chǔ)應(yīng)用154。這些應(yīng)用在操作時(shí),會(huì)從存儲(chǔ)器150加載到處理器104上,并在已經(jīng)由處理器104運(yùn)行的操作系統(tǒng)之上運(yùn)行,并利用操作系統(tǒng)以及底層硬件提供的接口實(shí)現(xiàn)各種用戶期望的功能,如即時(shí)通信、網(wǎng)頁(yè)瀏覽、圖片管理等。應(yīng)用可以是獨(dú)立于操作系統(tǒng)提供的,也可以是操作系統(tǒng)自帶的。應(yīng)用154可以包括根據(jù)本發(fā)明的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200。
        [0042]圖2示出了根據(jù)本發(fā)明的實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200的一個(gè)示例。如圖2所示,語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200包括存儲(chǔ)單元210、用戶語(yǔ)音接收單元220、特征獲取單元230以及語(yǔ)音質(zhì)量計(jì)算單元240。
        [0043]如圖2所示,在語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200中,存儲(chǔ)單元210用于存儲(chǔ)預(yù)定文本和與該預(yù)定文本對(duì)應(yīng)的參考韻律特征。預(yù)定文本包括一個(gè)或者多個(gè)語(yǔ)句,且每個(gè)語(yǔ)句包括一個(gè)或者多個(gè)詞。其中,語(yǔ)句中的每個(gè)詞通常可以包括多個(gè)字母或至少一個(gè)文字。
        [0044]根據(jù)一種實(shí)現(xiàn)方式,預(yù)定文本的語(yǔ)言例如是諸如英語(yǔ)之類的、詞由字母構(gòu)成的語(yǔ)言時(shí),預(yù)定文本除了包括一個(gè)或多個(gè)語(yǔ)句、以及每個(gè)語(yǔ)句的一個(gè)或多個(gè)詞這些文本內(nèi)容之夕卜,還可以選擇性地包括每個(gè)詞的音節(jié)和/或音素等信息,以及每個(gè)詞的音節(jié)和/或音素等信息與構(gòu)成該詞的字母之間的對(duì)應(yīng)關(guān)系。
        [0045]需要說(shuō)明的是,雖然以上舉例所描述的為預(yù)定文本的語(yǔ)言是英語(yǔ)的情況,但實(shí)際預(yù)定文本的語(yǔ)言并不限于英語(yǔ),可以是漢語(yǔ)、法語(yǔ)或德語(yǔ)等任意一種語(yǔ)言。
        [0046]根據(jù)一種實(shí)現(xiàn)方式,預(yù)定文本和參考韻律特征可以是預(yù)先從預(yù)定服務(wù)器下載而保存在存儲(chǔ)單元210中的。其中,這里所說(shuō)的預(yù)定服務(wù)器例如可以是下文中結(jié)合圖5所描述的數(shù)據(jù)處理設(shè)備500所駐留的服務(wù)器。這種方式下的計(jì)算量較小,不需要額外花費(fèi)時(shí)間來(lái)計(jì)算參考韻律特征,能夠節(jié)省時(shí)間,操作也更加簡(jiǎn)單、方便。
        [0047]根據(jù)另一種實(shí)現(xiàn)方式,也可以從預(yù)定服務(wù)器預(yù)先下載預(yù)定文本、而并不下載參考韻律特征。在這種實(shí)現(xiàn)方式中,可以從預(yù)定服務(wù)器下載參考語(yǔ)音的特征參數(shù),然后根據(jù)特征參數(shù)來(lái)進(jìn)行計(jì)算,從而獲得參考韻律特征。由此,可以將下載的預(yù)定文本和通過(guò)計(jì)算獲得的參考韻律特征保存在存儲(chǔ)單元210中。在這種方式下,當(dāng)用戶韻律特征的表示形式改變時(shí),能夠方便地將根據(jù)參考語(yǔ)音的特征參數(shù)所計(jì)算的參考韻律特征表示成與用戶韻律特征相同的形式,使得語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200的處理更加靈活、方便,實(shí)用性更強(qiáng)。
        [0048]需要說(shuō)明的是,根據(jù)參考語(yǔ)音的特征參數(shù)來(lái)計(jì)算參考韻律特征的過(guò)程可以參考下文中結(jié)合圖5描述的處理過(guò)程,這里不再詳述。
        [0049]這里,參考語(yǔ)音可以是由特定用戶(例如以預(yù)定文本的語(yǔ)言為母語(yǔ)的用戶、或與預(yù)定文本的語(yǔ)言相關(guān)的專業(yè)語(yǔ)言教師等)預(yù)先針對(duì)該預(yù)定文本錄制的語(yǔ)音。特征參數(shù)可以是關(guān)于一段參考語(yǔ)音的,也可以是關(guān)于多段參考語(yǔ)音的。多段參考語(yǔ)音的參考韻律特征可以是通過(guò)對(duì)各段參考語(yǔ)音的參考韻律特征求平均后獲得的。
        [0050]當(dāng)用戶啟動(dòng)語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200時(shí),如上所述,存儲(chǔ)單元210中已存有上述預(yù)定文本和與該預(yù)定文本對(duì)應(yīng)的參考韻律特征。然后,通過(guò)諸如移動(dòng)終端100的觸摸屏146之類的顯示裝置,向用戶呈現(xiàn)待錄入的語(yǔ)音所對(duì)應(yīng)的文本內(nèi)容(即上述預(yù)定文本),并提示用戶錄制相應(yīng)的語(yǔ)音。這樣,用戶能夠通過(guò)諸如移動(dòng)終端100的麥克風(fēng)130等輸入裝置來(lái)錄入相應(yīng)的語(yǔ)音,作為用戶語(yǔ)音,并由用戶語(yǔ)音接收單元220來(lái)接收該用戶語(yǔ)音。
        [0051]然后,用戶語(yǔ)音接收單元220將其接收到的用戶語(yǔ)音轉(zhuǎn)發(fā)給特征獲取單元230,并由特征獲取單元230來(lái)獲取該用戶語(yǔ)音的用戶韻律特征。
        [0052]圖3示出了特征獲取單元230的一種可能的示例結(jié)構(gòu)。在該示例中,特征獲取單元230可以包括對(duì)齊子單元310和特征計(jì)算子單元320。
        [0053]如圖3所示,對(duì)齊子單元310可以利用預(yù)定聲學(xué)模型(acoustic model)將用戶語(yǔ)音與預(yù)定文本進(jìn)行強(qiáng)制對(duì)齊(force alignment),以確定預(yù)定文本中的每個(gè)詞和/或每個(gè)詞中的每個(gè)音節(jié)和/或每個(gè)音節(jié)的每個(gè)音素與用戶語(yǔ)音的部分之間的對(duì)應(yīng)關(guān)系。
        [0054]一般而言,聲學(xué)模型是通過(guò)大量的母語(yǔ)發(fā)音人的錄音訓(xùn)練而成的,利用聲學(xué)模型可以計(jì)算輸入語(yǔ)音對(duì)應(yīng)于已知文字的可能性,進(jìn)而能夠?qū)⑤斎胝Z(yǔ)音與已知文字進(jìn)行強(qiáng)制對(duì)齊。這里,“輸入語(yǔ)音”可以是用戶語(yǔ)音或者下文中將提到的參考語(yǔ)音,而“已知文字”可以是預(yù)定文本。
        [0055]其中,可以參考http://m1.eng.cam.ac.uk/ ?mjfg/ASRU_talk09.pdf 中的相關(guān)資料來(lái)獲知聲學(xué)模型的相關(guān)技術(shù),以及可以參考http://www.1sip.piconepress.com/projects/speech/software/tutorials/produc t1n/fundamentals/vl.0/sect1n_04/s04_04_p01.html 和 http://www.phon.0x.ac.uk/jcoleman/BAAP_ASR.pdf 中的相關(guān)資料來(lái)獲知強(qiáng)制對(duì)齊的相關(guān)技術(shù),或者也可以利用其他現(xiàn)有技術(shù),這里不再詳述。
        [0056]此外,需要說(shuō)明的是,通過(guò)將用戶語(yǔ)音與預(yù)定文本之間進(jìn)行強(qiáng)制對(duì)齊,可以確定預(yù)定文本中的每個(gè)語(yǔ)句與用戶語(yǔ)音的部分語(yǔ)音(比如某個(gè)語(yǔ)音段)之間的對(duì)應(yīng)關(guān)系,也即,可以在用戶語(yǔ)音中確定與預(yù)定文本中的每個(gè)語(yǔ)句相對(duì)應(yīng)的語(yǔ)音段。
        [0057]除此之外,如上所述,通過(guò)強(qiáng)制對(duì)齊還可以根據(jù)需要來(lái)獲得以下三種對(duì)應(yīng)關(guān)系中的任意一種或多種:預(yù)定文本中的每個(gè)詞與用戶語(yǔ)音的部分語(yǔ)音(比如某個(gè)語(yǔ)音塊)之間的對(duì)應(yīng)關(guān)系;預(yù)定文本中的每個(gè)詞中的每個(gè)音節(jié)與用戶語(yǔ)音的部分語(yǔ)音(比如某個(gè)語(yǔ)音塊)之間的對(duì)應(yīng)關(guān)系;以及預(yù)定文本中的每個(gè)詞中的每個(gè)音節(jié)的每個(gè)音素與用戶語(yǔ)音的部分語(yǔ)音(比如某個(gè)語(yǔ)音塊)之間的對(duì)應(yīng)關(guān)系。
        [0058]這樣,基于對(duì)齊子單元310確定的對(duì)應(yīng)關(guān)系,特征計(jì)算子單元320可以計(jì)算用戶語(yǔ)音的用戶韻律特征。
        [0059]下面,將以預(yù)定文本的語(yǔ)句A為例,來(lái)描述如何計(jì)算語(yǔ)句A在用戶語(yǔ)音中對(duì)應(yīng)的語(yǔ)音段的用戶韻律特征的一個(gè)實(shí)現(xiàn)方式。
        [0060]在該實(shí)現(xiàn)方式中,特征計(jì)算子單元320可以首先提取語(yǔ)句A中每個(gè)詞在用戶語(yǔ)音中所對(duì)應(yīng)的語(yǔ)音塊的基頻信息。
        [0061]例如,特征計(jì)算子單元320可以按單位時(shí)間間隔對(duì)每個(gè)語(yǔ)音塊進(jìn)行分割,這樣,可以將每個(gè)語(yǔ)音塊分割成多個(gè)單位語(yǔ)音片段。然后,對(duì)于每個(gè)語(yǔ)音塊,可以通過(guò)對(duì)該語(yǔ)音塊的多個(gè)單位語(yǔ)音片段進(jìn)行基頻提取來(lái)獲得該語(yǔ)音塊的基頻信息。其中,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),基頻提取的相關(guān)技術(shù)可以根據(jù)公知常識(shí)和/或結(jié)合公開資料來(lái)獲得,或者可以參考 http://www.cs.uregina.ca/Research/Techreports/2003-06.pdf 所提供的文獻(xiàn)獲得,這里不再贅述。
        [0062]然后,特征計(jì)算子單元320可以對(duì)每個(gè)語(yǔ)音塊的基頻信息進(jìn)行平滑處理,例如進(jìn)行中值濾波、隨后進(jìn)行低通濾波(或者進(jìn)行移動(dòng)平均等),以使每個(gè)語(yǔ)音塊的基頻曲線段(即基頻信息)變得平滑。其中,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),平滑處理的相關(guān)技術(shù)可以根據(jù)公知常識(shí)和/或結(jié)合公開資料來(lái)獲得,或者可以參考http://www.ece.ucsb.edu/Faculty/Rabiner/ece259/digital% 20speech % 20pr ocessing % 20course/lectures_new/Lecture_algorithms_fall_2010_6tp.pdf所提供的文獻(xiàn)獲得,這里不再贅述。
        [0063]對(duì)于整個(gè)語(yǔ)句A來(lái)說(shuō),由于各個(gè)詞對(duì)應(yīng)的語(yǔ)音塊之間的部分并沒有基頻存在,所以在平滑處理之后,得到的是一段一段較為平滑的基頻變化曲線,但是各段曲線之間可能存在突然的變化。這樣,可以再通過(guò)特征計(jì)算子單元320對(duì)平滑處理后的各基頻信息進(jìn)行多項(xiàng)式擬合(如B spline fitting, B樣條擬合),從而確定表述整個(gè)語(yǔ)句A的基頻信息的各個(gè)分段多項(xiàng)式的參數(shù)值,也即,確定語(yǔ)句A的基頻信息的各個(gè)分段多項(xiàng)式的表達(dá)式。其中,特征計(jì)算子單元320例如可以以平滑連接每個(gè)語(yǔ)句中每相鄰兩個(gè)詞對(duì)應(yīng)的兩個(gè)語(yǔ)音塊的首尾基頻值為條件來(lái)進(jìn)行上述多項(xiàng)式擬合
        [0064]由此,根據(jù)語(yǔ)句A的基頻信息的各個(gè)分段多項(xiàng)式的表達(dá)式,通過(guò)向其中代入多個(gè)時(shí)間點(diǎn)(例如以單位時(shí)間為間隔的一組時(shí)間點(diǎn)),即可得到關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì)。這樣,特征計(jì)算子單元320可以基于獲得的關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì)來(lái)形成用戶語(yǔ)音的韻律特征。其中,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),多項(xiàng)式擬合的相關(guān)技術(shù)也可以根據(jù)公知常識(shí)和/或結(jié)合公開資料來(lái)獲得,或者可以參考http://en.wikipedia.0rg/wiki/Spline_interpolat1n所提供的文獻(xiàn)獲得,這里不再贅述。
        [0065]例如,假設(shè)以時(shí)間為橫坐標(biāo)(X軸)、基頻值為縱坐標(biāo)(Y軸),將以單位時(shí)間(例如每10_2秒為間隔)的一組時(shí)間點(diǎn)代入到語(yǔ)句A的基頻信息的各個(gè)分段多項(xiàng)式中,得到N(例如100)個(gè)坐標(biāo)對(duì)(xl,yl)、(x2, y2)、……、(xN, yN),則可以將用戶語(yǔ)音的用戶韻律特征表示成{(xl,yl),(x2, y2),......,(xN, yN)}的形式。
        [0066]這樣,語(yǔ)音質(zhì)量計(jì)算單元240可以基于參考韻律特征與用戶韻律特征之間的相關(guān)性,計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量。
        [0067]根據(jù)一種實(shí)現(xiàn)方式,語(yǔ)音質(zhì)量計(jì)算單元240可以基于用戶韻律特征與參考韻律特征之間的相關(guān)性,并根據(jù)該相關(guān)性獲得用于描述用戶語(yǔ)音的語(yǔ)音質(zhì)量的分?jǐn)?shù)。
        [0068]在一個(gè)例子中,語(yǔ)音質(zhì)量計(jì)算單元240可以計(jì)算用戶韻律特征與參考韻律特征之間的相似度,并將該相似度作為描述該用戶語(yǔ)音的語(yǔ)音質(zhì)量的分?jǐn)?shù)。也就是說(shuō),計(jì)算的用戶韻律特征與參考韻律特征之間的相似度越高,用戶語(yǔ)音的語(yǔ)音質(zhì)量也越高。
        [0069]在另一個(gè)例子中,語(yǔ)音質(zhì)量計(jì)算單元240也可以基于用戶韻律特征與參考韻律特征之間的相關(guān)性來(lái)計(jì)算二者之間的距離,并根據(jù)該距離獲得用于描述用戶語(yǔ)音的語(yǔ)音質(zhì)量的分?jǐn)?shù)。例如,可以將計(jì)算得到的距離的倒數(shù)作為描述用戶語(yǔ)音的語(yǔ)音質(zhì)量的分?jǐn)?shù)。也就是說(shuō),計(jì)算的用戶韻律特征與參考韻律特征之間的距離越大,用戶語(yǔ)音的語(yǔ)音質(zhì)量越差。
        [0070]此外,需要說(shuō)明的是,如果存儲(chǔ)單元210中存儲(chǔ)的參考韻律特征未表示成與用戶韻律特征的形式(比如向量的形式)相同的形式,則可以首先將其表示成與之相同的形式,再計(jì)算二者之間的相似度或距離等。
        [0071]另外,還需要說(shuō)明的是,語(yǔ)音質(zhì)量計(jì)算單元240可以逐句計(jì)算用戶韻律特征與參考韻律特征之間的相關(guān)性(即相似度或距離),再逐句獲得用戶語(yǔ)音的質(zhì)量分?jǐn)?shù)(也即依次獲得用戶語(yǔ)音中與預(yù)定文本每個(gè)語(yǔ)句對(duì)應(yīng)的逐個(gè)語(yǔ)音段的質(zhì)量分?jǐn)?shù))。此外,語(yǔ)音質(zhì)量計(jì)算單元240也可以在計(jì)算完整個(gè)用戶語(yǔ)音的用戶韻律特征與參考韻律特征之間的相關(guān)性(即相似度或距離)后,再得到描述整個(gè)用戶語(yǔ)音的質(zhì)量分?jǐn)?shù)。
        [0072]下面結(jié)合圖4來(lái)描述根據(jù)本發(fā)明的實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備的另一個(gè)示例。
        [0073]在如圖4所示的例子中,語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備400除了包括存儲(chǔ)單元410、用戶語(yǔ)音接收單元420、特征獲取單元430以及語(yǔ)音質(zhì)量計(jì)算單元440之外,還包括輸出單元450。其中,圖4所示的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備400中的存儲(chǔ)單元410、用戶語(yǔ)音接收單元420、特征獲取單元430以及語(yǔ)音質(zhì)量計(jì)算單元440可以分別具有與上文中結(jié)合圖2所描述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200中的對(duì)應(yīng)單元相同的結(jié)構(gòu)和功能,并能夠達(dá)到相類似的技術(shù)效果,這里不再贅述。
        [0074]輸出單元450可以可視化輸出語(yǔ)音質(zhì)量的計(jì)算結(jié)果,例如,可以通過(guò)諸如移動(dòng)終端100的觸摸屏146之類的顯示裝置向用戶呈現(xiàn)上述語(yǔ)音質(zhì)量的計(jì)算結(jié)果。
        [0075]根據(jù)一種實(shí)現(xiàn)方式,輸出單元450可以輸出反映語(yǔ)音質(zhì)量的分?jǐn)?shù)來(lái)作為語(yǔ)音質(zhì)量的計(jì)算結(jié)果。
        [0076]例如,輸出單元450可以可視化地輸出(比如逐句輸出)反映用戶語(yǔ)音中與預(yù)定文本每個(gè)語(yǔ)句對(duì)應(yīng)的每個(gè)語(yǔ)音段的語(yǔ)音質(zhì)量的分?jǐn)?shù)。這樣,用戶能夠獲知自己所說(shuō)的每句話的說(shuō)話韻律和/或發(fā)音韻律的準(zhǔn)確性,尤其當(dāng)某一句的分?jǐn)?shù)較低時(shí),用戶能夠立刻意識(shí)到該句的韻律需要糾正,學(xué)習(xí)更有針對(duì)性。
        [0077]又如,輸出單元450可以可視化地輸出反映整個(gè)用戶語(yǔ)音的語(yǔ)音質(zhì)量的分?jǐn)?shù)。這樣,用戶能夠整體感知自己所說(shuō)的一段語(yǔ)音的韻律是否準(zhǔn)確。
        [0078]此外,在其他例子中,輸出單元450也可以同時(shí)可視化地輸出反映用戶語(yǔ)音中與預(yù)定文本每個(gè)語(yǔ)句對(duì)應(yīng)的每個(gè)語(yǔ)音段的語(yǔ)音質(zhì)量的分?jǐn)?shù)、以及反映整個(gè)用戶語(yǔ)音的語(yǔ)音質(zhì)量的分?jǐn)?shù)。
        [0079]根據(jù)另一種實(shí)現(xiàn)方式,輸出單元450可以可視化地輸出用戶韻律特征和參考韻律特征之間的差別來(lái)作為語(yǔ)音質(zhì)量的計(jì)算結(jié)果。
        [0080]例如,輸出單元450可以將用戶韻律特征和參考韻律特征用重疊的曲線、不同顏色來(lái)顯示,以便于用戶看清差別。
        [0081]這樣,通過(guò)輸出單元450的輸出顯示,用戶能夠方便地獲知自己的說(shuō)話韻律和/或發(fā)音韻律與標(biāo)準(zhǔn)語(yǔ)音(即這里的參考語(yǔ)音)的說(shuō)話韻律和/或發(fā)音韻律之間的差別,差別有多大等,從而能夠更有針對(duì)性、更準(zhǔn)確地糾正自己的說(shuō)話韻律和/或發(fā)音韻律。
        [0082]根據(jù)其他實(shí)現(xiàn)方式,輸出單元450也可以同時(shí)可視化地輸出反映語(yǔ)音質(zhì)量的分?jǐn)?shù)以及用戶韻律特征和參考韻律特征之間的差別來(lái)作為語(yǔ)音質(zhì)量的計(jì)算結(jié)果,該實(shí)現(xiàn)方式的具體細(xì)節(jié)可以參考關(guān)于以上兩種實(shí)現(xiàn)方式的描述,這里不再贅述。
        [0083]通過(guò)以上描述可知,上述根據(jù)本發(fā)明的實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,其基于獲取的用戶語(yǔ)音的用戶韻律特征和參考韻律特征之間的相關(guān)性,來(lái)計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量。由于該設(shè)備在計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量的過(guò)程中考慮了有關(guān)語(yǔ)音韻律的信息,因此能夠使用戶根據(jù)計(jì)算結(jié)果來(lái)獲知自己所錄制的語(yǔ)音在韻律方面的準(zhǔn)確度,進(jìn)而有利于用戶判斷是否需要糾正自己的說(shuō)話韻律和/或發(fā)音韻律。
        [0084]此外,上述根據(jù)本發(fā)明的實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備對(duì)應(yīng)于用戶客戶端,其對(duì)用戶語(yǔ)音的計(jì)算和評(píng)價(jià)是在客戶端計(jì)算機(jī)或客戶端移動(dòng)終端上完成的,而現(xiàn)有的語(yǔ)音技術(shù)通常是在服務(wù)器端完成對(duì)用戶語(yǔ)音的計(jì)算和評(píng)價(jià)的,本發(fā)明的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備使用戶可以進(jìn)行離線學(xué)習(xí)(已下載存儲(chǔ)學(xué)習(xí)材料的情況下),而無(wú)需像現(xiàn)有技術(shù)那樣必須進(jìn)行在線學(xué)習(xí)。
        [0085]此外,本發(fā)明的實(shí)施例還提供了一種數(shù)據(jù)處理設(shè)備,該設(shè)備適于在服務(wù)器中執(zhí)行,并包括:服務(wù)器存儲(chǔ)單元,適于存儲(chǔ)預(yù)定文本以及與預(yù)定文本對(duì)應(yīng)的參考語(yǔ)音;以及韻律計(jì)算單元,適于計(jì)算參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,并將所計(jì)算的各個(gè)分段多項(xiàng)式與預(yù)定文本中的每個(gè)語(yǔ)句相關(guān)聯(lián)地保存在服務(wù)器存儲(chǔ)單元中,或根據(jù)所獲得的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征并將該參考韻律特征保存在服務(wù)器存儲(chǔ)單元中。
        [0086]圖5示出了根據(jù)本發(fā)明的實(shí)施例的數(shù)據(jù)處理設(shè)備500的一個(gè)示例。如圖5所示,數(shù)據(jù)處理設(shè)備500包括服務(wù)器存儲(chǔ)單元510和韻律計(jì)算單元520。
        [0087]數(shù)據(jù)處理設(shè)備500例如可以實(shí)現(xiàn)為駐留在服務(wù)器上的應(yīng)用。服務(wù)器例如可以包括web服務(wù)器,其可以利用http協(xié)議和用戶客戶端(例如上文所描述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200或400)進(jìn)行通信,但不受限于此。
        [0088]服務(wù)器存儲(chǔ)單元510可以存儲(chǔ)各種語(yǔ)言學(xué)習(xí)材料的文本材料,即預(yù)定文本。其中,對(duì)于每種語(yǔ)言來(lái)說(shuō),服務(wù)器存儲(chǔ)單元510除了可以存儲(chǔ)預(yù)定文本之外,還可以存儲(chǔ)與預(yù)定文本對(duì)應(yīng)的至少一段參考語(yǔ)音、或者可以從例如下文將要描述的語(yǔ)音處理設(shè)備600等外部設(shè)備接收并存儲(chǔ)至少一段參考語(yǔ)音。
        [0089]應(yīng)當(dāng)理解的是,這里所說(shuō)的預(yù)定文本和上文所說(shuō)的預(yù)定文本類似,除了包括一個(gè)或多個(gè)語(yǔ)句、以及每個(gè)語(yǔ)句的一個(gè)或多個(gè)詞這些文本內(nèi)容之外,還可以選擇性地包括每個(gè)詞的音節(jié)和/或音素等信息(例如預(yù)定文本的語(yǔ)言是諸如英語(yǔ)之類的、詞由字母構(gòu)成的語(yǔ)言時(shí)),以及每個(gè)詞的音節(jié)和/或音素等信息與構(gòu)成該詞的字母之間的對(duì)應(yīng)關(guān)系。
        [0090]根據(jù)一種實(shí)現(xiàn)方式,韻律計(jì)算單元520可以通過(guò)計(jì)算來(lái)獲得參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,并將所獲得的各個(gè)分段多項(xiàng)式與預(yù)定文本中的每個(gè)語(yǔ)句相關(guān)聯(lián)地保存在服務(wù)器存儲(chǔ)單元510中。在這種實(shí)現(xiàn)方式中,在后續(xù)處理中,數(shù)據(jù)處理設(shè)備500可以將其存儲(chǔ)的預(yù)定文本和參考語(yǔ)音對(duì)應(yīng)的各個(gè)分段多項(xiàng)式提供給用戶客戶端(例如上文所描述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200或400)。
        [0091]其中,獲得參考語(yǔ)音對(duì)應(yīng)的分段多項(xiàng)式的過(guò)程可以和上文中所描述的獲得用戶語(yǔ)音對(duì)應(yīng)的分段多項(xiàng)式的過(guò)程相類似,以下將舉例說(shuō)明,并省略了部分相同內(nèi)容的描述。
        [0092]此外,根據(jù)另一種實(shí)現(xiàn)方式,韻律計(jì)算單元520也可以根據(jù)所獲得的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征,并將該參考韻律特征保存在服務(wù)器存儲(chǔ)單元510中。在這種實(shí)現(xiàn)方式中,在后續(xù)處理中,數(shù)據(jù)處理設(shè)備500可以將其存儲(chǔ)的預(yù)定文本和至少一段參考語(yǔ)音的參考韻律特征提供給用戶客戶端(例如上文所描述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200或 400)。
        [0093]其中,至少一段參考語(yǔ)音中的每一段參考語(yǔ)音的參考韻律特征,均可采用與上文中所描述的用戶韻律特征的獲取方式相同的處理方式來(lái)獲得,并能夠達(dá)到相類似的技術(shù)效果,這里不再贅述。
        [0094]此外,本發(fā)明的實(shí)施例還提供了一種語(yǔ)音處理設(shè)備,該設(shè)備適于在計(jì)算機(jī)中執(zhí)行,并包括:參考語(yǔ)音接收單元,適于接收特定用戶針對(duì)預(yù)定文本所錄入的語(yǔ)音作為參考語(yǔ)音,并將參考語(yǔ)音發(fā)送給預(yù)定服務(wù)器;以及韻律計(jì)算單元,適于計(jì)算參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,以將計(jì)算到的各個(gè)分段多項(xiàng)式與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器,或根據(jù)計(jì)算到的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征,以將參考韻律特征與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器。
        [0095]圖6示出了根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音處理設(shè)備600的一個(gè)示例。如圖6所示,語(yǔ)音處理設(shè)備600包括參考語(yǔ)音接收單元610??蛇x地,語(yǔ)音處理設(shè)備還可以包括韻律計(jì)算單元620。
        [0096]如圖6所示,根據(jù)一種實(shí)現(xiàn)方式,當(dāng)語(yǔ)音處理設(shè)備600只包括參考語(yǔ)音接收單元610時(shí),可以通過(guò)參考語(yǔ)音接收單元610來(lái)接收特定用戶(如以預(yù)定文本語(yǔ)言為母語(yǔ)的用戶或與該語(yǔ)言相關(guān)的專業(yè)語(yǔ)言教師等)針對(duì)預(yù)定文本所錄入的語(yǔ)音,作為參考語(yǔ)音,并將參考語(yǔ)音發(fā)送給預(yù)定服務(wù)器(如上文中結(jié)合圖5所描述的數(shù)據(jù)處理設(shè)備500所駐留的服務(wù)器)。
        [0097]此外,根據(jù)另一種實(shí)現(xiàn)方式,當(dāng)語(yǔ)音處理設(shè)備600還可以包括韻律計(jì)算單元620,其可以計(jì)算參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,以將獲得的各個(gè)分段多項(xiàng)式與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器,或根據(jù)獲得的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征,以將參考韻律特征與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器。
        [0098]在實(shí)際應(yīng)用中,語(yǔ)音處理設(shè)備600可以對(duì)應(yīng)于設(shè)置在計(jì)算機(jī)或其他終端上的教師客戶端,例如以軟件實(shí)現(xiàn)。
        [0099]教師客戶端的使用者可以針對(duì)預(yù)定文本中的每個(gè)語(yǔ)句錄制標(biāo)準(zhǔn)語(yǔ)音,以作為參考語(yǔ)音發(fā)送給相應(yīng)的服務(wù)器端,由服務(wù)器端執(zhí)行后續(xù)處理。這種情況下,可以方便服務(wù)器通過(guò)互聯(lián)網(wǎng)采集參考語(yǔ)音,而不需參與錄制語(yǔ)音的處理,能夠節(jié)省時(shí)間和操作。
        [0100]此外,教師客戶端也可以直接在本地對(duì)其錄制的標(biāo)準(zhǔn)語(yǔ)音(即參考語(yǔ)音)進(jìn)行處理分析,生成與該標(biāo)準(zhǔn)語(yǔ)音相對(duì)應(yīng)的參數(shù)(如參考韻律特征),并連同預(yù)定文本一起傳輸?shù)椒?wù)器端存儲(chǔ),從而能夠減少服務(wù)器端的處理負(fù)載。
        [0101]另外,本發(fā)明的實(shí)施例還提供了一種移動(dòng)終端,包括如上所述的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備。該移動(dòng)終端例如可以是手機(jī)(如智能手機(jī))或平板電腦等移動(dòng)通信設(shè)備。此外,該移動(dòng)終端可以具有上述基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備所具有的功能,并能夠達(dá)到相類似的技術(shù)效果,這里不再詳述。
        [0102]此外,本發(fā)明的實(shí)施例還提供了一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)系統(tǒng),該系統(tǒng)包括如上所述的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200或400和如上所述的數(shù)據(jù)處理設(shè)備500。
        [0103]根據(jù)一種實(shí)現(xiàn)方式,上述基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)系統(tǒng)除了包括上述語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200或400和上述數(shù)據(jù)處理設(shè)備500之外,還可以選擇性地包括如上所述的語(yǔ)音處理設(shè)備600。在這種實(shí)現(xiàn)方式中,語(yǔ)音質(zhì)量評(píng)價(jià)系統(tǒng)中的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備200或400可以對(duì)應(yīng)于設(shè)置于計(jì)算機(jī)或移動(dòng)終端中的用戶客戶端,數(shù)據(jù)處理設(shè)備500可以對(duì)應(yīng)于設(shè)置于服務(wù)器端,而語(yǔ)音處理設(shè)備600可以對(duì)應(yīng)于教師客戶端。在實(shí)際處理中,教師客戶端可以向服務(wù)器端提供參考語(yǔ)音(可選地還可以提供參考語(yǔ)音的特征參數(shù)或參考韻律特征),服務(wù)器用于存儲(chǔ)這些信息和預(yù)定文本,而用戶客戶端則可以從服務(wù)器下載這些信息來(lái)分析用戶輸入的用戶語(yǔ)音,以對(duì)其完成語(yǔ)音質(zhì)量評(píng)價(jià)。處理的細(xì)節(jié)可以分別參考以上結(jié)合圖2或4、圖5以及圖6所給出的描述,這里不再贅述。
        [0104]此外,本發(fā)明的實(shí)施例還提供了一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)方法,該方法包括如下步驟:接收用戶針對(duì)預(yù)定文本所錄入的用戶語(yǔ)音,該預(yù)定文本包括一個(gè)或者多個(gè)語(yǔ)句,且每個(gè)語(yǔ)句包括一個(gè)或者多個(gè)詞;獲取用戶語(yǔ)音的用戶韻律特征;以及基于預(yù)定文本對(duì)應(yīng)的參考韻律特征與用戶韻律特征之間的相關(guān)性,計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量。
        [0105]下面結(jié)合圖7來(lái)描述上述基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)方法的一種示例性處理。如圖7所示,根據(jù)本發(fā)明一個(gè)實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)方法的示例性處理流程700開始于步驟S710,然后,執(zhí)行步驟S720。
        [0106]在步驟S720中,接收用戶針對(duì)預(yù)定文本所錄入的用戶語(yǔ)音,該預(yù)定文本包括一個(gè)或者多個(gè)語(yǔ)句,且每個(gè)語(yǔ)句包括一個(gè)或者多個(gè)詞。然后,執(zhí)行步驟S730。其中,步驟S720中的處理例如可以與上文中結(jié)合圖2所描述的用戶語(yǔ)音接收單元220的處理相同,并能夠達(dá)到相類似的技術(shù)效果,在此不再贅述。
        [0107]根據(jù)一種實(shí)現(xiàn)方式,預(yù)定文本和參考韻律特征是預(yù)先從預(yù)定服務(wù)器下載獲得的。
        [0108]根據(jù)另一種實(shí)現(xiàn)方式,預(yù)定文本是預(yù)先從預(yù)定服務(wù)器下載獲得的,而參考韻律特征是利用與預(yù)定文本的各語(yǔ)句對(duì)應(yīng)的參考語(yǔ)音的各語(yǔ)音段的基頻曲線的、從預(yù)定服務(wù)器預(yù)先下載的分段多項(xiàng)式計(jì)算獲得的。
        [0109]在步驟S730中,獲取用戶語(yǔ)音的用戶韻律特征。然后,執(zhí)行步驟S740。其中,步驟S730中的處理例如可以與上文中結(jié)合圖2所描述的特征獲取單元230的處理相同,并能夠達(dá)到相類似的技術(shù)效果,在此不再贅述。
        [0110]根據(jù)一種實(shí)現(xiàn)方式,在步驟S730中,例如可以利用預(yù)定聲學(xué)模型將用戶語(yǔ)音與預(yù)定文本進(jìn)行強(qiáng)制對(duì)齊,以確定預(yù)定文本中的每個(gè)詞和/或每個(gè)詞中的每個(gè)音節(jié)和/或每個(gè)音節(jié)的每個(gè)音素與用戶語(yǔ)音的部分之間的對(duì)應(yīng)關(guān)系,并基于對(duì)應(yīng)關(guān)系獲得用戶語(yǔ)音的用戶韻律特征。
        [0111]其中,“基于對(duì)應(yīng)關(guān)系獲得用戶語(yǔ)音的用戶韻律特征”的步驟例如可以通過(guò)如下處理來(lái)實(shí)現(xiàn):針對(duì)預(yù)定文本的每個(gè)語(yǔ)句:提取語(yǔ)句中每個(gè)詞在用戶語(yǔ)音中所對(duì)應(yīng)的語(yǔ)音塊的基頻信息;對(duì)每個(gè)語(yǔ)音塊的基頻信息進(jìn)行平滑處理;對(duì)平滑處理后的各基頻信息進(jìn)行多項(xiàng)式擬合,以獲得關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì);以及基于獲得的關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì),形成用戶語(yǔ)音的韻律特征。
        [0112]根據(jù)一種實(shí)現(xiàn)方式,提取語(yǔ)句中每個(gè)詞在用戶語(yǔ)音中所對(duì)應(yīng)的語(yǔ)音塊的基頻信息的步驟可以通過(guò)如下方式實(shí)現(xiàn):按單位時(shí)間間隔對(duì)每個(gè)語(yǔ)音塊進(jìn)行分割,以獲得每個(gè)語(yǔ)音塊的多個(gè)單位語(yǔ)音片段;以及通過(guò)對(duì)每個(gè)語(yǔ)音塊的多個(gè)單位語(yǔ)音片段進(jìn)行基頻提取來(lái)獲得該語(yǔ)音塊的基頻信息。
        [0113]此外,根據(jù)一種實(shí)現(xiàn)方式,獲得關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì)的步驟可以通過(guò)如下方式實(shí)現(xiàn):以平滑連接每個(gè)語(yǔ)句中每相鄰兩個(gè)詞對(duì)應(yīng)的兩個(gè)語(yǔ)音塊的首尾基頻值為條件來(lái)進(jìn)行多項(xiàng)式擬合,以確定與該語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式;以及根據(jù)確定的各個(gè)分段多項(xiàng)式,確定關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì)。
        [0114]在步驟S740中,基于預(yù)定文本對(duì)應(yīng)的參考韻律特征與用戶韻律特征之間的相關(guān)性,計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量。其中,步驟S740中的處理例如可以與上文中結(jié)合圖2所描述的語(yǔ)音質(zhì)量計(jì)算單元240的處理相同,并能夠達(dá)到相類似的技術(shù)效果,在此不再贅述。然后,在步驟S750中結(jié)束處理流程700。
        [0115]此外,根據(jù)另一種實(shí)現(xiàn)方式,在步驟S740之后,還可以選擇性地包括如下步驟:可視化輸出語(yǔ)音質(zhì)量的計(jì)算結(jié)果。
        [0116]其中,語(yǔ)音質(zhì)量的計(jì)算結(jié)果可以包括:反映語(yǔ)音質(zhì)量的分?jǐn)?shù);和/或用戶韻律特征和參考韻律特征之間的差別。
        [0117]通過(guò)以上描述可知,上述根據(jù)本發(fā)明的實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)方法,其基于獲取的用戶語(yǔ)音的用戶韻律特征和參考韻律特征之間的相關(guān)性,來(lái)計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量。由于該方法在計(jì)算用戶語(yǔ)音的語(yǔ)音質(zhì)量的過(guò)程中考慮了有關(guān)語(yǔ)音韻律的信息,因此能夠使用戶根據(jù)計(jì)算結(jié)果來(lái)獲知自己所錄制的語(yǔ)音在韻律方面的準(zhǔn)確度,進(jìn)而有利于用戶判斷是否需要糾正自己的說(shuō)話韻律和/或發(fā)音韻律。
        [0118]此外,上述根據(jù)本發(fā)明的實(shí)施例的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)方法對(duì)應(yīng)于用戶客戶端,其對(duì)用戶語(yǔ)音的計(jì)算和評(píng)價(jià)是在客戶端計(jì)算機(jī)或客戶端移動(dòng)終端上完成的,而現(xiàn)有的語(yǔ)音技術(shù)通常是在服務(wù)器端完成對(duì)用戶語(yǔ)音的計(jì)算和評(píng)價(jià)的,本發(fā)明的語(yǔ)音質(zhì)量評(píng)價(jià)方法使用戶可以進(jìn)行離線學(xué)習(xí)(已下載存儲(chǔ)學(xué)習(xí)材料的情況下),而無(wú)需像現(xiàn)有技術(shù)那樣必須進(jìn)行在線學(xué)習(xí)。
        [0119]此外,本發(fā)明的實(shí)施例還提供了一種數(shù)據(jù)處理方法,該方法適于在服務(wù)器中執(zhí)行,并包括如下步驟:存儲(chǔ)預(yù)定文本;存儲(chǔ)與預(yù)定文本對(duì)應(yīng)的參考語(yǔ)音,或從外部接收并存儲(chǔ)參考語(yǔ)音;以及獲得參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,并將所獲得的各個(gè)分段多項(xiàng)式與預(yù)定文本中的每個(gè)語(yǔ)句相關(guān)聯(lián)地存儲(chǔ),或根據(jù)所獲得的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征并保存該參考韻律特征。
        [0120]下面結(jié)合圖8來(lái)描述上述數(shù)據(jù)處理方法的一種示例性處理。如圖8所示,根據(jù)本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)處理方法的示例性處理流程800開始于步驟S810,然后,執(zhí)行步驟S820。
        [0121]在步驟S820中,存儲(chǔ)預(yù)定文本和與預(yù)定文本對(duì)應(yīng)的至少一段參考語(yǔ)音,或存儲(chǔ)預(yù)定文本、并從外部接收并存儲(chǔ)至少一段參考語(yǔ)音。然后,執(zhí)行步驟S830。其中,步驟S820中的處理例如可以與上文中結(jié)合圖5所描述的服務(wù)器存儲(chǔ)單元510的處理相同,并能夠達(dá)到相類似的技術(shù)效果,在此不再贅述。
        [0122]在步驟S830中,獲得參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,并將所獲得的各個(gè)分段多項(xiàng)式與預(yù)定文本中的每個(gè)語(yǔ)句相關(guān)聯(lián)地存儲(chǔ),或根據(jù)所獲得的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征并保存該參考韻律特征。其中,步驟S830中的處理例如可以與上文中結(jié)合圖5所描述的獲得單元520的處理相同,并能夠達(dá)到相類似的技術(shù)效果,在此不再贅述。然后,在步驟S840中結(jié)束處理流程800。
        [0123]此外,本發(fā)明的實(shí)施例還提供了一種語(yǔ)音處理方法,該方法適于在計(jì)算機(jī)中執(zhí)行,并包括如下步驟:接收特定用戶針對(duì)預(yù)定文本所錄入的語(yǔ)音,作為參考語(yǔ)音,并將參考語(yǔ)音發(fā)送給預(yù)定服務(wù)器;或接收特定用戶針對(duì)預(yù)定文本所錄入的語(yǔ)音,作為參考語(yǔ)音,并獲得參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,以將獲得的各個(gè)分段多項(xiàng)式與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器,或根據(jù)獲得的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征,以將參考韻律特征與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器。
        [0124]下面結(jié)合圖9來(lái)描述上述語(yǔ)音處理方法的一種示例性處理。如圖9所示,根據(jù)本發(fā)明一個(gè)實(shí)施例的語(yǔ)音處理方法的示例性處理流程900開始于步驟S910,然后,執(zhí)行步驟S920。
        [0125]在步驟S920中,接收特定用戶針對(duì)預(yù)定文本所錄入的語(yǔ)音,作為參考語(yǔ)音。然后,執(zhí)行步驟S930。
        [0126]在步驟S930中,將參考語(yǔ)音發(fā)送給預(yù)定服務(wù)器。然后在步驟S940中結(jié)束處理流程 900。
        [0127]其中,處理流程900的處理例如可以與上文中結(jié)合圖6所描述的參考語(yǔ)音接收單元610的處理相同,并能夠達(dá)到相類似的技術(shù)效果,在此不再贅述。
        [0128]此外,圖10示出了上述語(yǔ)音處理方法的另一種示例性處理。如圖10所示,根據(jù)本發(fā)明一個(gè)實(shí)施例的語(yǔ)音處理方法的示例性處理流程1000開始于步驟S1010,然后,執(zhí)行步驟 S1020。
        [0129]在步驟S1020中,接收特定用戶針對(duì)預(yù)定文本所錄入的語(yǔ)音,作為參考語(yǔ)音。然后,執(zhí)行步驟S1030。
        [0130]根據(jù)一種實(shí)現(xiàn)方式,可以在步驟S1030中獲得參考語(yǔ)音中與預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,以將獲得的各個(gè)分段多項(xiàng)式與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器。然后在步驟S1040中結(jié)束處理流程1000。
        [0131]根據(jù)另一種實(shí)現(xiàn)方式,可以在步驟S1030中根據(jù)獲得的各個(gè)分段多項(xiàng)式獲得參考語(yǔ)音的參考韻律特征,以將參考韻律特征與預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器。然后在步驟S1040中結(jié)束處理流程1000。
        [0132]其中,處理流程1000的處理例如可以與上文中結(jié)合圖6所描述的接收與獲得單元620的處理相同,并能夠達(dá)到相類似的技術(shù)效果,在此不再贅述。
        [0133]All:一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)方法,包括如下步驟:接收用戶針對(duì)預(yù)定文本所錄入的用戶語(yǔ)音,該預(yù)定文本包括一個(gè)或者多個(gè)語(yǔ)句,且每個(gè)語(yǔ)句包括一個(gè)或者多個(gè)詞;獲取所述用戶語(yǔ)音的用戶韻律特征;以及基于所述預(yù)定文本對(duì)應(yīng)的參考韻律特征與所述用戶韻律特征之間的相關(guān)性,計(jì)算所述用戶語(yǔ)音的語(yǔ)音質(zhì)量。A12:根據(jù)All所述的語(yǔ)音質(zhì)量評(píng)價(jià)方法中,所述獲取所述用戶語(yǔ)音的用戶韻律特征的步驟包括:利用預(yù)定聲學(xué)模型將所述用戶語(yǔ)音與所述預(yù)定文本進(jìn)行強(qiáng)制對(duì)齊,以確定所述預(yù)定文本中的每個(gè)詞和/或每個(gè)詞中的每個(gè)音節(jié)和/或每個(gè)音節(jié)的每個(gè)音素與所述用戶語(yǔ)音的部分之間的對(duì)應(yīng)關(guān)系,并基于所述對(duì)應(yīng)關(guān)系獲得所述用戶語(yǔ)音的用戶韻律特征。A13:根據(jù)A12所述的語(yǔ)音質(zhì)量評(píng)價(jià)方法中,所述基于所述對(duì)應(yīng)關(guān)系獲得所述用戶語(yǔ)音的用戶韻律特征的步驟包括:針對(duì)所述預(yù)定文本的每個(gè)語(yǔ)句:提取語(yǔ)句中每個(gè)詞在所述用戶語(yǔ)音中所對(duì)應(yīng)的語(yǔ)音塊的基頻信息;對(duì)每個(gè)語(yǔ)音塊的基頻信息進(jìn)行平滑處理;對(duì)平滑處理后的各基頻信息進(jìn)行多項(xiàng)式擬合,以獲得關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì);以及基于獲得的關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì),形成所述用戶語(yǔ)音的韻律特征。A14:根據(jù)A13所述的語(yǔ)音質(zhì)量評(píng)價(jià)方法中,每個(gè)語(yǔ)音塊的基頻信息通過(guò)如下方式進(jìn)行提取:按單位時(shí)間間隔對(duì)每個(gè)語(yǔ)音塊進(jìn)行分割,以獲得每個(gè)語(yǔ)音塊的多個(gè)單位語(yǔ)音片段;以及通過(guò)對(duì)每個(gè)語(yǔ)音塊的多個(gè)單位語(yǔ)音片段進(jìn)行基頻提取來(lái)獲得該語(yǔ)音塊的基頻信息。A15:根據(jù)A13所述的語(yǔ)音質(zhì)量評(píng)價(jià)方法中,所述對(duì)平滑處理后的各基頻信息進(jìn)行多項(xiàng)式擬合以獲得關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì)的步驟包括:以平滑連接每個(gè)語(yǔ)句中每相鄰兩個(gè)詞對(duì)應(yīng)的兩個(gè)語(yǔ)音塊的首尾基頻值為條件來(lái)進(jìn)行多項(xiàng)式擬合,以確定與該語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式;以及根據(jù)確定的各個(gè)分段多項(xiàng)式,確定關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì)。A16:根據(jù)All所述的語(yǔ)音質(zhì)量評(píng)價(jià)方法還包括:可視化輸出所述語(yǔ)音質(zhì)量的計(jì)算結(jié)果。A17:根據(jù)A16所述的語(yǔ)音質(zhì)量評(píng)價(jià)方法中,所述語(yǔ)音質(zhì)量的計(jì)算結(jié)果包括:反映所述語(yǔ)音質(zhì)量的分?jǐn)?shù);和/或所述用戶韻律特征和所述參考韻律特征之間的差別。A18:根據(jù)All所述的語(yǔ)音質(zhì)量評(píng)價(jià)方法中:所述預(yù)定文本和所述參考韻律特征是預(yù)先從預(yù)定服務(wù)器下載獲得的;或所述預(yù)定文本是預(yù)先從預(yù)定服務(wù)器下載獲得的,而所述參考韻律特征是利用與所述預(yù)定文本的各語(yǔ)句對(duì)應(yīng)的參考語(yǔ)音的各語(yǔ)音段的基頻曲線的、從預(yù)定服務(wù)器預(yù)先下載的分段多項(xiàng)式計(jì)算獲得的。A19:—種數(shù)據(jù)處理方法,該方法適于在服務(wù)器中執(zhí)行,并包括如下步驟:存儲(chǔ)預(yù)定文本以及與所述預(yù)定文本對(duì)應(yīng)的參考語(yǔ)音;以及計(jì)算所述參考語(yǔ)音中與所述預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,并將所獲得的各個(gè)分段多項(xiàng)式與所述預(yù)定文本中的每個(gè)語(yǔ)句相關(guān)聯(lián)地存儲(chǔ),或根據(jù)所獲得的各個(gè)分段多項(xiàng)式獲得所述參考語(yǔ)音的參考韻律特征并保存該參考韻律特征。A20:—種語(yǔ)音處理方法,該方法適于在計(jì)算機(jī)中執(zhí)行,并包括如下步驟:接收特定用戶針對(duì)預(yù)定文本所錄入的語(yǔ)音作為參考語(yǔ)音,并將所述參考語(yǔ)音發(fā)送給預(yù)定服務(wù)器;以及計(jì)算所述參考語(yǔ)音中與所述預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,以將獲得的各個(gè)分段多項(xiàng)式與所述預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器,或根據(jù)獲得的各個(gè)分段多項(xiàng)式獲得所述參考語(yǔ)音的參考韻律特征,以將所述參考韻律特征與所述預(yù)定文本相關(guān)聯(lián)地發(fā)送至所述預(yù)定服務(wù)器。A21:—種移動(dòng)終端,包括根據(jù)本發(fā)明的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備。A22: —種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)系統(tǒng),包括根據(jù)本發(fā)明的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備和數(shù)據(jù)處理設(shè)備。A23:根據(jù)A22所述的語(yǔ)音質(zhì)量評(píng)價(jià)系統(tǒng),包括:根據(jù)本發(fā)明的基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備;服務(wù)器;以及根據(jù)本發(fā)明的語(yǔ)音處理設(shè)備。
        [0134]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多特征。更確切地說(shuō),如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
        [0135]本領(lǐng)域那些技術(shù)人員應(yīng)當(dāng)理解在本文所公開的示例中的設(shè)備的模塊或單元或組件可以布置在如該實(shí)施例中所描述的設(shè)備中,或者可替換地可以定位在與該示例中的設(shè)備不同的一個(gè)或多個(gè)設(shè)備中。前述示例中的模塊可以組合為一個(gè)模塊或者此外可以分成多個(gè)子模塊。
        [0136]本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
        [0137]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
        [0138]此外,所述實(shí)施例中的一些在此被描述成可以由計(jì)算機(jī)系統(tǒng)的處理器或者由執(zhí)行所述功能的其它裝置實(shí)施的方法或方法元素的組合。因此,具有用于實(shí)施所述方法或方法元素的必要指令的處理器形成用于實(shí)施該方法或方法元素的裝置。此外,裝置實(shí)施例的在此所述的元素是如下裝置的例子:該裝置用于實(shí)施由為了實(shí)施該發(fā)明的目的的元素所執(zhí)行的功能。
        [0139]如在此所使用的那樣,除非另行規(guī)定,使用序數(shù)詞“第一”、“第二”、“第三”等等來(lái)描述普通對(duì)象僅僅表示涉及類似對(duì)象的不同實(shí)例,并且并不意圖暗示這樣被描述的對(duì)象必須具有時(shí)間上、空間上、排序方面或者以任意其它方式的給定順序。
        [0140]盡管根據(jù)有限數(shù)量的實(shí)施例描述了本發(fā)明,但是受益于上面的描述,本【技術(shù)領(lǐng)域】?jī)?nèi)的技術(shù)人員明白,在由此描述的本發(fā)明的范圍內(nèi),可以設(shè)想其它實(shí)施例。此外,應(yīng)當(dāng)注意,本說(shuō)明書中使用的語(yǔ)言主要是為了可讀性和教導(dǎo)的目的而選擇的,而不是為了解釋或者限定本發(fā)明的主題而選擇的。因此,在不偏離所附權(quán)利要求書的范圍和精神的情況下,對(duì)于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來(lái)說(shuō)許多修改和變更都是顯而易見的。對(duì)于本發(fā)明的范圍,對(duì)本發(fā)明所做的公開是說(shuō)明性的,而非限制性的,本發(fā)明的范圍由所附權(quán)利要求書限定。
        【權(quán)利要求】
        1.一種基于韻律的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,包括:存儲(chǔ)單元,適于存儲(chǔ)預(yù)定文本和所述預(yù)定文本對(duì)應(yīng)的參考韻律特征,該預(yù)定文本包括一個(gè)或者多個(gè)語(yǔ)句,且每個(gè)語(yǔ)句包括一個(gè)或者多個(gè)詞;用戶語(yǔ)音接收單元,適于接收用戶針對(duì)所述預(yù)定文本所錄入的用戶語(yǔ)音;特征獲取單元,適于獲取所述用戶語(yǔ)音的用戶韻律特征;以及語(yǔ)音質(zhì)量計(jì)算單元,適于基于所述參考韻律特征與所述用戶韻律特征之間的相關(guān)性,計(jì)算所述用戶語(yǔ)音的語(yǔ)音質(zhì)量。
        2.根據(jù)權(quán)利要求1所述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,其中,所述特征獲取單元包括:對(duì)齊子單元,適于利用預(yù)定聲學(xué)模型將所述用戶語(yǔ)音與所述預(yù)定文本進(jìn)行強(qiáng)制對(duì)齊,以確定所述預(yù)定文本中的每個(gè)詞和/或每個(gè)詞中的每個(gè)音節(jié)和/或每個(gè)音節(jié)的每個(gè)音素與所述用戶語(yǔ)音的部分之間的對(duì)應(yīng)關(guān)系;以及特征計(jì)算子單元,適于基于所述對(duì)應(yīng)關(guān)系計(jì)算所述用戶語(yǔ)音的用戶韻律特征。
        3.根據(jù)權(quán)利要求2所述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,其中,所述特征計(jì)算子單元適于:針對(duì)所述預(yù)定文本的每個(gè)語(yǔ)句:提取語(yǔ)句中每個(gè)詞在所述用戶語(yǔ)音中所對(duì)應(yīng)的語(yǔ)音塊的基頻信息;對(duì)每個(gè)語(yǔ)音塊的基頻信息進(jìn)行平滑處理;對(duì)平滑處理后的各基頻信息進(jìn)行多項(xiàng)式擬合,以獲得關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì);以及基于獲得的關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì),形成所述用戶語(yǔ)音的韻律特征。
        4.根據(jù)權(quán)利要求3所述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,其中,所述特征計(jì)算子單元適于:按單位時(shí)間間隔對(duì)每個(gè)語(yǔ)音塊進(jìn)行分割,以獲得每個(gè)語(yǔ)音塊的多個(gè)單位語(yǔ)音片段;以及通過(guò)對(duì)每個(gè)語(yǔ)音塊的多個(gè)單位語(yǔ)音片段進(jìn)行基頻提取來(lái)獲得該語(yǔ)音塊的基頻信息。
        5.根據(jù)權(quán)利要求3所述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,其中,所述特征計(jì)算子單元適于:以平滑連接每個(gè)語(yǔ)句中每相鄰兩個(gè)詞對(duì)應(yīng)的兩個(gè)語(yǔ)音塊的首尾基頻值為條件來(lái)進(jìn)行多項(xiàng)式擬合,以確定與該語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式;以及根據(jù)確定的各個(gè)分段多項(xiàng)式,確定關(guān)于時(shí)間與基頻值的多個(gè)坐標(biāo)對(duì)。
        6.根據(jù)權(quán)利要求1所述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,還包括:輸出單元,適于可視化輸出所述語(yǔ)音質(zhì)量的計(jì)算結(jié)果。
        7.根據(jù)權(quán)利要求6所述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,其中,所述輸出單元適于輸出如下結(jié)果來(lái)作為所述語(yǔ)音質(zhì)量的計(jì)算結(jié)果:反映所述語(yǔ)音質(zhì)量的分?jǐn)?shù);和/或所述用戶韻律特征和所述參考韻律特征之間的差別。
        8.根據(jù)權(quán)利要求1所述的語(yǔ)音質(zhì)量評(píng)價(jià)設(shè)備,其中:所述存儲(chǔ)單元適于從預(yù)定服務(wù)器預(yù)先下載所述預(yù)定文本和所述參考韻律特征以用于存儲(chǔ);或所述存儲(chǔ)單元適于從預(yù)定的服務(wù)器預(yù)先下載所述預(yù)定文本以及與所述預(yù)定文本的各語(yǔ)句對(duì)應(yīng)的參考語(yǔ)音的各語(yǔ)音段的基頻曲線的、從預(yù)定服務(wù)器預(yù)先下載的分段多項(xiàng)式,并根據(jù)下載的所述分段多項(xiàng)式計(jì)算獲得所述參考韻律特征以用于存儲(chǔ)。
        9.一種數(shù)據(jù)處理設(shè)備,該設(shè)備適于在服務(wù)器中執(zhí)行,并包括:服務(wù)器存儲(chǔ)單元,適于存儲(chǔ)預(yù)定文本以及與所述預(yù)定文本對(duì)應(yīng)的參考語(yǔ)音;以及韻律計(jì)算單元,適于計(jì)算所述參考語(yǔ)音中與所述預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,并將所獲得的各個(gè)分段多項(xiàng)式與所述預(yù)定文本中的每個(gè)語(yǔ)句相關(guān)聯(lián)地保存在所述服務(wù)器存儲(chǔ)單元中,或根據(jù)所獲得的各個(gè)分段多項(xiàng)式獲得所述參考語(yǔ)音的參考韻律特征并將該參考韻律特征保存在所述服務(wù)器存儲(chǔ)單元中。
        10.一種語(yǔ)音處理設(shè)備,該設(shè)備適于在計(jì)算機(jī)中執(zhí)行,并包括:參考語(yǔ)音接收單元,適于接收特定用戶針對(duì)預(yù)定文本所錄入的語(yǔ)音作為參考語(yǔ)音,并將所述參考語(yǔ)音發(fā)送給預(yù)定服務(wù)器;以及韻律計(jì)算單元,適于計(jì)算所述參考語(yǔ)音中與所述預(yù)定文本的每個(gè)語(yǔ)句對(duì)應(yīng)的語(yǔ)音段的基頻曲線的各個(gè)分段多項(xiàng)式,以將獲得的各個(gè)分段多項(xiàng)式與所述預(yù)定文本相關(guān)聯(lián)地發(fā)送至預(yù)定服務(wù)器,或根據(jù)獲得的各個(gè)分段多項(xiàng)式獲得所述參考語(yǔ)音的參考韻律特征,以將所述參考韻律特征與所述預(yù)定文本相關(guān)聯(lián)地發(fā)送至所述預(yù)定服務(wù)器。
        【文檔編號(hào)】G10L25/60GK104361896SQ201410736291
        【公開日】2015年2月18日 申請(qǐng)日期:2014年12月4日 優(yōu)先權(quán)日:2014年12月4日
        【發(fā)明者】林暉 申請(qǐng)人:上海流利說(shuō)信息技術(shù)有限公司
        網(wǎng)友詢問留言 留言:0條
        • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
        主站蜘蛛池模板: 国产偷倩视频| 久久精品久久电影免费理论片| 美女黄18以下禁止观看| 亚洲第一成人会所| 色婷婷综合久色aⅴ五区最新| 成人免费亚洲av在线| 精品国产三级A∨在线| 久分夜色精品国产噜噜亚洲av| 下面一进一出好爽视频| 男人扒女人添高潮视频| 三上悠亚精品一区二区久久| 欧美精品亚洲精品日韩专| 啊轻点灬大JI巴太粗太长了欧美| 国产精品第七页| 久久亚洲V无码专区成人| 亚洲人成色77777在线观看| 一本大道久久东京热AV| 成人网站亚洲| 久久人人久久人人| 午夜免费啪视频在线观看 | 起碰免费公开97在线视频| 2020最新国产精品视频| 中文字幕人妻一区二区三区| 精品国产成人网站一区在线| 孕妇怀孕高潮潮喷视频孕妇| 国产乱人伦无码视频| 中文字幕亚洲综合小综合| 国产亚洲精品aaaa片app| 丝袜人妻无码中文字幕综合网| 久久人妻精品白浆国产| 国产农村老熟女国产老熟女| 国产偷窥熟女精品视频大全| 麻豆国产精品VA在线观看| 国产成人精品无码片区在线观看| 日韩高清在线亚洲专区不卡| 欧美影院中文字幕| 久久久橹橹橹久久久久高清| 人妻丰满熟AV无码区HD| 欧美射图| 会昌县| 成人日屄视频|