1. <rt id="e600n"></rt>
      1. <pre id="e600n"><strong id="e600n"><pre id="e600n"></pre></strong></pre>
      2. 岛国免费AV,无码人妻精品一区二区三区夜夜嗨,又大又粗又硬又爽黄毛少妇,精品国产AV二区,91视频最新网址,久操无码,久久无码人妻一区二区三区午夜,国产精品视频中文字幕

        音頻生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程

        文檔序號(hào):35635177發(fā)布日期:2023-10-06 04:42閱讀:68來源:國知局

        本申請(qǐng)涉及音頻處理,特別涉及一種音頻生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。


        背景技術(shù):

        1、隨著越來越多的電子設(shè)備設(shè)有語音交互功能,用戶對(duì)電子設(shè)備的語音交互體驗(yàn)也有了更高的要求。

        2、在相關(guān)技術(shù)中,電子設(shè)備在獲得用戶的輸入內(nèi)容之后,使用事先錄好的音頻文件生成對(duì)應(yīng)的輸出音頻,或者對(duì)電子設(shè)備生成的音頻文件進(jìn)行調(diào)整后,再輸出對(duì)應(yīng)的音頻,以和用戶進(jìn)行語音交互。

        3、但是,通過上述語音交互的方法,輸出的音頻,存在節(jié)奏機(jī)械化,沒有情感的問題,不能夠滿足用戶豐富的情感需求,大大降低了用戶的語音交互體驗(yàn)。


        技術(shù)實(shí)現(xiàn)思路

        1、本申請(qǐng)實(shí)施例提供了一種音頻生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。該技術(shù)方案如下:

        2、根據(jù)本申請(qǐng)實(shí)施例的一方面,提供了一種音頻生成方法,該方法包括:

        3、響應(yīng)于觸發(fā)指令,獲取該觸發(fā)指令所包括的情感關(guān)鍵字和播放內(nèi)容信息,該情感關(guān)鍵字用于指示基于該播放內(nèi)容信息進(jìn)行回復(fù)時(shí)的情感表現(xiàn);

        4、基于該情感關(guān)鍵字以及該播放內(nèi)容信息指示的回復(fù)文本,獲取目標(biāo)樂曲;

        5、對(duì)該回復(fù)文本以及該目標(biāo)樂曲的節(jié)拍特征參數(shù)進(jìn)行語音合成,得到目標(biāo)音頻。

        6、在一種可能的實(shí)現(xiàn)方式中,獲取該觸發(fā)指令所包括的情感關(guān)鍵字和播放內(nèi)容信息,包括:

        7、基于預(yù)設(shè)識(shí)別參數(shù)對(duì)該觸發(fā)指令進(jìn)行文字識(shí)別,得到該情感關(guān)鍵字以及播放內(nèi)容信息;該預(yù)設(shè)識(shí)別參數(shù)包括預(yù)設(shè)識(shí)別字、預(yù)設(shè)識(shí)別詞以及預(yù)設(shè)識(shí)別符號(hào)中的至少一項(xiàng)。

        8、在一種可能的實(shí)現(xiàn)方式中,基于該情感關(guān)鍵字以及該播放內(nèi)容信息指示的回復(fù)文本,獲取目標(biāo)樂曲,包括:

        9、基于該情感關(guān)鍵字對(duì)音樂庫中的待選樂曲的該情感標(biāo)簽進(jìn)行查找,以及基于該回復(fù)文本的播放時(shí)長(zhǎng)對(duì)該音樂庫中的該待選樂曲進(jìn)行查找,得到與該情感關(guān)鍵字以及該回復(fù)文本匹配的該目標(biāo)樂曲。

        10、在一種可能的實(shí)現(xiàn)方式中,若該目標(biāo)樂曲的數(shù)量不等于預(yù)設(shè)閾值,則獲取每個(gè)該目標(biāo)樂曲的歷史選中次數(shù);該歷史選中次數(shù)用于指示對(duì)應(yīng)的該目標(biāo)樂曲,歷史被選中為該目標(biāo)樂曲的數(shù)量;

        11、根據(jù)每個(gè)該目標(biāo)樂曲對(duì)應(yīng)的該歷史選中次數(shù),從多個(gè)該目標(biāo)樂曲中篩選出歷史選中次數(shù)最大的該目標(biāo)樂曲。

        12、在一種可能的實(shí)現(xiàn)方式中,對(duì)該回復(fù)文本以及該目標(biāo)樂曲的進(jìn)行語音合成,得到目標(biāo)音頻,包括:

        13、基于該回復(fù)文本的文本形式參數(shù)確定該回復(fù)文本中每個(gè)該字/詞對(duì)應(yīng)的至少一個(gè)音符;其中,每個(gè)該音符對(duì)應(yīng)至少一個(gè)節(jié)拍;該文本形式參數(shù)包括詩歌結(jié)構(gòu)以及音符匹配參數(shù);

        14、將每個(gè)該字/詞與對(duì)應(yīng)的該音符,分別進(jìn)行語音合成,得到該目標(biāo)音頻。

        15、根據(jù)本申請(qǐng)實(shí)施例的第二方面,提供了一種音頻生成裝置,該裝置包括:

        16、響應(yīng)模塊,用于響應(yīng)于觸發(fā)指令,獲取該觸發(fā)指令所包括的情感關(guān)鍵字和播放內(nèi)容信息,該情感關(guān)鍵字用于指示基于該播放內(nèi)容信息進(jìn)行回復(fù)時(shí)的情感表現(xiàn);

        17、獲取模塊,用于基于該情感關(guān)鍵字以及該播放內(nèi)容信息指示的回復(fù)文本,獲取目標(biāo)樂曲;

        18、語音合成模塊,用于對(duì)該回復(fù)文本以及該目標(biāo)樂曲的節(jié)拍特征參數(shù)進(jìn)行語音合成,得到目標(biāo)音頻。

        19、在一種可能的實(shí)現(xiàn)方式中,該響應(yīng)模塊,包括:

        20、基于預(yù)設(shè)識(shí)別參數(shù)對(duì)該觸發(fā)指令進(jìn)行文字識(shí)別,得到該情感關(guān)鍵字以及播放內(nèi)容信息;該預(yù)設(shè)識(shí)別參數(shù)包括預(yù)設(shè)識(shí)別字、預(yù)設(shè)識(shí)別詞以及預(yù)設(shè)識(shí)別符號(hào)中的至少一項(xiàng)。

        21、在一種可能的實(shí)現(xiàn)方式中,該獲取模塊,包括:

        22、基于該情感關(guān)鍵字對(duì)音樂庫中的待選樂曲的該情感標(biāo)簽進(jìn)行查找,以及基于該回復(fù)文本的播放時(shí)長(zhǎng)對(duì)該音樂庫中的該待選樂曲進(jìn)行查找,得到與該情感關(guān)鍵字以及該回復(fù)文本匹配的該目標(biāo)樂曲。

        23、在一種可能的實(shí)現(xiàn)方式中,該獲取模塊,還包括:若該目標(biāo)樂曲的數(shù)量不等于預(yù)設(shè)閾值,則獲取每個(gè)該目標(biāo)樂曲的歷史選中次數(shù);該歷史選中次數(shù)用于指示對(duì)應(yīng)的該目標(biāo)樂曲,歷史被選中為該目標(biāo)樂曲的數(shù)量;

        24、根據(jù)每個(gè)該目標(biāo)樂曲對(duì)應(yīng)的該歷史選中次數(shù),從多個(gè)該目標(biāo)樂曲中篩選出歷史選中次數(shù)最大的該目標(biāo)樂曲。

        25、在一種可能的實(shí)現(xiàn)方式中,該語音合成模塊,該對(duì)該回復(fù)文本以及該目標(biāo)樂曲的節(jié)拍特征參數(shù)進(jìn)行語音合成,得到目標(biāo)音頻,包括:

        26、基于該回復(fù)文本的文本形式參數(shù)確定該回復(fù)文本中每個(gè)該字/詞對(duì)應(yīng)的至少一個(gè)音符;其中,每個(gè)該音符對(duì)應(yīng)至少一個(gè)節(jié)拍;該文本形式參數(shù)包括詩歌結(jié)構(gòu)以及音符匹配參數(shù);

        27、將每個(gè)該字/詞與對(duì)應(yīng)的該音符,分別進(jìn)行語音合成,得到該目標(biāo)音頻。

        28、根據(jù)本申請(qǐng)實(shí)施例的第三方面,提供了一種電子設(shè)備,包括處理器、存儲(chǔ)器以及存儲(chǔ)在該存儲(chǔ)器中且被配置為由該處理器執(zhí)行的計(jì)算機(jī)程序,該處理器執(zhí)行該計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述的方法。

        29、根據(jù)本申請(qǐng)實(shí)施例的第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括存儲(chǔ)的計(jì)算機(jī)程序,其中,在該計(jì)算機(jī)程序運(yùn)行時(shí)控制該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行如上述的方法。

        30、根據(jù)本申請(qǐng)實(shí)施例的第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述的方法。

        31、本申請(qǐng)實(shí)施例提供的技術(shù)方案帶來的有益效果是:

        32、在本申請(qǐng)實(shí)施例中,本申請(qǐng)實(shí)施例提供了一種音頻生成方法,通過觸發(fā)指令包括的情感關(guān)鍵字,來確定采用哪種節(jié)奏特點(diǎn)的樂曲來進(jìn)行語音合成,從而讓語音回復(fù)具有和該情感關(guān)鍵字相應(yīng)的情感表現(xiàn),使得回復(fù)文本的節(jié)奏符合用戶的情感需要,增加了語音交互的靈活性,大大提高了用戶對(duì)語音交互的滿意度。



        技術(shù)特征:

        1.一種音頻生成方法,其特征在于,包括:

        2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述觸發(fā)指令所包括的情感關(guān)鍵字和播放內(nèi)容信息,包括:

        3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述基于所述情感關(guān)鍵字以及所述播放內(nèi)容信息指示的回復(fù)文本,獲取目標(biāo)樂曲,包括:

        4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,若所述目標(biāo)樂曲的數(shù)量不等于預(yù)設(shè)閾值,則獲取每個(gè)所述目標(biāo)樂曲的歷史選中次數(shù);所述歷史選中次數(shù)用于指示對(duì)應(yīng)的所述目標(biāo)樂曲,歷史被選中為所述目標(biāo)樂曲的數(shù)量;

        5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述對(duì)所述回復(fù)文本以及所述目標(biāo)樂曲的節(jié)拍特征參數(shù)進(jìn)行語音合成,得到目標(biāo)音頻,包括:

        6.一種音頻生成裝置,其特征在于,包括:

        7.一種電子設(shè)備,其特征在于,包括處理器、存儲(chǔ)器以及存儲(chǔ)在所述存儲(chǔ)器中且被配置為由所述處理器執(zhí)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至5中任意一項(xiàng)所述的方法。

        8.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括存儲(chǔ)的計(jì)算機(jī)程序,其中,在所述計(jì)算機(jī)程序運(yùn)行時(shí)控制所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行如權(quán)利要求1至5中任意一項(xiàng)所述的方法。

        9.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至5中任意一項(xiàng)所述的方法。


        技術(shù)總結(jié)
        本申請(qǐng)?zhí)峁┝艘环N音頻生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),所述方法包括:響應(yīng)于觸發(fā)指令,獲取所述觸發(fā)指令所包括的情感關(guān)鍵字和播放內(nèi)容信息,所述情感關(guān)鍵字用于指示基于所述播放內(nèi)容信息進(jìn)行回復(fù)時(shí)的情感表現(xiàn);基于所述情感關(guān)鍵字以及所述播放內(nèi)容信息指示的回復(fù)文本,獲取目標(biāo)樂曲;對(duì)所述回復(fù)文本以及所述目標(biāo)樂曲的節(jié)拍特征參數(shù)進(jìn)行語音合成,得到目標(biāo)音頻。本申請(qǐng)的技術(shù)方案,通過觸發(fā)指令包括的情感關(guān)鍵字,來確定采用哪種節(jié)奏特點(diǎn)的樂曲來進(jìn)行語音合成,從而讓語音回復(fù)具有和該情感關(guān)鍵字相應(yīng)的情感表現(xiàn),使得回復(fù)文本的節(jié)奏符合用戶的情感需要,增加了語音交互的靈活性,大大提高了用戶對(duì)語音交互的滿意度。

        技術(shù)研發(fā)人員:趙雅男,李良斌
        受保護(hù)的技術(shù)使用者:北京聲智科技有限公司
        技術(shù)研發(fā)日:
        技術(shù)公布日:2024/1/15
        網(wǎng)友詢問留言 留言:0條
        • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
        1
        主站蜘蛛池模板: 亚洲鲁丝片AV无码多人| 疯狂做受XXXX高潮国产| 日韩人妻中文无码一区二区七区 | 久久午夜无码免费| 96在线看片免费视频国产| 美女自卫慰黄网站| 国产91色在线|亚洲| 久久综合精品国产一区| 久久久黄色片| 五月综合激情婷婷六月| 亚洲日韩字幕| 在线观看免费国产精品| 日日夜夜精品亚洲天堂| 日韩在线视频线观看一区| 久久婷婷秘?精品国产538| 日本成人中文字幕| 性欧美丰满xxxx性| 亚洲色大成网站WWW永久网站| 日韩a视频| 国产无遮挡猛进猛出免费软件| 久久精品一品道久久精品9| 国产成人午夜福利精品| 一起草AV| 丰满人妻一区二区三区在线视频53| 白丝尤物jk自慰制服喷水| 男女性杂交内射女bbwxz| 在线视频免费看3| 亚洲精品成人久久久| 国产在线观看免费观看不卡| 花式道具play高h文调教| 二区中文字幕在线观看| 人妻中文AV| 精品人人妻人人澡人人爽牛牛| 2020年最新国产精品正在播放 | 久久影音先锋| 新丰县| 日日噜噜夜夜狠狠免费视频| 国产老熟女无套内射不卡| 亚洲欧美视频| 久久久精品人妻一区二区三区蜜桃 | 欧亚av|