1. <rt id="e600n"></rt>
      1. <pre id="e600n"><strong id="e600n"><pre id="e600n"></pre></strong></pre>
      2. 岛国免费AV,无码人妻精品一区二区三区夜夜嗨,又大又粗又硬又爽黄毛少妇,精品国产AV二区,91视频最新网址,久操无码,久久无码人妻一区二区三区午夜,国产精品视频中文字幕

        一種在線標注方法及系統(tǒng)與流程

        文檔序號:22550620發(fā)布日期:2020-10-17 02:26閱讀:262來源:國知局

        本發(fā)明涉及語音識別技術領域,尤其是涉及一種在線標注方法及系統(tǒng)。



        背景技術:

        在語音識別領域,必須事先獲得大量應用場景下原始語音的標注數(shù)據和音頻,才能投入到聲學模型訓練和語言模型的訓練中,從而獲得較高的語音識別準確率。

        然而,原始語音只包含音頻,不包含標注數(shù)據,需要靠人工方式進行語音標注獲得標注數(shù)據。但是傳統(tǒng)的語音標注系統(tǒng)是逐字進行標注,效率低且人力成本高,并且傳統(tǒng)的標注系統(tǒng)是基于單機軟件,無法進行統(tǒng)一的數(shù)據管理。



        技術實現(xiàn)要素:

        針對傳統(tǒng)的語音標注系統(tǒng)是逐字進行標注,效率低且人力成本高的問題,本發(fā)明提出了一種在線標注方法及系統(tǒng),對asr引擎識別的原始音頻的日志和短音頻進行解析,獲得識別結果,在根據識別結果進行在線標注,提高標注效率和準確度。

        為實現(xiàn)上述目的,本發(fā)明提供以下的技術方案:

        一種在線標注方法,包括以下步驟:

        s1,利用asr引擎識別待標注音頻得到原始音頻日志和短音頻;

        s2,對原始音頻日志和短音頻進行解析,獲取識別結果和音頻相關信息;

        s3,對識別結果進行在線標注,得到標注結果;

        s4,根據識別結果和標注結果進行對比計算識別率;

        s5,利用音頻相關信息對asr引擎識別效果進行統(tǒng)計。

        相對于傳統(tǒng)的標注工具需要逐字進行標注,本發(fā)明在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率。本發(fā)明根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果。

        作為優(yōu)選,所述音頻相關信息包括截幅比、音量、前信噪比、后信噪比、音頻時長、識別延時、語句長度和傳輸延時。

        截幅比、音量、前信噪比、后信噪比用于分析音頻是否出現(xiàn)異常,音頻時長、識別延時、語句長度和傳輸延時用于統(tǒng)計asr引擎識別效果統(tǒng)計以及效果分析。

        作為優(yōu)選,所述步驟s5具體包括:

        s501,設定截幅比、音量、前信噪比和后信噪比的閾值范圍;

        s502,將音頻相關信息與閾值范圍進行比對,若超過閾值范圍則標記為異常音頻,并定位異常音頻;

        s503,計算異常音頻占比,并以web客戶端通過圖表展示。

        通過異常音頻占比,以及定位異常音頻,來展示asr引擎識別效果的好壞,并以web客戶端通過圖表展示,方便管理人員直觀獲取asr引擎識別效果的好壞。

        作為優(yōu)選,所述步驟s5具體包括:

        s511,對音頻時長、識別延時、語句長度和傳輸延時進行計算得到相關參數(shù);

        s512,設定相關參數(shù)的閾值范圍,若相關參數(shù)超過閾值范圍,對相關參數(shù)進行標記;

        s513,用web客戶端將相關參數(shù)以及帶標記的相關參數(shù)用圖表展示。

        對相關參數(shù)進行標記,并用圖標展示,有助于管理人員對asr引擎識別效果較差時,直觀獲取asr引擎識別效果較差的原因。

        作為優(yōu)選,所述相關參數(shù)包括實時率、總實時率、排隊時延、識別延時。設置實時率、總實時率、排隊時延、識別延時更加全面的判定asr引擎識別效果較差的原因,提高判定的準確率。

        作為優(yōu)選,所述步驟s4具體包括:獲取識別結果關于缺漏錯誤、增添錯誤和替換錯誤的信息,計算識別率,所述識別率包括缺漏識別率、增添識別率、替換識別率和總錯誤識別率。對各種可能出現(xiàn)的錯誤進行統(tǒng)計,使對asr引擎識別效果識別更加全面,有利于后續(xù)管理人員對asr引擎識別進行優(yōu)化,以及優(yōu)化標注方式。

        一種在線標注系統(tǒng),采用上述的一種在線標注方法,包括:

        解析子系統(tǒng),對原始音頻日志和短音頻進行解析,獲取識別結果和音頻相關信息;

        在線標注子系統(tǒng),對識別結果進行在線標注,得到標注結果;

        統(tǒng)計子系統(tǒng),根據識別結果和標注結果進行對比計算識別率,利用音頻相關信息對asr引擎識別效果進行統(tǒng)計;

        垂直分數(shù)據庫,分開存儲解析和標注不同的階段產生的數(shù)據。對解析和標注不同的階段產生的數(shù)據,存儲至不同的數(shù)據庫,可以提高查詢的效率。本發(fā)明在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率。本發(fā)明根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果。

        作為優(yōu)選,本發(fā)明還包括標注音頻管控子系統(tǒng),根據不同的業(yè)務場景建立不同的項目和任務對需要標注的音頻進行管控,提高標注的效率。

        本發(fā)明有以下有益效果:在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率;根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果;對各種可能出現(xiàn)的錯誤進行統(tǒng)計,使對asr引擎識別效果識別更加全面,有利于后續(xù)管理人員對asr引擎識別進行優(yōu)化,以及優(yōu)化標注方式。

        附圖說明

        圖1是本實施例的方法流程圖;

        圖2是本實施例的系統(tǒng)構成圖。

        具體實施方式

        實施例:

        本實施例提出一種在線標注方法,參考圖1,包括以下步驟:

        s1,利用asr引擎識別待標注音頻得到原始音頻日志和短音頻;

        s2,對原始音頻日志和短音頻進行解析,獲取識別結果和音頻相關信息;音頻相關信息包括截幅比、音量、前信噪比、后信噪比、音頻時長、識別延時、語句長度和傳輸延時。

        s3,對識別結果進行在線標注,得到標注結果;

        s4,根據識別結果和標注結果進行對比計算識別率;

        步驟s4具體包括:獲取識別結果關于缺漏錯誤、增添錯誤和替換錯誤的信息,計算識別率,識別率包括缺漏識別率、增添識別率、替換識別率和總錯誤識別率。對各種可能出現(xiàn)的錯誤進行統(tǒng)計,使對asr引擎識別效果識別更加全面,有利于后續(xù)管理人員對asr引擎識別進行優(yōu)化,以及優(yōu)化標注方式。

        s5,利用音頻相關信息對asr引擎識別效果進行統(tǒng)計。

        步驟s5具體包括:

        s501,設定截幅比、音量、前信噪比和后信噪比的閾值范圍;

        s502,將音頻相關信息與閾值范圍進行比對,若超過閾值范圍則標記為異常音頻,并定位異常音頻;

        s503,計算異常音頻占比,并以web客戶端通過圖表展示。

        通過異常音頻占比,以及定位異常音頻,來展示asr引擎識別效果的好壞,并以web客戶端通過圖表展示,方便管理人員直觀獲取asr引擎識別效果的好壞。

        步驟s5具體包括:

        s511,對音頻時長、識別延時、語句長度和傳輸延時進行計算得到相關參數(shù);相關參數(shù)包括實時率、總實時率、排隊時延、識別延時。

        s512,設定相關參數(shù)的閾值范圍,若相關參數(shù)超過閾值范圍,對相關參數(shù)進行標記;

        s513,用web客戶端將相關參數(shù)以及帶標記的相關參數(shù)用圖表展示。

        相對于傳統(tǒng)的標注工具需要逐字進行標注,本發(fā)明在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率。本發(fā)明根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果。

        截幅比、音量、前信噪比、后信噪比用于分析音頻是否出現(xiàn)異常,音頻時長、識別延時、語句長度和傳輸延時用于統(tǒng)計asr引擎識別效果統(tǒng)計以及效果分析。

        對相關參數(shù)進行標記,并用圖標展示,有助于管理人員對asr引擎識別效果較差時,直觀獲取asr引擎識別效果較差的原因。

        設置實時率、總實時率、排隊時延、識別延時更加全面的判定asr引擎識別效果較差的原因,提高判定的準確率。

        本實施例還提出一種在線標注系統(tǒng),采用上述的一種在線標注方法,參考圖2,包括:

        解析子系統(tǒng),對原始音頻日志和短音頻進行解析,獲取識別結果和音頻相關信息;

        在線標注子系統(tǒng),對識別結果進行在線標注,得到標注結果;

        統(tǒng)計子系統(tǒng),根據識別結果和標注結果進行對比計算識別率,利用音頻相關信息對asr引擎識別效果進行統(tǒng)計;

        垂直分數(shù)據庫,分開存儲解析和標注不同的階段產生的數(shù)據。

        標注音頻管控子系統(tǒng),根據不同的業(yè)務場景建立不同的項目和任務對需要標注的音頻進行管控,提高標注的效率。

        對解析和標注不同的階段產生的數(shù)據,存儲至不同的數(shù)據庫,可以提高查詢的效率。本發(fā)明在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率。本發(fā)明根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果。

        本發(fā)明有以下有益效果:在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率;根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果;對各種可能出現(xiàn)的錯誤進行統(tǒng)計,使對asr引擎識別效果識別更加全面,有利于后續(xù)管理人員對asr引擎識別進行優(yōu)化,以及優(yōu)化標注方式。

        當前第1頁1 2 
        網友詢問留言 留言:0條
        • 還沒有人留言評論。精彩留言會獲得點贊!
        主站蜘蛛池模板: 国产精品中文av专线| 精品无码国产日韩制服丝袜| a级免费视频| 大胸美女吃奶爽死视频| 亚洲欧美日韩综合一区二区 | 三级纯黄午夜在线观看| 中文字幕日本最新乱码视频| 中文字幕日本| 亚欧精品视频在线观看免费| 亚洲欧洲无码av电影在线观看| 午夜福利yw在线观看2020| 国产丝袜AV| 国产美女高潮流白浆视频| 亚洲春色无码AV专区| 最新国产你懂的在线网址| 精品综合在线| 午夜免费福利小电影| 国产成人精品无人区一区| 人妻精品中文久久一区| 天天躁日日躁精品人妻| 人妻互换一二三区激情视频| 国产性色av高清在线观看 | 色吊丝av中文字幕亚洲?熟女| AV第一福利大全导航| 国产精品a无线| 国产成人亚洲精品青草| 国产成人午夜福利院| www.熟女| 在线观看AV热码| 青青草视频华人绿色在线| 国产综合久久99久久| 国产制服丝袜在线播放| 99精品国产一区在线看| 亚洲怡春院| 国产午夜福利片无码视频| 日韩高清国产中文字幕| 国产精品天天看天天狠| 国产乱子伦真实精品| 亚洲无码成人网| 人妻无码一二三区免得| 欧美老熟妇乱子伦牲交视频|