本發(fā)明涉及語音識別技術領域,尤其是涉及一種在線標注方法及系統(tǒng)。
背景技術:
在語音識別領域,必須事先獲得大量應用場景下原始語音的標注數(shù)據和音頻,才能投入到聲學模型訓練和語言模型的訓練中,從而獲得較高的語音識別準確率。
然而,原始語音只包含音頻,不包含標注數(shù)據,需要靠人工方式進行語音標注獲得標注數(shù)據。但是傳統(tǒng)的語音標注系統(tǒng)是逐字進行標注,效率低且人力成本高,并且傳統(tǒng)的標注系統(tǒng)是基于單機軟件,無法進行統(tǒng)一的數(shù)據管理。
技術實現(xiàn)要素:
針對傳統(tǒng)的語音標注系統(tǒng)是逐字進行標注,效率低且人力成本高的問題,本發(fā)明提出了一種在線標注方法及系統(tǒng),對asr引擎識別的原始音頻的日志和短音頻進行解析,獲得識別結果,在根據識別結果進行在線標注,提高標注效率和準確度。
為實現(xiàn)上述目的,本發(fā)明提供以下的技術方案:
一種在線標注方法,包括以下步驟:
s1,利用asr引擎識別待標注音頻得到原始音頻日志和短音頻;
s2,對原始音頻日志和短音頻進行解析,獲取識別結果和音頻相關信息;
s3,對識別結果進行在線標注,得到標注結果;
s4,根據識別結果和標注結果進行對比計算識別率;
s5,利用音頻相關信息對asr引擎識別效果進行統(tǒng)計。
相對于傳統(tǒng)的標注工具需要逐字進行標注,本發(fā)明在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率。本發(fā)明根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果。
作為優(yōu)選,所述音頻相關信息包括截幅比、音量、前信噪比、后信噪比、音頻時長、識別延時、語句長度和傳輸延時。
截幅比、音量、前信噪比、后信噪比用于分析音頻是否出現(xiàn)異常,音頻時長、識別延時、語句長度和傳輸延時用于統(tǒng)計asr引擎識別效果統(tǒng)計以及效果分析。
作為優(yōu)選,所述步驟s5具體包括:
s501,設定截幅比、音量、前信噪比和后信噪比的閾值范圍;
s502,將音頻相關信息與閾值范圍進行比對,若超過閾值范圍則標記為異常音頻,并定位異常音頻;
s503,計算異常音頻占比,并以web客戶端通過圖表展示。
通過異常音頻占比,以及定位異常音頻,來展示asr引擎識別效果的好壞,并以web客戶端通過圖表展示,方便管理人員直觀獲取asr引擎識別效果的好壞。
作為優(yōu)選,所述步驟s5具體包括:
s511,對音頻時長、識別延時、語句長度和傳輸延時進行計算得到相關參數(shù);
s512,設定相關參數(shù)的閾值范圍,若相關參數(shù)超過閾值范圍,對相關參數(shù)進行標記;
s513,用web客戶端將相關參數(shù)以及帶標記的相關參數(shù)用圖表展示。
對相關參數(shù)進行標記,并用圖標展示,有助于管理人員對asr引擎識別效果較差時,直觀獲取asr引擎識別效果較差的原因。
作為優(yōu)選,所述相關參數(shù)包括實時率、總實時率、排隊時延、識別延時。設置實時率、總實時率、排隊時延、識別延時更加全面的判定asr引擎識別效果較差的原因,提高判定的準確率。
作為優(yōu)選,所述步驟s4具體包括:獲取識別結果關于缺漏錯誤、增添錯誤和替換錯誤的信息,計算識別率,所述識別率包括缺漏識別率、增添識別率、替換識別率和總錯誤識別率。對各種可能出現(xiàn)的錯誤進行統(tǒng)計,使對asr引擎識別效果識別更加全面,有利于后續(xù)管理人員對asr引擎識別進行優(yōu)化,以及優(yōu)化標注方式。
一種在線標注系統(tǒng),采用上述的一種在線標注方法,包括:
解析子系統(tǒng),對原始音頻日志和短音頻進行解析,獲取識別結果和音頻相關信息;
在線標注子系統(tǒng),對識別結果進行在線標注,得到標注結果;
統(tǒng)計子系統(tǒng),根據識別結果和標注結果進行對比計算識別率,利用音頻相關信息對asr引擎識別效果進行統(tǒng)計;
垂直分數(shù)據庫,分開存儲解析和標注不同的階段產生的數(shù)據。對解析和標注不同的階段產生的數(shù)據,存儲至不同的數(shù)據庫,可以提高查詢的效率。本發(fā)明在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率。本發(fā)明根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果。
作為優(yōu)選,本發(fā)明還包括標注音頻管控子系統(tǒng),根據不同的業(yè)務場景建立不同的項目和任務對需要標注的音頻進行管控,提高標注的效率。
本發(fā)明有以下有益效果:在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率;根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果;對各種可能出現(xiàn)的錯誤進行統(tǒng)計,使對asr引擎識別效果識別更加全面,有利于后續(xù)管理人員對asr引擎識別進行優(yōu)化,以及優(yōu)化標注方式。
附圖說明
圖1是本實施例的方法流程圖;
圖2是本實施例的系統(tǒng)構成圖。
具體實施方式
實施例:
本實施例提出一種在線標注方法,參考圖1,包括以下步驟:
s1,利用asr引擎識別待標注音頻得到原始音頻日志和短音頻;
s2,對原始音頻日志和短音頻進行解析,獲取識別結果和音頻相關信息;音頻相關信息包括截幅比、音量、前信噪比、后信噪比、音頻時長、識別延時、語句長度和傳輸延時。
s3,對識別結果進行在線標注,得到標注結果;
s4,根據識別結果和標注結果進行對比計算識別率;
步驟s4具體包括:獲取識別結果關于缺漏錯誤、增添錯誤和替換錯誤的信息,計算識別率,識別率包括缺漏識別率、增添識別率、替換識別率和總錯誤識別率。對各種可能出現(xiàn)的錯誤進行統(tǒng)計,使對asr引擎識別效果識別更加全面,有利于后續(xù)管理人員對asr引擎識別進行優(yōu)化,以及優(yōu)化標注方式。
s5,利用音頻相關信息對asr引擎識別效果進行統(tǒng)計。
步驟s5具體包括:
s501,設定截幅比、音量、前信噪比和后信噪比的閾值范圍;
s502,將音頻相關信息與閾值范圍進行比對,若超過閾值范圍則標記為異常音頻,并定位異常音頻;
s503,計算異常音頻占比,并以web客戶端通過圖表展示。
通過異常音頻占比,以及定位異常音頻,來展示asr引擎識別效果的好壞,并以web客戶端通過圖表展示,方便管理人員直觀獲取asr引擎識別效果的好壞。
步驟s5具體包括:
s511,對音頻時長、識別延時、語句長度和傳輸延時進行計算得到相關參數(shù);相關參數(shù)包括實時率、總實時率、排隊時延、識別延時。
s512,設定相關參數(shù)的閾值范圍,若相關參數(shù)超過閾值范圍,對相關參數(shù)進行標記;
s513,用web客戶端將相關參數(shù)以及帶標記的相關參數(shù)用圖表展示。
相對于傳統(tǒng)的標注工具需要逐字進行標注,本發(fā)明在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率。本發(fā)明根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果。
截幅比、音量、前信噪比、后信噪比用于分析音頻是否出現(xiàn)異常,音頻時長、識別延時、語句長度和傳輸延時用于統(tǒng)計asr引擎識別效果統(tǒng)計以及效果分析。
對相關參數(shù)進行標記,并用圖標展示,有助于管理人員對asr引擎識別效果較差時,直觀獲取asr引擎識別效果較差的原因。
設置實時率、總實時率、排隊時延、識別延時更加全面的判定asr引擎識別效果較差的原因,提高判定的準確率。
本實施例還提出一種在線標注系統(tǒng),采用上述的一種在線標注方法,參考圖2,包括:
解析子系統(tǒng),對原始音頻日志和短音頻進行解析,獲取識別結果和音頻相關信息;
在線標注子系統(tǒng),對識別結果進行在線標注,得到標注結果;
統(tǒng)計子系統(tǒng),根據識別結果和標注結果進行對比計算識別率,利用音頻相關信息對asr引擎識別效果進行統(tǒng)計;
垂直分數(shù)據庫,分開存儲解析和標注不同的階段產生的數(shù)據。
標注音頻管控子系統(tǒng),根據不同的業(yè)務場景建立不同的項目和任務對需要標注的音頻進行管控,提高標注的效率。
對解析和標注不同的階段產生的數(shù)據,存儲至不同的數(shù)據庫,可以提高查詢的效率。本發(fā)明在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率。本發(fā)明根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果。
本發(fā)明有以下有益效果:在asr引擎識別結果的基礎上進行標注,可以節(jié)省標注成本,提高工作效率;根據識別結果和標注結果對比,分析識別結果缺漏,增添,替換等相關信息,確定asr引擎的識別效果;對各種可能出現(xiàn)的錯誤進行統(tǒng)計,使對asr引擎識別效果識別更加全面,有利于后續(xù)管理人員對asr引擎識別進行優(yōu)化,以及優(yōu)化標注方式。