1.本技術(shù)涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種客服話術(shù)的引導(dǎo)方法、裝置、計算機設(shè)備及存儲介質(zhì)。
背景技術(shù):2.隨著各行業(yè)服務(wù)質(zhì)量的提高,各大企業(yè)通過客戶服務(wù)熱線服務(wù)客戶提高客戶體驗,而傳統(tǒng)的客戶服務(wù)熱線的客服需要大量的話術(shù)培訓(xùn)和業(yè)務(wù)知識學(xué)習才能服務(wù)客戶,避免在跟客戶進行電話溝通的時候,由于準備工作的不足從而影響到客戶體驗。
3.部分公司通過在接入在線客服之前,需要客戶輸入相應(yīng)的數(shù)字選項,進而選擇相應(yīng)的服務(wù)通道,匹配相應(yīng)的在線客服與其進行在線會話。但是,仍存在客戶輸入數(shù)字與其要咨詢或者需要辦理的業(yè)務(wù)不配的情況,此時若重新接入其他在線客服的話,則需要耗費更多的等候時間,導(dǎo)致客服服務(wù)效率較低,客戶體驗感不好。
技術(shù)實現(xiàn)要素:4.本技術(shù)提供一種客服話術(shù)的引導(dǎo)方法、裝置、計算機設(shè)備及存儲介質(zhì),解決了現(xiàn)有技術(shù)客戶在會話業(yè)務(wù)辦理中,客服服務(wù)效率較低,用戶體驗感不好的問題。
5.第一方面,本技術(shù)實施例提供了一種客服話術(shù)的引導(dǎo)方法,包括:
6.在與客戶端進行在線會話的過程中,對來自所述客戶端的音頻信息進行情緒識別,且對所述音頻信息對應(yīng)的文本內(nèi)容進行向量轉(zhuǎn)換,得到包含通話文本向量與情緒標識的通話文件;
7.將所述通話文件輸入訓(xùn)練后的業(yè)務(wù)話術(shù)引導(dǎo)模型;所述業(yè)務(wù)話術(shù)引導(dǎo)模型包括業(yè)務(wù)場景匹配層和自然語言處理層;
8.通過所述業(yè)務(wù)場景匹配層基于所述通話文本向量進行業(yè)務(wù)分類,確定所述通話文本向量對應(yīng)的業(yè)務(wù)場景;
9.通過所述自然語言處理層基于所述業(yè)務(wù)場景與所述情緒標識,進行話術(shù)預(yù)測,輸出話術(shù)預(yù)測后的話術(shù)參考方案;所述話術(shù)參考方案用于引導(dǎo)與所述客戶端進行在線會話。
10.第二方面,本技術(shù)實施例還提供了一種客服話術(shù)的引導(dǎo)裝置,包括:
11.獲取模塊,在與客戶端進行在線會話的過程中,對來自所述客戶端的音頻信息進行情緒識別,且對所述音頻信息對應(yīng)的文本內(nèi)容進行向量轉(zhuǎn)換,得到包含通話文本向量與情緒標識的通話文件;
12.輸入模塊,將所述通話文件輸入訓(xùn)練后的業(yè)務(wù)話術(shù)引導(dǎo)模型;所述業(yè)務(wù)話術(shù)引導(dǎo)模型包括業(yè)務(wù)場景匹配層和自然語言處理層;
13.業(yè)務(wù)場景匹配模塊,通過所述業(yè)務(wù)場景匹配層基于所述通話文本向量進行業(yè)務(wù)分類,確定所述通話文本向量對應(yīng)的業(yè)務(wù)場景;
14.話術(shù)預(yù)測模塊,通過所述自然語言處理層基于所述業(yè)務(wù)場景與所述情緒標識,進行話術(shù)預(yù)測,輸出話術(shù)預(yù)測后的話術(shù)參考方案;所述話術(shù)參考方案用于引導(dǎo)與所述客戶端
network,cdn)、以及大數(shù)據(jù)和人工智能平臺等基礎(chǔ)云計算服務(wù)的云服務(wù)器。
28.本實施例提供的客服話術(shù)的引導(dǎo)方法可以由服務(wù)端執(zhí)行,例如,通過客戶端將音頻信息發(fā)送至服務(wù)端,服務(wù)端基于該音頻信息,執(zhí)行本實施例提供的客服話術(shù)的引導(dǎo)方法,進而得到話術(shù)預(yù)測后的話術(shù)參考方案,最后將該話術(shù)參考方案發(fā)送至客戶端。
29.在圖1之外的一些場景中,還可以是由客戶端執(zhí)行該客服話術(shù)的引導(dǎo)方法,直接根據(jù)客戶端的音頻信息,通過執(zhí)行本實施例提供的客服話術(shù)的引導(dǎo)方法,得到話術(shù)預(yù)測后的話術(shù)參考方案,然后將該話術(shù)參考方案發(fā)送至服務(wù)端進行存儲。
30.本技術(shù)實施例可以基于人工智能技術(shù)對相關(guān)的數(shù)據(jù)進行獲取和處理。其中,人工智能(artificial intelligence,ai)是利用數(shù)字計算機或者數(shù)字計算機控制的機器模擬、延伸和擴展人的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)。
31.人工智能基礎(chǔ)技術(shù)一般包括如傳感器、專用人工智能芯片、云計算、分布式存儲、大數(shù)據(jù)處理技術(shù)、操作/交互系統(tǒng)、機電一體化等技術(shù)。人工智能軟件技術(shù)主要包括計算機視覺技術(shù)、機器人技術(shù)、生物識別技術(shù)、語音處理技術(shù)、自然語言處理技術(shù)以及機器學(xué)習/深度學(xué)習等幾大方向。
32.可以理解地,自然語言處理(natural language processing,nlp)是人工智能的一個子領(lǐng)域,以語言為對象,利用計算機技術(shù)來分析、理解和處理自然語言,把計算機作為語言研究的強大工具,在計算機的支持下對語言信息進行定量化的研究,并提供可供人與計算機之間能共同使用的語言描寫。其中,還包括自然語言理解(naturallanguage understanding,nlu)、自然語言生成(natural languagegeneration,nlg)和對話管理器(dialogue management,dm)幾個部分。
33.圖2示出了本技術(shù)一實施例提供的客服話術(shù)的引導(dǎo)方法的實現(xiàn)流程圖。如圖2所示,提供一種客服話術(shù)的引導(dǎo)方法,其技術(shù)方案主要包括以下步驟s10-s40:
34.步驟s10、在與客戶端進行在線會話的過程中,對來自所述客戶端的音頻信息進行情緒識別,且對所述音頻信息對應(yīng)的文本內(nèi)容進行向量轉(zhuǎn)換,得到包含通話文本向量與情緒標識的通話文件。
35.在步驟s10中,在與客戶端進行在線會話的過程中,實時獲取客戶端的音頻信息。這里,音頻信息為單次會回合中的用戶語音內(nèi)容。例如,在與客戶端建立在線會話后,客服與客戶端之間能夠進行通話,此時如果用戶通過終端發(fā)送一次語音內(nèi)容,則該語音內(nèi)容即為音頻信息。
36.在本實施例中,可以利用情緒識別技術(shù)通過音頻信息中的聲學(xué)特征,根據(jù)語音情感數(shù)據(jù)庫識別出人物情緒,并設(shè)置為情緒標識。識別音頻信息的文本內(nèi)容,并將文本內(nèi)容轉(zhuǎn)換為業(yè)務(wù)話術(shù)引導(dǎo)模型能識別的通話文本向量,將情緒標識添加至通話文本向量后,得到用于預(yù)測話術(shù)的通話文件。
37.作為一個示例,在實現(xiàn)時對來自客戶端的音頻信息進行情緒識別,具體可以是先將音頻信息轉(zhuǎn)換成相應(yīng)的聲學(xué)特征圖,利用已有的情緒識別模型根據(jù)該聲學(xué)特征圖進行情緒標識匹配,得到情緒標識。或者,對音頻信息對應(yīng)的文本內(nèi)容進行情緒識別,得到語義情緒向量,然后結(jié)合聲學(xué)特征的情緒識別,得到聲學(xué)特征,利用相應(yīng)的融合算法將語義情緒向量與聲學(xué)特征進行融合后,對融合后的特征向量進行情緒標識的概率值匹配,進而得到情
緒標識。
38.在本技術(shù)的所有實施例中,對音頻信息對應(yīng)的文本內(nèi)容進行向量轉(zhuǎn)換可以采用已有的向量轉(zhuǎn)換策略實現(xiàn)。先對音頻信息進行文本識別,得到相應(yīng)的文本信息,然后按照向量轉(zhuǎn)換策略將文本信息轉(zhuǎn)換成對應(yīng)的通話文本向量。然后將通話文本向量與情緒標識進行關(guān)聯(lián),得到音頻信息對于的通話文件。
39.容易理解的是,實時通過客戶的情緒和通話內(nèi)容對客服進行話術(shù)引導(dǎo),可以提高客服在應(yīng)對不同業(yè)務(wù)問題時的對客戶進行答復(fù)的準確性,同時減少了對于客服的培訓(xùn)成本。將根據(jù)通話文件預(yù)測得到的話術(shù)參考方案提供給客服進行客服話術(shù)引導(dǎo),提供給客服的方式包括文字、圖形和語音。
40.在一實施例中,音頻信息為客服和客戶之間溝通的通話語音音頻信息,音頻信息的格式可以根據(jù)需求設(shè)定,比如音頻信息的語音取樣的比特率為128kbps(千比特每秒),以有利于獲取語音質(zhì)量高的音頻信息,所述音頻信息可以采用雙向通道錄制方式,分別通過客戶與客服的雙方的聲源進行錄制,以保證音頻信息的獲取質(zhì)量。
41.如圖3所示,出了本實施例步驟s10的具體實現(xiàn)流程。作為一個示例,步驟s10中,包括:
42.步驟s101、對所述音頻信息進行文本向量轉(zhuǎn)換與聲學(xué)特征識別,得到文本向量與聲學(xué)特征;
43.步驟s102、若根據(jù)所述文本向量從預(yù)設(shè)的語義庫中匹配出語義情緒標識,則將所述語義情緒標識與所述聲學(xué)特征的聲學(xué)情緒標識,作為情緒標識;
44.步驟s103、若根據(jù)所述文本向量不能從預(yù)設(shè)的語義庫中匹配出語義情緒標識,則將所述聲學(xué)特征的聲學(xué)情緒標識作為情緒標識;
45.步驟s104、將所述情緒標識與所述文本向量關(guān)聯(lián),得到通話文件。
46.在步驟s101中,根據(jù)語音識別技術(shù)(automatic speech recognition,asr)將將所述音頻信息進行語音轉(zhuǎn)文字識別,得到通話文本,通過分詞器將所述通話文本進行向量轉(zhuǎn)換,得到向量文本。再通過對音頻信息進行分幀得到多個對話片段,根據(jù)各對話片段的聲學(xué)特征,得到對應(yīng)的聲學(xué)特征。
47.在一實施例中,利用word2vec算法作為分詞器,word2vec算法為將詞語轉(zhuǎn)換成詞嵌入向量的算法,將所述對話文本中的每個字或者詞語進行向量轉(zhuǎn)換,將向量轉(zhuǎn)換后的字符嵌入向量和詞嵌入向量進行拼接,得到所述向量文本,所述向量轉(zhuǎn)換包括將字符轉(zhuǎn)換成字符嵌入向量和將詞語轉(zhuǎn)換成詞嵌入向量的轉(zhuǎn)換過程,所述向量文本為包括字符嵌入向量和/或詞嵌入向量的向量數(shù)組。
48.在另一實施例中,還可以通過獨熱編碼對通話文本進行離散化處理,的帶對應(yīng)的向量文本。one-hot編碼,又稱為一位有效編碼,主要是采用n位狀態(tài)寄存器來對n個狀態(tài)進行編碼,每個狀態(tài)都由他獨立的寄存器位,并且在任意時候只有一位有效。對于每一個特征,如果它有m個可能值,那么經(jīng)過one-hot編碼后,就變成了m個二元特征。并且,這些特征互斥,每次只有一個激活。
49.可理解地,語音識別技術(shù)(automatic speech recognition,asr)就是把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本的技術(shù),通過語音識別技術(shù),可以將音頻信息轉(zhuǎn)換成文本內(nèi)容,即對音頻信息進行信號處理后,按幀(毫秒級)拆分出預(yù)設(shè)段的波形,并對拆分出的預(yù)設(shè)段波形按照
人耳特征轉(zhuǎn)換成多維向量信息,將轉(zhuǎn)換后的多維向量信息進行識別出狀態(tài)信息,在將狀態(tài)信息組合成音素,最后將音素組成字詞并串連成句的技術(shù),識別過程為運用語音識別技術(shù)識別音頻信息中音頻包含的文本內(nèi)容的過程,經(jīng)過識別之后輸出通話文本,通話文本為音頻信息中的文本內(nèi)容。
50.在步驟s102中,由于在溝通時,會產(chǎn)生部分語氣詞匯,通過這些語氣詞匯可直接利用對應(yīng)的文本向量從預(yù)設(shè)的語義庫中匹配出語義情緒標識,并利用匹配得到的語義情緒標識與聲學(xué)特征的聲學(xué)情緒標識,作為情緒標識以用于話術(shù)預(yù)測。
51.在步驟s103中,還會存在通過文本向量無法從預(yù)設(shè)的語義庫中匹配出語義情緒標識,此時則根據(jù)提取出的聲學(xué)特征利用語音情感識別技術(shù)識別出聲學(xué)情緒標識作為情緒標識。
52.在一實施例中,利用語音情感識別技術(shù)對語音的聲學(xué)特征進行提取,所提取的聲學(xué)特征包括能量(energy)、音高(pitch)和梅爾頻率倒譜系數(shù)(mfcc),再根據(jù)語音情感數(shù)據(jù)庫進行分類識別,得到對應(yīng)的情緒標識,常見基礎(chǔ)情緒包括生氣、高興、害怕、悲傷、其他和中性。
53.在步驟s104中,將情緒標識與文本向量關(guān)聯(lián),作為預(yù)測話術(shù)的通話文件進行輸出。結(jié)合情緒標識與文本向量進行話術(shù)引導(dǎo)預(yù)測,可以提高預(yù)測的準確性。
54.步驟s20、將所述通話文件輸入訓(xùn)練后的業(yè)務(wù)話術(shù)引導(dǎo)模型。所述業(yè)務(wù)話術(shù)引導(dǎo)模型包括業(yè)務(wù)場景匹配層和自然語言處理層。
55.在步驟s20中,將通話文件輸入訓(xùn)練后的業(yè)務(wù)話術(shù)引導(dǎo)模型進行話術(shù)預(yù)測,業(yè)務(wù)話術(shù)引導(dǎo)模型需要通過大量的樣本進行訓(xùn)練以保證最后所挖掘出的人物特征的準確性。
56.在一實施例中,業(yè)務(wù)話術(shù)引導(dǎo)模型基于業(yè)務(wù)場景匹配層和自然語言處理層構(gòu)建,業(yè)務(wù)場景匹配層根據(jù)通話文件進行業(yè)務(wù)場景的匹配,基于匹配后的業(yè)務(wù)場景,自然語言處理層根據(jù)通話文件進行話術(shù)預(yù)測,從而幫助客服進行話術(shù)引導(dǎo)。
57.在一實施例中,業(yè)務(wù)場景匹配層利用了分類算法,通過通話文件中的通話文本向量進行業(yè)務(wù)場景的分類預(yù)測,從而達到業(yè)務(wù)場景匹配的目的。其中,分類算法可以但不限于為以下算法,決策樹分類算法、神經(jīng)網(wǎng)絡(luò)分類算法、支持向量機分類算法(svm)、隨機森林算法、邏輯回歸算法(logistic regression,lr)和xgboost算法。
58.步驟s30、通過所述業(yè)務(wù)場景匹配層對所述通話文本向量進行業(yè)務(wù)分類,確定所述通話文本向量對應(yīng)的業(yè)務(wù)場景。
59.在步驟s30中,利用訓(xùn)練后的業(yè)務(wù)話術(shù)引導(dǎo)模型中的業(yè)務(wù)場景匹配層提取通話文件中與業(yè)務(wù)相關(guān)的多個業(yè)務(wù)特征向量,得到對應(yīng)的業(yè)務(wù)特征向量集合,基于業(yè)務(wù)特征向量集合利用業(yè)務(wù)場景匹配層中的分類算法進行業(yè)務(wù)分類預(yù)測,匹配通話文本向量對應(yīng)的業(yè)務(wù)場景。其中,業(yè)務(wù)場景匹配層需要利用業(yè)務(wù)資料庫中的多個業(yè)務(wù)場景樣本進行訓(xùn)練,以保證分類結(jié)果匹配對應(yīng)的業(yè)務(wù)場景的準確性。
60.該實施例為通過所述業(yè)務(wù)場景匹配層基于所述通話文本向量進行業(yè)務(wù)分類,確定所述通話文本向量對應(yīng)的業(yè)務(wù)場景的步驟s30,包括:
61.步驟s301、根據(jù)預(yù)先配置的包括多個停用文本向量的停用文本向量集合,從通話文本向量中剔除所述停用文本向量,得到業(yè)務(wù)特征向量集合;
62.步驟s302、利用所述業(yè)務(wù)場景匹配層中的決策樹算法,將所述業(yè)務(wù)特征向量集合
中各業(yè)務(wù)特征向量作為輸入,通過所述決策樹的結(jié)點傳遞順序?qū)Ω魉鰳I(yè)務(wù)特征向量進行判斷,得到的葉節(jié)點以確定所述通話文本向量對應(yīng)的業(yè)務(wù)場景。
63.在步驟s301中,在客戶與客服溝通中,溝通內(nèi)容使用到多個字詞,其中的字詞包括停用字詞,根據(jù)預(yù)先配置的停用文本向量集合也可以為停用文本庫等。基于停用文本向量集合從通話文本向量中剔除多個停用文本向量,保留下的若干個業(yè)務(wù)特征向量,作為用于業(yè)務(wù)分類的業(yè)務(wù)特征向量集合。去除停用文本向量有利于提高分類的準確性。
64.可以理解地,停用詞在通常意義上,停用詞大致分為兩類。一類是人類語言中包含的功能詞,這些功能詞極其普遍,與其他詞相比,功能詞沒有什么實際含義,比如英文的“the、is、at、which、on”,中文的“了、呢、啊”。但是對于搜索引擎來說,當所要搜索的短語包含功能詞,停用詞的使用就會導(dǎo)致問題。另一類詞包括詞匯詞,比如“want”等,這些詞應(yīng)用十分廣泛,但是對這樣的詞搜索引擎無法保證能夠給出真正相關(guān)的搜索結(jié)果,難以幫助縮小搜索范圍,同時還會降低搜索的效率,所以通常會把這些詞從問題中移去,從而提高搜索性能。
65.在步驟s302中,利用業(yè)務(wù)場景匹配層中的分類算法對業(yè)務(wù)特征向量集合進行業(yè)務(wù)分類,從而確定通話文本向量對應(yīng)的業(yè)務(wù)場景。分類算法的發(fā)展逐漸成熟,利用分類算法對多個特征進行分類,從而保證分類的準確性。
66.在一實施例中,業(yè)務(wù)場景為不同業(yè)務(wù)的線上會話場景,以及對應(yīng)業(yè)務(wù)的資料詳情。通過業(yè)務(wù)場景匹配層對業(yè)務(wù)特征向量集合進行業(yè)務(wù)分類示例如下,若業(yè)務(wù)特征向量集合中業(yè)務(wù)特征向量所對應(yīng)的業(yè)務(wù)特征文本內(nèi)容為“了解、運動類、保障、費用”,通過上述業(yè)務(wù)特征文本內(nèi)容進行業(yè)務(wù)場景匹配為“某運動類型保險”的業(yè)務(wù)場景。
67.在一實施例中,分類算法可以利用決策樹算法進行業(yè)務(wù)分類,決策樹算法是一種逼近離散函數(shù)值的方法,首先對數(shù)據(jù)進行處理,利用歸納算法生成可讀的規(guī)則和決策樹,然后利用決策樹根據(jù)業(yè)務(wù)特征向量從上往下的判斷流程,根據(jù)業(yè)務(wù)特征向量的結(jié)點類別,分支成下一結(jié)點的判斷與決策,如果結(jié)點不再是一個判斷條件,而是一個葉節(jié)點,那么它就是一個分類決策。本實施例利用較為容易理解的方式進行示例,當所保留的業(yè)務(wù)特征向量所表征的業(yè)務(wù)特征為{了解、運動類、保障、費用},根據(jù)決策樹利用信息熵訓(xùn)練后的業(yè)務(wù)特征權(quán)重進行依次判斷,所獲得的業(yè)務(wù)特征權(quán)重排序如下{運動類》了解》保障》費用};首先通過業(yè)務(wù)特征權(quán)重較大的{應(yīng)用類型=運動類}作為根節(jié)點,其中結(jié)點類別包括{應(yīng)用類型∈運動類、意外類、健康類};其次結(jié)點為{溝通需求=了解},其中結(jié)點類別包括{溝通需求∈了解、理賠、退保}以下結(jié)點所對應(yīng)的結(jié)點類別不再一一贅述;再次結(jié)點為{應(yīng)用需求=保障},最終得到的葉節(jié)點為{咨詢方向=費用},并得出對應(yīng)的分類結(jié)果“某運動類型保險的資費”68.在另一實施例中,分類算法可以利用隨機森林算法,隨機森林是由很多決策樹構(gòu)成的,不同決策樹之間沒有關(guān)聯(lián)。當進行分類任務(wù)時,新的輸入樣本進入,利用森林中的每一棵決策樹,分別通過上一實施例決策樹的分類方式進行判斷和分類,每個決策樹會得到一個自己的分類結(jié)果,決策樹的分類結(jié)果中哪一個分類最多,那么隨機森林就會把這個結(jié)果當做最終的結(jié)果。
69.可以理解地,隨機森林算法(random forest,rf)為一種利用多個決策樹對樣本進行訓(xùn)練并預(yù)測的一種分類算法,它屬于bagging類型,通過組合多個弱分類器,最終結(jié)果通過投票或取均值,使得整體模型的結(jié)果具有較高的精確度和泛化性能。其可以取得不錯成
績,主要歸功于“隨機”和“森林”,一個使它具有抗過擬合能力,一個使它更加精準。
70.步驟s40、通過所述自然語言處理層基于所述業(yè)務(wù)場景與所述情緒標識,進行話術(shù)預(yù)測,輸出話術(shù)預(yù)測后的話術(shù)參考方案;所述話術(shù)參考方案用于引導(dǎo)與所述客戶端進行在線會話。
71.在步驟s40中,自然語言處理目前還無法做到精確地對輸入的自然語言進行回復(fù),但是通過將其約束在某個業(yè)務(wù)范圍內(nèi),則可以保證答復(fù)結(jié)果。基于匹配后的業(yè)務(wù)場景,利用自然語言處理層中的對話管理器,對通話文件進行決策預(yù)測匹配對應(yīng)的話術(shù)策略,并將匹配到的話術(shù)策略所對應(yīng)話術(shù)參考方案進行輸出,及時為客服提供話術(shù)引導(dǎo),以輔助客服進行業(yè)務(wù)話術(shù)的講解,從而提客服的服務(wù)質(zhì)量。
72.可以理解地,自然語言處理(natural language processing,nlp)以語言為對象,利用計算機技術(shù)來分析、理解和處理自然語言,把計算機作為語言研究的強大工具,在計算機的支持下對語言信息進行定量化的研究,并提供可供人與計算機之間能共同使用的語言描寫。其中,還包括自然語言理解(naturallanguage understanding,nlu)、自然語言生成(natural languagegeneration,nlg)和對話管理器(dialogue management,dm)幾個部分。其中,自然語言理解就是將輸入的句子或者語音識別結(jié)果轉(zhuǎn)換成計算機能理解的表征,并進行意圖識別和語義理解;對話管理器則是根據(jù)當前對話管理狀態(tài)判斷系統(tǒng)應(yīng)采取的對話策略;自然語言生成是將系統(tǒng)轉(zhuǎn)換為自然語言進行輸出。
73.如圖4所示,在通過所述自然語言處理層基于所述業(yè)務(wù)場景與所述情緒標識,進行話術(shù)預(yù)測,輸出話術(shù)預(yù)測后的話術(shù)參考方案;所述話術(shù)參考方案用于引導(dǎo)與所述客戶端進行在線會話的步驟s40中,包括:
74.步驟s401、基于所述業(yè)務(wù)場景利用所述自然語言處理層,根據(jù)所述通話文本向量和所述情緒標識進行客戶端的意圖預(yù)測;
75.步驟s402、根據(jù)所述意圖預(yù)測后的意圖預(yù)測結(jié)果從訓(xùn)練后的話術(shù)策略庫中匹配對應(yīng)的話術(shù)策略,得到至少一個話術(shù)策略向量;
76.步驟s403、將所述話術(shù)策略向量轉(zhuǎn)換為文本,得到話術(shù)參考方案進行輸出。
77.在步驟s401中,利用自然語言處理層中的自然語言理解對所輸入的通話文件進行意圖預(yù)測,根據(jù)通話文件中的情緒標識進行情感識別,且根據(jù)通話文本向量所對應(yīng)的語言含義進行意圖預(yù)測。意圖預(yù)測就是通過對通話文件理解后,了解客戶想要表達的語言含義。
78.在一實施例中,自然語言理解將通話文本向量還包括省略回復(fù)、指代消解和實體識別。
79.可以理解地,自然語言理解(natural language understanding,nlu):使計算機理解自然語言,具體來說就是理解語言、文本,提取出有用的信息,用于下游的任務(wù)。它可以是使自然語言結(jié)構(gòu)化,比如分詞、詞性標注、句法分析等;也可以是表征學(xué)習,字、詞、句子的向量表示(embedding),構(gòu)建文本表示的文本分類。自然語言理解通過產(chǎn)生適合對話任務(wù)的語義表示,主要通過分詞、詞性標注、命名實體識別、句法分析、指代消解等進行語義解析產(chǎn)生句子意義進行意圖識別,從中抽取槽的填充值,進而完成語義表示。
80.在步驟s402中,根據(jù)意圖預(yù)測結(jié)果通過自然語言處理層中的對話管理器匹配對應(yīng)的話術(shù)策略,得到對應(yīng)的話術(shù)策略向量集合,該話術(shù)策略向量集合是話術(shù)參考方案的向量表征。其中話術(shù)參考方案包括業(yè)務(wù)上的話術(shù)內(nèi)容,用以對客戶的業(yè)務(wù)溝通進行業(yè)務(wù)話術(shù)引
導(dǎo),還包括情緒化書內(nèi)容,根據(jù)客戶的情緒進行相應(yīng)的情緒安撫等的情感話術(shù)引導(dǎo)。對話管理器通過大量的該業(yè)務(wù)場景對話進行訓(xùn)練學(xué)習后,才能針對意圖預(yù)測結(jié)果進行匹配,從而預(yù)測客戶希望做的。
81.可以理解地,對話管理器(dialog management,dm)為對話系統(tǒng)的主體,控制著對話的架構(gòu)和結(jié)構(gòu),接受從自然語言理解輸入,維護一些狀態(tài),與任務(wù)管理器交互,并將輸出傳遞給自然語言生成。其中,對話管理分為兩個子模塊,對話狀態(tài)追蹤(dialogue state tracking,dst)和對話策略學(xué)習(dialogue policy learning,dpl)。
82.在步驟s403中,利用自然語言處理層的自然語言生成將話術(shù)策略向量集合進行文本轉(zhuǎn)換,得到用于人類識別的話術(shù)參考方案輸出至顯示設(shè)備或播放設(shè)備,用于輔助客服的業(yè)務(wù)在線會話。
83.在一實施例中,將話術(shù)參考方案輸出至顯示設(shè)備,當話術(shù)參考方案中包括情感話術(shù)“先生您好,請您稍等,正在為您提供解決方案”,“先生請您先不要著急,正在為您辦理業(yè)務(wù)”,業(yè)務(wù)話術(shù)“該方案流程為通過確認您的身份在線進行辦理”。通過將以上話術(shù)參考方案,通過文字的方式展示在客服人員的顯示設(shè)備,以對客服人員進行話術(shù)引導(dǎo)和話術(shù)實時培訓(xùn)。
84.可以理解地,自然語言生成(nlg)是語言技術(shù)的一個方面,側(cè)重于從結(jié)構(gòu)化數(shù)據(jù)或結(jié)構(gòu)化表示(如知識庫或邏輯形式)生成自然語言,選擇需要向用戶表達的概念,計劃如何用詞句表達這些概念,可以說一個nlg系統(tǒng)就像一個翻譯器將數(shù)據(jù)轉(zhuǎn)換成自然語言表示。
85.在另一實施例中,還可以通過語音合成技術(shù)(text to speech,tts)將輸出至客服人員的話術(shù)參考方案進行語音播報,客服人員在與客戶溝通期間,將話術(shù)參考方案中的內(nèi)容轉(zhuǎn)化為對應(yīng)的語音,通過播放設(shè)備播放給客服人員,從而引導(dǎo)客服與客戶端進行在線會話。語音合成技術(shù)涉及聲學(xué)、語言學(xué)、數(shù)學(xué)信號處理技術(shù)、多媒體技術(shù)等多個學(xué)科技術(shù),通常用于把文字轉(zhuǎn)換成自然流暢的語音輸出。
86.圖5是本技術(shù)另一實施例提供的一種人物特征的挖掘方法的流程圖。如圖5所示,與圖2示出的實施例不同的是,在步驟s30、通過所述業(yè)務(wù)場景匹配層基于所述通話文本向量進行業(yè)務(wù)分類,確定所述通話文本向量對應(yīng)的業(yè)務(wù)場景的步驟之前,還包括步驟s51-s54具體地:
87.步驟s51、獲取多個業(yè)務(wù)場景樣本,將所述業(yè)務(wù)場景樣本中的業(yè)務(wù)相關(guān)詞轉(zhuǎn)化為業(yè)務(wù)特征向量,得到多個業(yè)務(wù)特征向量集合;
88.步驟s52、將所述業(yè)務(wù)特征向量集合輸入所述業(yè)務(wù)場景匹配層,所述業(yè)務(wù)場景匹配層利用決策樹算法中的決策樹,根據(jù)多個所述業(yè)務(wù)特征向量進行逐一判斷,從而訓(xùn)練對所述業(yè)務(wù)特征向量集合進行業(yè)務(wù)分類;
89.在一實施例中,通過多個業(yè)務(wù)場景樣本對業(yè)務(wù)場景匹配層進行訓(xùn)練,通過將業(yè)務(wù)場景樣本中的業(yè)務(wù)相關(guān)詞轉(zhuǎn)化為業(yè)務(wù)特征向量,利用隨機森林算法根據(jù)業(yè)務(wù)特征向量集合進行業(yè)務(wù)場景的分類學(xué)習,以保證業(yè)務(wù)場景分類的準確性。其中,隨機森林算法對業(yè)務(wù)特征向量集合進行有放回的抽樣,每次從原來的n個訓(xùn)練樣本中有放回地隨機抽取n個樣本,得到多個樣本集。從候選的特征中隨機抽取m個特征,作為當前決策的備選特征,用業(yè)務(wù)特征向量集合作為訓(xùn)練樣本構(gòu)造決策樹,決策樹通過對多個業(yè)務(wù)特征向量集合中的業(yè)務(wù)特征向量進行測算得到各業(yè)務(wù)特征向量的權(quán)重,訓(xùn)練后的決策樹根據(jù)輸入的業(yè)務(wù)特征向量集合中
的業(yè)務(wù)特征向量做出預(yù)測,進行輸出。在得到所需數(shù)目的決策樹后,隨機森林方法對這些決策樹的輸出進行投票,以得票最多的類作為隨機森林的決策,從而確定業(yè)務(wù)特征向量集合所對應(yīng)的業(yè)務(wù)場景。
90.可以理解地,隨機森林算法是一種監(jiān)督學(xué)習算法,隨機森林就是建立很多決策樹,組成一個決策樹的“森林”,通過多棵樹投票來進行決策。這種方法能夠有效地提高對新樣本的分類準確度。隨機森林在以決策樹為基學(xué)習器構(gòu)建bagging集成(樣本的隨機選取)的基礎(chǔ)上,進一步在決策樹的訓(xùn)練過程中引入隨機屬性選擇。具體來說,傳統(tǒng)決策樹在選擇劃分屬性時是在當前結(jié)點的屬性集合中選擇一個最優(yōu)屬性;而在隨機森林中,對基決策樹的每個結(jié)點,先從該結(jié)點的屬性集合中隨機選擇一個包含若干個屬性的子集,然后在從這個子集中選擇一個最優(yōu)屬性用于劃分。
91.步驟s53、將獲取的各個業(yè)務(wù)場景下的業(yè)務(wù)溝通樣本進行角色劃分,將得到包括客服會話和客戶會話的在線會話樣本集合;
92.步驟s54、將所述在線會話樣本集合輸入所述自然語言處理層中的對話管理器,利用所述對話管理器學(xué)習各個業(yè)務(wù)場景下匹配對應(yīng)的所述話術(shù)策略。
93.在一實施例中,通過獲取各業(yè)務(wù)場景下的歷史溝通記錄作為業(yè)務(wù)溝通樣本,并將業(yè)務(wù)溝通樣本進行角色劃分后作為在線會話樣本集合輸入自然語言處理層,通過利用自然語言處理層中的對話管理器學(xué)習各個業(yè)務(wù)場景下匹配對應(yīng)的話術(shù)策略,從而保證對客服的在線會話業(yè)務(wù)的輔助。
94.可以理解地,利用對話策略學(xué)習子模塊學(xué)習根據(jù)通話文件匹配對應(yīng)的話術(shù)策略。其中,對話管理器包括對話狀態(tài)追蹤(dialogue state tracking,dst)和對話策略學(xué)習(dialogue policy learning,dpl),而對話策略學(xué)習子模塊dpl可以為深度強化學(xué)習,深度強化學(xué)習所使用算法可以利用卷積神經(jīng)網(wǎng)絡(luò)、長短期記憶網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等。
95.可以理解地,長短期記憶網(wǎng)絡(luò)(long short-term memory,lstm)基于傳統(tǒng)rnn(recurrentneural networks)網(wǎng)絡(luò)改進的變種網(wǎng)絡(luò),能很好地解決梯度爆炸(exploding gradient)和梯度消失(vanishing gradient)問題,讓循環(huán)網(wǎng)絡(luò)具備更強更好的記憶性能。
96.在步驟s40、所述通過所述自然語言處理層基于所述業(yè)務(wù)場景與所述情緒標識,進行話術(shù)預(yù)測,輸出話術(shù)預(yù)測后的話術(shù)參考方案;所述話術(shù)參考方案用于引導(dǎo)與所述客戶端進行在線會話的步驟之后,還包括再一實施例步驟s51-s54,具體地::
97.步驟s61、獲取與客戶端在線會話完成后的音頻記錄文件,運用語音分割算法對所述音頻記錄文件進行客服音頻提取,得到客服音頻信息;
98.步驟s62、對客服音頻信息進行情緒識別,且對所述客服音頻信息對應(yīng)的文本內(nèi)容進行向量轉(zhuǎn)換,得到包含客服通話文本向量與客服情緒標識的客服通話文件。
99.在一實施例中,通過保留客服與客戶之間的會話完成后的音頻記錄文件,根據(jù)客服音頻信息進行客服的服務(wù)質(zhì)檢。其中,客服音頻信息可以根據(jù)錄制生源的不同進行直接區(qū)分,從而得到客服音頻信息;還可以運用語音分割算法對所述音頻記錄文件進行客服聲學(xué)特征提取,根據(jù)提取的客服聲學(xué)特征輸入音頻角色分割模型,識別出所述音頻記錄文件中的客服音頻和客戶音頻,得到客服音頻信息;分割出客服的音頻信息,并進行音頻識別得到包含客服通話文本向量與客服情緒標識的客服通話文件。通過對客服通話文件的情緒和所回答話術(shù)進行識別,進行客服的服務(wù)質(zhì)檢。
100.在另一實施例中,客服與客戶之間的會話完成后的音頻記錄文件進行利用客服聲學(xué)特征進行語音角色分割后,作為在線會話樣本用于訓(xùn)練業(yè)務(wù)話術(shù)引導(dǎo)模型。
101.在一實施例中,提供一種客服話術(shù)的引導(dǎo)裝置,該客服話術(shù)的引導(dǎo)裝置與上述實施例中客服話術(shù)的引導(dǎo)方法一一對應(yīng)。如圖6所示,該客服話術(shù)的引導(dǎo)裝置包括獲取模塊11、輸入模塊12、業(yè)務(wù)場景匹配模塊13和話術(shù)預(yù)測模塊14,各功能模塊詳細說明如下:
102.獲取模塊11,在與客戶端進行在線會話的過程中,對來自所述客戶端的音頻信息進行情緒識別,且對所述音頻信息對應(yīng)的文本內(nèi)容進行向量轉(zhuǎn)換,得到包含通話文本向量與情緒標識的通話文件;
103.輸入模塊12,將所述通話文件輸入訓(xùn)練后的業(yè)務(wù)話術(shù)引導(dǎo)模型;所述業(yè)務(wù)話術(shù)引導(dǎo)模型包括業(yè)務(wù)場景匹配層和自然語言處理層;
104.業(yè)務(wù)場景匹配模塊13,通過所述業(yè)務(wù)場景匹配層對所述通話文本向量進行業(yè)務(wù)分類14,確定所述通話文本向量對應(yīng)的業(yè)務(wù)場景;
105.話術(shù)預(yù)測模塊,通過所述自然語言處理層基于所述業(yè)務(wù)場景與所述情緒標識,進行話術(shù)預(yù)測,輸出話術(shù)預(yù)測后的話術(shù)參考方案;所述話術(shù)參考方案用于引導(dǎo)客服與所述客戶端進行在線會話。
106.關(guān)于客服話術(shù)的引導(dǎo)裝置的具體限定可以參見上文中對于客服話術(shù)的引導(dǎo)方法的限定,在此不再贅述。上述客服話術(shù)的引導(dǎo)裝置中的各個模塊可全部或部分通過軟件、硬件及其組合來實現(xiàn)。上述各模塊可以硬件形式內(nèi)嵌于或獨立于計算機設(shè)備中的處理器中,也可以以軟件形式存儲于計算機設(shè)備中的存儲器中,以便于處理器調(diào)用執(zhí)行以上各個模塊對應(yīng)的操作。
107.在一個實施例中,提供了一種計算機設(shè)備,該計算機設(shè)備可以是客戶端或者服務(wù)端,其內(nèi)部結(jié)構(gòu)圖可以如圖7所示。該計算機設(shè)備包括通過系統(tǒng)總線連接的處理器、存儲器、網(wǎng)絡(luò)接口和數(shù)據(jù)庫。其中,該計算機設(shè)備的處理器用于提供計算和控制能力。該計算機設(shè)備的存儲器包括可讀存儲介質(zhì)、內(nèi)存儲器。該可讀存儲介質(zhì)存儲有操作系統(tǒng)、計算機程序和數(shù)據(jù)庫。該內(nèi)存儲器為可讀存儲介質(zhì)中的操作系統(tǒng)和計算機程序的運行提供環(huán)境。該計算機設(shè)備的網(wǎng)絡(luò)接口用于與外部的終端通過網(wǎng)絡(luò)連接通信。該計算機程序被處理器執(zhí)行時以實現(xiàn)一種客服話術(shù)的引導(dǎo)方法。
108.在一個實施例中,提供了一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,處理器執(zhí)行計算機程序時實現(xiàn)上述實施例中客服話術(shù)的引導(dǎo)方法。
109.在一個實施例中,提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)上述實施例中客服話術(shù)的引導(dǎo)方法。
110.本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關(guān)的硬件來完成,所述的計算機程序可存儲于一非易失性計算機可讀取存儲介質(zhì)中,該計算機程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,本技術(shù)所提供的各實施例中所使用的對存儲器、存儲、數(shù)據(jù)庫或其它介質(zhì)的任何引用,均可包括非易失性和/或易失性存儲器。非易失性存儲器可包括只讀存儲器(rom)、可編程rom(prom)、電可編程rom(eprom)、電可擦除可編程rom(eeprom)或閃存。易失性存儲器可包括隨機存取存儲器(ram)或者外部高速緩沖存儲器。作為說明而非局限,ram以多種形式可得,
諸如靜態(tài)ram(sram)、動態(tài)ram(dram)、同步dram(sdram)、雙數(shù)據(jù)率sdram(ddrsdram)、增強型sdram(esdram)、同步鏈路(synchlink)dram(sldram)、存儲器總線(rambus)直接ram(rdram)、直接存儲器總線動態(tài)ram(drdram)、以及存儲器總線動態(tài)ram(rdram)等。
111.所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡潔,僅以上述各功能單元、模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能單元、模塊完成,即將所述裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能單元或模塊,以完成以上描述的全部或者部分功能。
112.以上所述實施例僅用以說明本技術(shù)的技術(shù)方案,而非對其限制;盡管參照前述實施例對本技術(shù)進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本技術(shù)各實施例技術(shù)方案的精神和范圍,均應(yīng)包含在本技術(shù)的保護范圍之內(nèi)。