本發明涉及人工智能以及醫療票據處理,具體涉及一種基于病種預測的用藥模板構建與審查方法、介質和設備。
背景技術:
1、對于外部票據管理平臺等系統而言,其通常僅能獲取票據的結構化數據(如藥品清單、金額等),而缺乏真實的病種診斷或醫保入組信息。這一“數據標簽缺失”的現狀,使得傳統的、依賴明確病種標簽的監督式用藥合理性審查模型難以直接應用。
2、為突破此限制,現有技術嘗試通過機器學習方法,基于票據內容(如藥品、科室)預測其可能對應的病種,以生成偽標簽。然而,僅獲得單一的病種預測結果,尚不足以支撐對用藥方案合理性的深度分析與判斷。因為一個完整的用藥方案審查,不僅需要知道“可能是什么病”,更需要知道“針對這個病,常規、合理且完整的用藥模板是什么”,以及“當前票據的用藥方案與這個常規模式相比,存在哪些具體的差異或風險”。目前,缺乏一種能夠從無標簽或弱標簽的票據數據中,自動挖掘并構建這種與病種關聯的、結構化的用藥知識模板,并利用該模板進行精細化、可解釋的用藥合理性審查的系統性方法。
技術實現思路
1、鑒于上述問題,本發明提供了一種基于病種預測的用藥模板構建與審查的技術方案,用以解決在缺乏真實病種標簽的醫療票據數據環境下,如何自動構建與病種關聯的用藥知識模板,并基于此實現對票據用藥合規性的自動化、智能化審查的技術問題。
2、為實現上述目的,在第一方面,本發明提供了一種基于病種預測的用藥模板構建與審查方法,所述方法包括:
3、s1:獲取醫療票據集合,對票據中的結構化數據進行標準化預處理,生成包含歸一化藥品名稱序列的標準化票據數據,所述結構化數據包括藥品清單、就診科室信息及患者畫像信息;
4、s2:將所述標準化票據數據輸入至基于偽標簽機制訓練的病種預測模型,獲取各票據對應的預測病種;
5、s3:針對每個預測病種,聚合預測為該病種的所有票據樣本,基于藥品共現關系構建帶權重的藥品共現網絡,所述藥品共現網絡采用點互信息pmi作為邊權重;
6、s4:基于所述藥品共現網絡,采用圖分析算法自動歸納主流用藥模板,所述主流用藥模板包括通過pagerank算法確定的核心藥品集合、通過社區發現算法確定的輔助藥品集合和通過節點中心性分析確定的異常藥品集合;
7、s5:提取待審查票據中的藥品集合,并與對應預測病種的主流用藥模板進行多維比對,所述多維比對包括核心藥品缺失率計算、異常藥品存在指標計算、結構相似度計算和語義沖突檢測;
8、s6:基于多維比對結果,綜合所述核心藥品缺失率、異常藥品存在指標、結構相似度及語義沖突檢測結果,計算合理性綜合評分,輸出結構化審查結果,所述結構化審查結果包括根據合理性綜合評分與評分閾值的比較結果確定待審查票據的風險等級,所述風險等級包括合理票據、可疑票據和高風險票據中的任一項。
9、進一步的,在步驟s2中,基于偽標簽機制訓練的病種預測模型根據以下方式進行訓練:
10、基于用于醫療編碼的動態推理知識庫對無標簽票據數據進行規則推理,生成第一偽標簽病種集合;
11、基于經過醫學文本預訓練的大語言模型對同一無標簽票據數據進行語義理解推理,生成第二偽標簽病種集合;
12、融合所述第一偽標簽病種集合與第二偽標簽病種集合,生成融合偽標簽作為訓練目標;
13、以所述融合偽標簽為目標訓練多標簽病種分類模型,得到訓練完成的病種預測模型。
14、進一步的,在步驟s3中,基于藥品共現關系構建帶權重的藥品共現網絡包括:
15、統計預測屬于同一病種的所有票據中藥品對的共現頻次;
16、基于所述藥品對的共現頻次計算點互信息pmi值,pmi值記為,計算公式如下:
17、;
18、其中,表示藥品和藥品在同一票據中同時出現的聯合概率的估計值,和分別表示藥品和藥品單獨出現在票據中的邊緣概率的估計值,概率估計基于所述預測屬于同一病種的所有票據計算;
19、將作為藥品共現網絡的邊權重,構建帶權重的無向圖網絡,得到所述藥品共現網絡。
20、進一步的,所述核心藥品集合通過以下方式確定:基于藥品共現網絡的pmi邊權重,計算各藥品節點的pagerank權威性得分,并將權威性得分高于第一預設閾值的藥品納入所述核心藥品集合;
21、所述輔助藥品集合通過以下方式確定:對所述藥品共現網絡進行社區發現,識別出多個用藥子團;對于每個用藥子團,將所述用藥子團內部未包含在所述核心藥品集合中的藥品,納入所述輔助藥品集合;
22、所述異常藥品集合通過以下方式確定:計算各藥品節點在所述藥品共現網絡中的度中心性,并統計各藥品在所述醫療票據集合中的出現頻次;將度中心性低于第二預設閾值且在所述醫療票據集合中出現頻次低于第三預設閾值的藥品,納入所述異常藥品集合。
23、進一步的,所述核心藥品缺失率計算包括:統計待審查票據中缺失的核心藥品數量占核心藥品集合總數的比例;
24、異常藥品存在指標計算包括:統計待審查票據中存在的異常藥品數量;
25、結構相似度計算包括:基于jaccard相似度計算待審查票據藥品集合與主流用藥模板的相似度;
26、語義沖突檢測包括:基于藥品藥理學知識庫,檢測待審查票據中是否存在藥理學語義沖突的藥品組合,并輸出語義沖突量化指標。
27、進一步的,所述合理性綜合評分的計算公式為:
28、;
29、其中,表示合理性綜合評分,表示核心藥品缺失率,表示異常藥品數量,表示結構相似度,表示基于語義沖突檢測結果計算的無沖突置信度,其值域為[0,1],其中1表示未檢測到沖突,、、和分別表示權重系數。
30、進一步的,步驟s3包括:
31、s31:針對每個預測病種,依據所述患者畫像信息中的關鍵生理病理指標,將預測為該病種的所有票據樣本聚類為多個患者亞組;
32、s32:針對每個所述患者亞組,依據票據中的診療階段標識或用藥順序信息,構建帶有時序或階段標簽的藥品共現網絡;
33、步驟s4包括:
34、s41:針對每個患者亞組,基于該患者亞組對應的帶標簽藥品共現網絡,分別歸納每個患者亞組的主流用藥模板;其中,每個患者亞組的主流用藥模板包括適用于該患者亞組的核心藥品集合、與不同診療階段關聯的階段化輔助藥品子集、以及所述異常藥品集合;
35、在步驟s5中,多維比對包括:
36、根據待審查票據的患者畫像信息匹配到對應的患者亞組模板,依次計算與該患者亞組模板的核心藥品缺失率、異常藥品存在指標、以及當前診療階段下的輔助藥品結構相似度。
37、進一步的,步驟s5中的語義沖突檢測,通過基于藥品知識圖譜的深度沖突檢測實現,包括:基于藥品知識圖譜的深度沖突檢測,具體包括:通過查詢預構建的藥品知識圖譜,識別并量化待審查處方中藥品之間存在的藥理作用沖突、不良反應疊加風險及代謝通路競爭關系,生成沖突分數;
38、步驟s6還包括:
39、s61:基于所述核心藥品缺失率、異常藥品存在指標、階段化輔助藥品結構相似度以及所述深度沖突檢測的沖突分數,計算合理性綜合評分;
40、s62:根據所述合理性綜合評分與評分閾值的比較結果,確定待審查票據的風險等級;
41、s63:生成結構化審查結果與可解釋性報告,其中,所述可解釋性報告至少列舉出導致評分變化的關鍵比對項、所涉藥品、引用的模板規則或知識圖譜關系,并指出具體的沖突類型或缺失內容。
42、在第二方面,本發明提供了一種計算機可讀存儲介質,其上存儲有計算機程序,所述程序被處理器執行時實現如本發明第一方面所述的基于病種預測的用藥模板構建與審查方法。
43、在第三方面,本發明提供了一種電子設備,其上存儲有計算機程序,包括處理器和存儲介質,所述存儲介質上存儲有計算機程序,所述計算機程序被所述處理器執行時實現如本發明第一方面所述的基于病種預測的用藥模板構建與審查方法。
44、區別于現有技術,上述技術方案涉及的一種基于病種預測的用藥模板構建與審查方法、介質和設備,旨在解決缺乏真實病種標簽時,醫療票據用藥合理性自動化審查困難的問題。所述方法包括:獲取醫療票據集合并進行標準化預處理;將標準化數據輸入基于偽標簽機制訓練的病種預測模型,獲取各票據的預測病種;針對每個預測病種,聚合其票據樣本并基于藥品共現關系構建以點互信息為權重的藥品共現網絡;基于該網絡,采用圖分析算法自動歸納主流用藥模板,所述模板包括通過pagerank確定的核心藥品集合、通過社區發現確定的輔助藥品集合及通過節點中心性確定的異常藥品集合;提取待審查票據的藥品集合,與對應病種的主流用藥模板進行核心藥品缺失率、異常藥品存在、結構相似度及語義沖突等多維比對;最后,綜合比對結果計算合理性綜合評分,輸出包含風險等級的結構化審查結果。本發明能夠從無標簽票據數據中自動構建用藥知識體系,實現對票據用藥合規性的智能化、精細化審查。
45、上述
技術實現要素:
相關記載僅是本發明技術方案的概述,為了讓本領域普通技術人員能夠更清楚地了解本發明的技術方案,進而可以依據說明書的文字及附圖記載的內容予以實施,并且為了讓本發明的上述目的及其它目的、特征和優點能夠更易于理解,以下結合本發明的具體實施方式及附圖進行說明。