本發(fā)明涉及計(jì)算機(jī)軟件服務(wù),具體涉及一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法及系統(tǒng)。
背景技術(shù):
1、隨著信息技術(shù)與人工智能技術(shù)的快速發(fā)展,各類在線教育平臺(tái)和智能化學(xué)習(xí)工具不斷涌現(xiàn),旨在提高學(xué)習(xí)效率、優(yōu)化學(xué)習(xí)體驗(yàn)。國家執(zhí)業(yè)醫(yī)師資格考試(以下簡稱“執(zhí)業(yè)醫(yī)師考試”)作為我國醫(yī)學(xué)人才培養(yǎng)和資格認(rèn)定的關(guān)鍵環(huán)節(jié),其備考過程具有知識(shí)點(diǎn)繁多、內(nèi)容更新快、臨床實(shí)踐性強(qiáng)等特點(diǎn)。然而,當(dāng)前市場上針對(duì)執(zhí)業(yè)醫(yī)師考試的備考服務(wù)仍存在諸多不足,難以滿足廣大醫(yī)學(xué)生高效、精準(zhǔn)、個(gè)性化的學(xué)習(xí)需求。
2、目前,互聯(lián)網(wǎng)上針對(duì)國家執(zhí)業(yè)醫(yī)師考試備考的線上服務(wù)主要為在線學(xué)習(xí)和練習(xí)服務(wù),通過收集執(zhí)業(yè)醫(yī)師考試相關(guān)的學(xué)科門類、知識(shí)專題類題目及完整模擬考卷,搭建線上平臺(tái)供學(xué)生進(jìn)行專項(xiàng)練習(xí)或模擬考試,以輔助學(xué)生熟悉考試形式、鞏固知識(shí)點(diǎn),部分平臺(tái)會(huì)提供題目答案。。
3、然而,現(xiàn)有學(xué)習(xí)和練習(xí)服務(wù)僅通過“目錄分類索引”實(shí)現(xiàn)資源檢索,即按學(xué)科(如內(nèi)科、外科)、考試模塊(如基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué))等粗放粒度對(duì)題目進(jìn)行分類,學(xué)生需逐層點(diǎn)擊目錄查找對(duì)應(yīng)內(nèi)容,導(dǎo)致學(xué)生無法直接或準(zhǔn)確定位到具體知識(shí)點(diǎn),可能對(duì)學(xué)生產(chǎn)生誤導(dǎo)。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)僅通過“目錄分類索引”實(shí)現(xiàn)資源檢索,導(dǎo)致學(xué)生無法直接或準(zhǔn)確定位到具體知識(shí)點(diǎn),可能對(duì)學(xué)生產(chǎn)生誤導(dǎo)的不足,本發(fā)明提出一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法及系統(tǒng),從而解決現(xiàn)有技術(shù)存在的問題。
2、一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法,包括以下步驟:
3、收集特定專業(yè)領(lǐng)域的考試題目數(shù)據(jù),并對(duì)其進(jìn)行校驗(yàn);
4、通過詞嵌入模型將校驗(yàn)后的考試題目數(shù)據(jù)轉(zhuǎn)化為向量,以構(gòu)建支持語義檢索的向量知識(shí)庫;
5、接收用戶輸入的自然語言學(xué)習(xí)請(qǐng)求,并基于大語言模型對(duì)學(xué)習(xí)請(qǐng)求進(jìn)行考試相關(guān)意圖識(shí)別;根據(jù)識(shí)別出的意圖從向量知識(shí)庫中檢索出相關(guān)的知識(shí)片段;基于檢索增強(qiáng)生成技術(shù)將知識(shí)片段合成符合學(xué)習(xí)請(qǐng)求的結(jié)構(gòu)化輔助學(xué)習(xí)內(nèi)容;
6、分析用戶與結(jié)構(gòu)化輔助學(xué)習(xí)內(nèi)容的交互行為數(shù)據(jù),以構(gòu)建用戶畫像;
7、基于用戶畫像提供自適應(yīng)的學(xué)習(xí)建議或資源推送;并向用戶終端輸出結(jié)構(gòu)化輔助學(xué)習(xí)內(nèi)容與自適應(yīng)的學(xué)習(xí)建議或資源推送。
8、進(jìn)一步地,還包括在收集特定專業(yè)領(lǐng)域的考試題目數(shù)據(jù)后,對(duì)所述考試題目數(shù)據(jù)進(jìn)行預(yù)處理,具體包括以下步驟:
9、對(duì)圖片類素材采用光學(xué)字符識(shí)別模型識(shí)別圖片中的文字內(nèi)容,將其轉(zhuǎn)化為可編輯文本,同時(shí)保存圖片文件至指定路徑;對(duì)文檔類素材使用文檔解析工具讀取文本,統(tǒng)一轉(zhuǎn)換為utf-8編碼純文本;
10、識(shí)別并拆分考試題目數(shù)據(jù)中的題干、選項(xiàng)、答案及解析部分;對(duì)于包含圖像或特殊格式內(nèi)容的題目,提取其文本描述信息并與原始文件關(guān)聯(lián)存儲(chǔ);
11、基于題目內(nèi)容的語義相似度,識(shí)別并合并或剔除重復(fù)的題目數(shù)據(jù)。
12、進(jìn)一步地,所述校驗(yàn)特定專業(yè)領(lǐng)域的考試題目數(shù)據(jù),具體包括交叉驗(yàn)證、外源驗(yàn)證和人工驗(yàn)證;所述交叉驗(yàn)證用于將題目的題干在已構(gòu)建的臨時(shí)知識(shí)庫中進(jìn)行向量檢索,驗(yàn)證其對(duì)應(yīng)答案的唯一性,標(biāo)記存在沖突答案的題目為存疑題目;所述外源驗(yàn)證用于將所述存疑題目的題干與答案,與來自外部權(quán)威知識(shí)源的數(shù)據(jù)進(jìn)行比對(duì)驗(yàn)證;所述人工驗(yàn)證通過由領(lǐng)域?qū)I(yè)人員對(duì)經(jīng)過所述交叉驗(yàn)證和所述外源驗(yàn)證后仍存疑的題目進(jìn)行最終審核。
13、進(jìn)一步地,所述構(gòu)建支持語義檢索的向量知識(shí)庫,具體包括以下步驟:
14、將每個(gè)題目按題干、標(biāo)準(zhǔn)答案和答案解析拆分為多個(gè)文本子塊;
15、通過qwen3-embedding模型為每個(gè)文本子塊生成對(duì)應(yīng)的詞嵌入向量;
16、將所述文本子塊與其對(duì)應(yīng)的詞嵌入向量以及題目的元數(shù)據(jù)進(jìn)行關(guān)聯(lián)存儲(chǔ),并構(gòu)建出支持向量檢索和全文檢索的混合檢索索引。
17、進(jìn)一步地,還包括在所述根據(jù)識(shí)別出的意圖從向量知識(shí)庫中檢索出相關(guān)的知識(shí)片段之后,調(diào)用重排序模型對(duì)知識(shí)片段進(jìn)行排序;其中,所述重排序模型用于基于查詢意圖與檢索結(jié)果的多維度匹配度進(jìn)行重新排序。
18、進(jìn)一步地,所述用戶畫像包括實(shí)時(shí)記錄用戶作答產(chǎn)生的錯(cuò)題信息、用戶對(duì)題目進(jìn)行自定義收藏的題目收藏夾、添加標(biāo)簽和記錄筆記以及各知識(shí)點(diǎn)的掌握度評(píng)估。
19、進(jìn)一步地,所述自適應(yīng)的學(xué)習(xí)建議包括基于所述錯(cuò)題信息自動(dòng)生成的相似題目強(qiáng)化練習(xí)包,或基于所述掌握度評(píng)估生成的個(gè)性化復(fù)習(xí)計(jì)劃。
20、本發(fā)明還提出一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)系統(tǒng),包括:
21、數(shù)據(jù)收集單元,用于收集特定專業(yè)領(lǐng)域的考試題目數(shù)據(jù),并對(duì)其進(jìn)行校驗(yàn);
22、知識(shí)庫構(gòu)建單元,用于通過詞嵌入模型將校驗(yàn)后的考試題目數(shù)據(jù)轉(zhuǎn)化為向量,以構(gòu)建支持語義檢索的向量知識(shí)庫;
23、智能檢索與內(nèi)容生成單元,用于接收用戶輸入的自然語言學(xué)習(xí)請(qǐng)求,并基于大語言模型對(duì)學(xué)習(xí)請(qǐng)求進(jìn)行考試相關(guān)意圖識(shí)別;根據(jù)識(shí)別出的意圖從向量知識(shí)庫中檢索出相關(guān)的知識(shí)片段;基于檢索增強(qiáng)生成技術(shù)將知識(shí)片段合成符合學(xué)習(xí)請(qǐng)求的結(jié)構(gòu)化輔助學(xué)習(xí)內(nèi)容;
24、用戶畫像構(gòu)建單元,用于分析用戶與結(jié)構(gòu)化輔助學(xué)習(xí)內(nèi)容的交互行為數(shù)據(jù),以構(gòu)建用戶畫像;
25、輸出單元,用于基于用戶畫像提供自適應(yīng)的學(xué)習(xí)建議或資源推送;并向用戶終端輸出結(jié)構(gòu)化輔助學(xué)習(xí)內(nèi)容與自適應(yīng)的學(xué)習(xí)建議或資源推送。
26、本發(fā)明提供了一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法,具備以下有益效果:
27、本發(fā)明通過采用構(gòu)建支持語義檢索的向量知識(shí)庫以及基于大語言模型對(duì)學(xué)習(xí)請(qǐng)求進(jìn)行意圖識(shí)別的技術(shù)手段,將用戶模糊的自然語言查詢轉(zhuǎn)化為精確的語義向量,并在結(jié)構(gòu)化的向量知識(shí)庫中進(jìn)行深度匹配,這不僅突破了傳統(tǒng)粗放式分類檢索的局限,使學(xué)生能夠直接通過自然語言提問的方式定位到具體知識(shí)點(diǎn),還大幅減少了無效篩選時(shí)間,從技術(shù)底層提升了信息檢索的精準(zhǔn)度與效率;并通過分析用戶交互行為數(shù)據(jù),構(gòu)建用戶畫像以及提供自適應(yīng)的學(xué)習(xí)建議,能夠基于實(shí)時(shí)記錄的錯(cuò)題、筆記及知識(shí)點(diǎn)掌握度,動(dòng)態(tài)生成相似題目強(qiáng)化練習(xí)包或個(gè)性化復(fù)習(xí)計(jì)劃,從根本上解決了傳統(tǒng)現(xiàn)有技術(shù)無差別推送的弊端,顯著提升了學(xué)習(xí)的針對(duì)性和有效性。
1.一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法,其特征在于,還包括在收集特定專業(yè)領(lǐng)域的考試題目數(shù)據(jù)后,對(duì)所述考試題目數(shù)據(jù)進(jìn)行預(yù)處理,具體包括以下步驟:
3.根據(jù)權(quán)利要求1所述的一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法,其特征在于,所述校驗(yàn)特定專業(yè)領(lǐng)域的考試題目數(shù)據(jù),具體包括交叉驗(yàn)證、外源驗(yàn)證和人工驗(yàn)證;所述交叉驗(yàn)證用于將題目的題干在已構(gòu)建的臨時(shí)知識(shí)庫中進(jìn)行向量檢索,驗(yàn)證其對(duì)應(yīng)答案的唯一性,標(biāo)記存在沖突答案的題目為存疑題目;所述外源驗(yàn)證用于將所述存疑題目的題干與答案,與來自外部權(quán)威知識(shí)源的數(shù)據(jù)進(jìn)行比對(duì)驗(yàn)證;所述人工驗(yàn)證通過由領(lǐng)域?qū)I(yè)人員對(duì)經(jīng)過所述交叉驗(yàn)證和所述外源驗(yàn)證后仍存疑的題目進(jìn)行最終審核。
4.根據(jù)權(quán)利要求1所述的一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法,其特征在于,所述構(gòu)建支持語義檢索的向量知識(shí)庫,具體包括以下步驟:
5.根據(jù)權(quán)利要求1所述的一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法,其特征在于,還包括在所述根據(jù)識(shí)別出的意圖從向量知識(shí)庫中檢索出相關(guān)的知識(shí)片段之后,調(diào)用重排序模型對(duì)知識(shí)片段進(jìn)行排序;其中,所述重排序模型用于基于查詢意圖與檢索結(jié)果的多維度匹配度進(jìn)行重新排序。
6.根據(jù)權(quán)利要求1所述的一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法,其特征在于,所述用戶畫像包括實(shí)時(shí)記錄用戶作答產(chǎn)生的錯(cuò)題信息、用戶對(duì)題目進(jìn)行自定義收藏的題目收藏夾、添加標(biāo)簽和記錄筆記以及各知識(shí)點(diǎn)的掌握度評(píng)估。
7.根據(jù)權(quán)利要求6所述的一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)方法,其特征在于,所述自適應(yīng)的學(xué)習(xí)建議包括基于所述錯(cuò)題信息自動(dòng)生成的相似題目強(qiáng)化練習(xí)包,或基于所述掌握度評(píng)估生成的個(gè)性化復(fù)習(xí)計(jì)劃。
8.一種面向標(biāo)準(zhǔn)化資格認(rèn)證考試的ai輔助學(xué)習(xí)系統(tǒng),其特征在于,包括: