1. <rt id="e600n"></rt>
      1. <pre id="e600n"><strong id="e600n"><pre id="e600n"></pre></strong></pre>
      2. 岛国免费AV,无码人妻精品一区二区三区夜夜嗨,又大又粗又硬又爽黄毛少妇,精品国产AV二区,91视频最新网址,久操无码,久久无码人妻一区二区三区午夜,国产精品视频中文字幕

        一種基于多模態用戶興趣向量計算的方言區域特征識別方法、系統及應用與流程

        文檔序號:45266371發布日期:2026-04-17 19:54閱讀:6來源:國知局

        本發明涉及新興,特別是涉及一種基于多模態用戶興趣向量計算的方言區域特征識別方法、系統及應用。


        背景技術:

        1、當前的主流短視頻/社交平臺通過用戶行為特征分析、相似內容推薦的方式,向不同的用戶群體推薦其可能感興趣的內容,以提升內容點擊率和用戶使用時長,滿足平臺精準運營的需求。技術實現方面,平臺推薦功能一般基于內容標簽和用戶行為標簽構建出特征向量,采用協同過濾算法和深度學習等技術,根據特征向量相似度計算出用戶對某種內容的潛在喜好分布,從而實現相關內容的推薦。

        2、實際應用中,為了構建覆蓋全國范圍、用戶規模達到千萬級以上的內容服務平臺,其推薦功能模塊可在用戶興趣和行為特征之外再引入地域相關的維度,通過自動識別內容所屬的區域文化特征,提高用戶對身份圈層的精細化感知。現有技術通過ip地址或手機h碼號段識別等技術手段,可進行較粗粒度的地域推薦,但準確度低、易出錯,且無法識別用戶的文化偏好(例如在外地工作生活的人想看老家所在地的內容)及無法解決用戶的興趣漂移問題。

        3、已公布的現有技術中,cn111382310a、cn108920503a基于通用興趣標簽進行相似度計算,進一步引入社交網絡的信任度因素對推薦算法進行優化,以減少數據稀疏性的影響并提升算法效率,這一類方法主要考慮了用戶特征、內容特征并結合社交網絡的影響,但未解決區域推薦問題;cn116089726a提出了一種漢藏語多方言多模態的資源推薦方法,基于機器翻譯與相似人群擴散的技術手段實現方言內容匹配推薦,這種方法側重于對內容自動識別與打標,并未將方言作為一個獨立的維度進行量化,也沒有考慮到用戶因為生活場景變化而導致的方言偏好動態漂移等場景,無法充分利用內容所屬的區域文化特征來提升用戶對身份圈層的精細化感知。

        4、綜上,對于用戶規模較大、覆蓋范圍較廣的內容型平臺,需要從整體上構建一個融合了用戶的多模態行為數據和語言文化特征的用戶興趣向量表示模型,來聚類和識別具有相同或相似方言區域特征的用戶群體,解決地域推薦問題。


        技術實現思路

        1、本發明目的是針對背景技術中存在的問題,提出一種基于多模態用戶興趣向量計算的方言區域特征識別方法。能夠自動識別和量化用戶對多種方言區域內容的興趣,可解決現有推薦技術無法有效識別用戶的方言文化偏好以及因生活場景變化而導致的方言偏好動態漂移等問題。

        2、本發明的技術方案,本發明的第一方面提供一種基于多模態用戶興趣向量計算的方言區域特征識別方法,包括以下具體步驟:

        3、s1、構造種子用戶興趣特征矩陣:根據預設規則選取各方言區域的種子用戶,提取其對平臺內容的交互行為特征,形成種子用戶興趣特征矩陣;

        4、s2、獲取目標用戶行為數據:采集目標用戶與平臺方言相關內容的交互行為日志,基于所述目標用戶行為數據構建用戶行為特征矩陣;

        5、s3、生成用戶方言群落矩陣:將所述用戶行為特征矩陣與所述種子用戶興趣特征矩陣進行相似度計算與聚類分析,得到所述目標用戶的方言群落矩陣;該矩陣包含至少一種方言及其對應的偏好權重,用于表征目標用戶的動態方言興趣偏好。

        6、優選的,步驟s1中以離線方式通過自動和人工相結合對內容進行標定,確定方言屬性;計算出種子用戶的興趣特征向量。

        7、優選的,步驟s1中選取種子用戶的預設規則包括:

        8、基于ip地址和/或手機號段h碼確認其地域屬性的穩定性;

        9、基于評論次數確定其在平臺評論中使用方言的頻次;

        10、設定平臺使用活躍度閾值。

        11、優選的,步驟s2中方言相關內容包括視頻、帖子、音頻或評論;

        12、交互行為包括觀看、點贊、分享、評論、創作、搜索。

        13、優選的,步驟s2中,對用戶行為特征中的因子進行映射,構造用戶行為向量;

        14、對用戶行為向量通過拼接、加權平均手段進行處理,生成一個多模態的、綜合的用戶行為特征矩陣。

        15、優選的,構造用戶行為向量的過程中,以用戶行為進行建模,將用戶的行為序列通過嵌入模型映射為低維稠密向量,并對不同模態的行為向量進行拼接與加權融合。

        16、優選的,步驟s3中聚類分析包括k-means算法和歸一化處理。

        17、本發明的第二方面提供一種基于多模態用戶興趣向量計算的方言區域特征的內容推薦方法,使用上述的方言區域特征識別方法識別方言內容,包括以下具體步驟:

        18、構造方言內容特征矩陣:針對平臺內容,識別并量化其包含的多種方言特征,形成方言內容特征矩陣;

        19、識別目標用戶的方言區域特征,得到目標用戶的方言群落矩陣;

        20、融合推薦計算:根據目標用戶的方言群落矩陣中的方言權重,以及方言內容特征矩陣中內容與各方言的關聯強度,計算各內容對所述目標用戶的推薦概率;

        21、生成并輸出推薦列表:依據推薦概率,為目標用戶生成方言內容推薦列表;

        22、數據保存:保存推薦結果,并更新普通用戶的行為屬性。

        23、優選的,先利用自然語言處理模型分析文本中的方言詞匯,和/或利用語音識別模型分析音頻中的方言語音特征;并利用預設的方言特征權重參數組對識別出的特征進行加權計算,得到量化的方言特征值以構建所述矩陣;

        24、之后,針對方言群落矩陣中的權重向量與方言內容特征矩陣進行矩陣運算,并結合內容的新舊熱度運營度量,得到綜合推薦概率。

        25、本發明的第三方面提供一種基于多模態用戶興趣向量計算的方言區域特征識別系統,根據上述的識別方法識別方言內容,包括:

        26、數據采集模塊,用于采集平臺用戶與方言相關內容的交互行為日志;

        27、特征提取與向量化模塊,用于構造并存儲方言內容特征矩陣和種子用戶興趣特征矩陣、

        28、基于數據采集模塊采集的日志,構建目標用戶行為特征矩陣;

        29、向量計算與聚類模塊,用于將目標用戶行為特征矩陣與種子用戶興趣特征矩陣進行相似度計算與聚類分析,生成目標用戶的方言群落矩陣;

        30、應用推薦模塊,根據方言群落矩陣和所述方言內容特征矩陣,計算并輸出針對目標用戶的推薦結果。

        31、與現有技術相比,本發明具有如下有益的技術效果:

        32、1、技術上,與現有內容推薦和用戶畫像技術相比,本發明將內容相關的方言特征作為獨立的維度進行量化并融合到特征向量中,通過內容的方言特征與用戶的行為特征的識別與匹配,可為用戶生成包含多種方言內容和推薦度的推薦列表,可提升推薦的準確性;

        33、2、對于平臺用戶,本發明針對單一用戶生成包含了多方言特征的方言群落矩陣,并能自動判斷對于該用戶哪種方言的權重更高,提高了用戶方言身份歸類的準確性,更適應用戶的多方言場景,比如到外地工作生活后方言偏好變化,充分考慮了用戶的動態興趣漂移情況,提高了用戶方言身份歸類的準確性,可提升用戶滿意度;

        34、3、對于平臺運營方,本發明為內容平臺拓展了商業模式,開辟了“方言營銷”這一新的精準廣告投放維度。

        當前第1頁1 2 
        網友詢問留言 留言:0條
        • 還沒有人留言評論。精彩留言會獲得點贊!
        主站蜘蛛池模板: 国产熟人av一二三区| 国产精品爽爽久久久久久竹菊| 久久精品国产亚洲AⅤ无码| 中文字幕人妻第一区| 日本一卡二卡3卡四卡网站精品| 人妻妺妺窝人体色WWW聚色窝| 无码日韩一区二区| 亚洲成AV人在线观看网站| 91密桃精品国产91久久| 成人久久久| 欧美专区一区三区四区在线免费黄| 成年人三级片| 2021AV在线无码最新| 国产精品免费中文字幕| 国产精品无码翘臀在线观看| 极品尤物av美乳在线观看| 四虎国产精品永久在线国在线| 亚洲一本大道在线| √天堂资源地址在线官网| 国产精品久久九九99九九99| 无码人妻一区二区三区线花季传件| 十八禁国产一区二区三区| 日韩一区电影| 成人免费一区二区三区视频 | 亚洲熟女乱色综合亚洲| 无码少妇一区二区性色av | 国产极品精品自在线不卡| 国内精品视频一区二区八戒 | 免费国产高清在线精品一区| 四虎成人精品无码永久在线 | 日日夜夜影院| 精品久久久中文字幕人妻| 国内少妇高潮嗷嗷叫在线观看| 美女黄网站18禁免费看| 羞羞影院午夜男女爽爽免费视频| 久久久久国产一区二区三区| 国产成人在线小视频| 人妻少妇偷人作爱av| 在线精品亚洲区一区二区| 人妻少妇视频| 中文字幕少妇人妻|