融合主題與語言模型的蒙古文信息檢索方法研究
發(fā)布時(shí)間:2017-10-03 07:02
本文關(guān)鍵詞:融合主題與語言模型的蒙古文信息檢索方法研究
更多相關(guān)文章: 蒙古文 語言模型 主題模型 Gibbs采樣 信息檢索
【摘要】:為了從日益豐富的蒙古文信息中快速準(zhǔn)確地檢索用戶需求的主題信息,提出了一種融合主題模型LDA與語言模型的方法。該方法用語言模型與LDA模型對蒙古文文檔進(jìn)行建模,利用吉普斯抽樣方法進(jìn)行推理間接計(jì)算模型的參數(shù),挖掘隱藏在文檔內(nèi)不同主題與詞之間的關(guān)系,得到文檔的主題分布,并以此分布來計(jì)算與檢索關(guān)鍵詞主題之間的相似度,最后返回與該主題最相關(guān)的文檔。語言模型充分利用蒙古文語法特征以及統(tǒng)計(jì)信息,而主題模型LDA又具有良好的潛在語義挖掘及主題發(fā)現(xiàn)的泛化學(xué)習(xí)能力,從而結(jié)合兩種方法更好地實(shí)現(xiàn)蒙古文文檔的主題語義檢索,提高檢索準(zhǔn)確性。實(shí)驗(yàn)結(jié)果表明,融合LDA與語言模型的方法相比單一模型體現(xiàn)主題語義方面取得了較好的效果。
【作者單位】: 內(nèi)蒙古師范大學(xué)計(jì)算機(jī)與信息工程學(xué)院;
【關(guān)鍵詞】: 蒙古文 語言模型 主題模型 Gibbs采樣 信息檢索
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61562068) 內(nèi)蒙古自然科學(xué)基金資助項(xiàng)目(2013MS0912) 內(nèi)蒙古自治區(qū)教育部人文社會科學(xué)研究項(xiàng)目(13YJAZH080)
【分類號】:TP391.3
【正文快照】: 關(guān)鍵詞:蒙古文;語言模型;主題模型;Gibbs采樣;信息檢索0引言近年來隨著蒙古文信息的日益豐富,研究從大量的信息資源中找出滿足用戶需求的信息已受到越來越多的關(guān)注。但是由于蒙古文語言表達(dá)形式的多樣性,存在大量的同義詞、語意特征和豐富的句法特征,比如“”和“”都是關(guān)于尋,
本文編號:963782
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/963782.html
最近更新
教材專著