基于主題模型的檢索結(jié)果聚類應(yīng)用研究
本文關(guān)鍵詞:基于主題模型的檢索結(jié)果聚類應(yīng)用研究
更多相關(guān)文章: LDA 檢索結(jié)果聚類 聚類標(biāo)簽 概率分布 語義挖掘 K-means
【摘要】:[目的/意義]檢索結(jié)果聚類能夠幫助用戶快速地瀏覽系統(tǒng)返回的檢索結(jié)果。傳統(tǒng)的基于向量空間的檢索結(jié)果聚類缺乏對文本深層次的語義聯(lián)系的挖掘,使得聚類結(jié)果的可讀性、可理解性存在不足。因此,對檢索結(jié)果進(jìn)行語義層面的分析,并實(shí)現(xiàn)基于語義的檢索結(jié)果聚類研究,具有重要的理論和實(shí)踐意義。[方法/過程]將LDA主題模型與K-means算法相結(jié)合,利用LDA模型實(shí)現(xiàn)文本潛在語義的識別,將"文本-潛在主題"概率分布作為Kmeans聚類依據(jù)進(jìn)行聚類分析,最后提取與聚類中心最近的主題的描述詞作為檢索結(jié)果聚類的標(biāo)簽。[結(jié)果/結(jié)論]實(shí)驗(yàn)表明,該方法在檢索結(jié)果聚類以及聚類標(biāo)簽識別上具有很好的效果。
【作者單位】: 華東師范大學(xué)經(jīng)濟(jì)與管理學(xué)部信息管理系;上海圖書館會展中心;
【關(guān)鍵詞】: LDA 檢索結(jié)果聚類 聚類標(biāo)簽 概率分布 語義挖掘 K-means
【基金】:上海哲學(xué)社會科學(xué)一般項(xiàng)目“基于主題模型的學(xué)科交叉知識發(fā)現(xiàn)研究”(編號:2016BTQ002)的研究成果之一
【分類號】:TP391.3;G252.7
【正文快照】: 引用格式阮光冊,夏磊.基于主題模型的檢索結(jié)果聚類應(yīng)用研究[J].情報(bào)雜志,2017,36(3):179-184.0引言隨著數(shù)字資源應(yīng)用的普及,人們逐步陷入“數(shù)據(jù)豐富,知識貧乏”的尷尬境地。面對飛速增多的各種數(shù)字資源,如何最有效最快速的篩選出目標(biāo)信息,為人們提供有價(jià)值的知識,成為信息處理
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 姚全珠;宋志理;彭程;;基于LDA模型的文本分類研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年13期
2 李文波;孫樂;張大鯤;;基于Labeled-LDA模型的文本分類新算法[J];計(jì)算機(jī)學(xué)報(bào);2008年04期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 阮光冊;夏磊;;基于主題模型的檢索結(jié)果聚類應(yīng)用研究[J];情報(bào)雜志;2017年03期
2 廖列法;勒孚剛;朱亞蘭;;LDA模型在專利文本分類中的應(yīng)用[J];現(xiàn)代情報(bào);2017年03期
3 王丹丹;陳清財(cái);王曉龍;湯步洲;;基于宏特征融合的文本分類[J];中文信息學(xué)報(bào);2017年02期
4 孔雪娜;孫紅;;中文微博文本采集與預(yù)處理綜述[J];軟件導(dǎo)刊;2017年02期
5 劉冰玉;王翠榮;王聰;王軍偉;王興偉;黃敏;;基于動態(tài)主題模型融合多維數(shù)據(jù)的微博社區(qū)發(fā)現(xiàn)算法[J];軟件學(xué)報(bào);2017年02期
6 黃磊;杜昌順;;基于遞歸神經(jīng)網(wǎng)絡(luò)的文本分類研究[J];北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年01期
7 洪旭東;余正濤;嚴(yán)梅;;基于事件句關(guān)聯(lián)的新聞主題模型構(gòu)建方法[J];微型電腦應(yīng)用;2017年01期
8 張群;王紅軍;王倫文;;詞向量與LDA相融合的短文本分類方法[J];現(xiàn)代圖書情報(bào)技術(shù);2016年12期
9 楊萌萌;黃浩;程露紅;馬平;包武杰;;基于LDA主題模型的短文本分類[J];計(jì)算機(jī)工程與設(shè)計(jì);2016年12期
10 王震;代巖巖;陳亮;林曉蘭;;基于LDA模型的95598熱點(diǎn)業(yè)務(wù)工單挖掘分析[J];電子技術(shù)與軟件工程;2016年22期
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 伍建軍;康耀紅;;文本分類中特征降維方式的研究[J];海南大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年01期
2 蘇金樹;張博鋒;徐昕;;基于機(jī)器學(xué)習(xí)的文本分類技術(shù)研究進(jìn)展[J];軟件學(xué)報(bào);2006年09期
3 張啟蕊,張凌,董守斌,譚景華;訓(xùn)練集類別分布對文本分類的影響[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
4 曾雪強(qiáng),王明文,陳素芬;一種基于潛在語義結(jié)構(gòu)的文本分類模型[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 周世兵;徐振源;唐旭清;;新的K-均值算法最佳聚類數(shù)確定方法[J];計(jì)算機(jī)工程與應(yīng)用;2010年16期
2 周世兵;徐振源;唐旭清;;基于近鄰傳播算法的最佳聚類數(shù)確定方法比較研究[J];計(jì)算機(jī)科學(xué);2011年02期
3 周世兵;徐振源;唐旭清;;一種基于近鄰傳播算法的最佳聚類數(shù)確定方法[J];控制與決策;2011年08期
4 李旭;林偉;溫金環(huán);史彩云;;基于圖譜理論的圖像聚類數(shù)的確定及應(yīng)用[J];工程數(shù)學(xué)學(xué)報(bào);2012年05期
5 秦振濤;楊武年;;一種新的最佳聚類數(shù)確定方法[J];電子技術(shù)應(yīng)用;2013年01期
6 宋銘利;高新科;;基于距離的最大聚類數(shù)探索算法的探討[J];礦山機(jī)械;2006年09期
7 普運(yùn)偉;朱明;金煒東;胡來招;;核聚類算法最佳聚類數(shù)的自適應(yīng)確定方法[J];計(jì)算機(jī)工程;2007年04期
8 楊欣斌,孫京誥,黃道;一種進(jìn)化聚類學(xué)習(xí)新方法[J];計(jì)算機(jī)工程與應(yīng)用;2003年15期
9 田彥山;;基于山峰聚類的聚類上限確定方法[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
10 褚娜;馬利莊;王彥;;聚類趨勢問題的研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2009年03期
中國重要會議論文全文數(shù)據(jù)庫 前9條
1 高翠芳;吳小俊;;基于二階差分的聚類數(shù)自動確定方法[A];江蘇省系統(tǒng)工程學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
2 劉洋;江志綱;丁增喜;王大玲;鮑玉斌;于戈;;一種基于圖的聚類算法GB-Cluster[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2002年
3 李浪波;傅彥;劉紅;;基于范例推理的網(wǎng)格和密度聚類算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2005年
4 婁冬梅;陳明;朱有娜;;一種基于密度的無參數(shù)聚類算法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2006年
5 魏昕路;洪志令;姜青山;;一種基于樣本縮減策略的新窗口式聚類算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2007年
6 程尊平;周鼎;王晨;周皓峰;汪衛(wèi);施伯樂;;SDPHC——基于密度的分割和分層的自校聚類算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2004年
7 張曉峰;王麗珍;陸葉;;一種基于屬性加權(quán)的不確定K-means聚類算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
8 蔡軍;袁華鵬;陳金海;施伯樂;;一種基于相似性分析的聚類新算法:PDS算法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2001年
9 胡仲義;郭超;王永炎;劉勝航;王宏安;;基于時(shí)間衰減和特征變量的數(shù)據(jù)流聚類算法[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王振佳;基于基因表達(dá)數(shù)據(jù)的雙聚類算法研究[D];山東大學(xué);2016年
2 胡雅婷;可能性聚類方法研究及應(yīng)用[D];吉林大學(xué);2012年
3 王縱虎;聚類分析優(yōu)化關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2012年
4 周世兵;聚類分析中的最佳聚類數(shù)確定方法研究及應(yīng)用[D];江南大學(xué);2011年
5 楊燕;基于計(jì)算智能的聚類組合算法研究[D];西南交通大學(xué);2006年
6 馮永;基于計(jì)算智能的聚類技術(shù)及其應(yīng)用研究[D];重慶大學(xué);2006年
7 劉晨;高伸縮性聚類分析方法研究[D];哈爾濱工程大學(xué);2013年
8 王強(qiáng);局部疊加基因表達(dá)模式聚類分析方法研究[D];哈爾濱工業(yè)大學(xué);2012年
9 姜磊;混合演化聚類算法研究及其應(yīng)用[D];武漢大學(xué);2012年
10 尹學(xué)松;半監(jiān)督聚類分析策略設(shè)計(jì)及其拓展性研究[D];南京航空航天大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 魏建東;K-means初始化算法研究[D];南京理工大學(xué);2015年
2 張依;基于MapReduce的k-means聚類算法并行化研究[D];中央民族大學(xué);2015年
3 劉嬋;蟻群與K均值聚類算法融合研究及其在用戶分群中的應(yīng)用[D];西南科技大學(xué);2015年
4 朱琪;基于減法聚類的混合算法研究[D];湖南科技大學(xué);2015年
5 韓偉森;聚類集成研究與應(yīng)用[D];貴州大學(xué);2015年
6 譚浩;K-Means算法改進(jìn)及其在森林健康評價(jià)中的應(yīng)用[D];中南林業(yè)科技大學(xué);2015年
7 嚴(yán)巍;以KPCA為核心的FCM算法改進(jìn)[D];成都理工大學(xué);2015年
8 汪娟;基于權(quán)重設(shè)計(jì)的聚類集成算法研究[D];重慶大學(xué);2015年
9 牛品菽;基于圖模型的高效聚類算法研究[D];北京交通大學(xué);2016年
10 蔡洪山;大數(shù)據(jù)分析中的聚類算法研究[D];安徽理工大學(xué);2016年
,本文編號:1008480
本文鏈接:http://sikaile.net/tushudanganlunwen/1008480.html