一種用于查詢擴(kuò)展詞選取的主題模型
本文關(guān)鍵詞:一種用于查詢擴(kuò)展詞選取的主題模型
更多相關(guān)文章: 主題模型 偽相關(guān)反饋 查詢擴(kuò)展 擴(kuò)展詞選取 社會(huì)化標(biāo)注
【摘要】:為能在搜索引擎返回的結(jié)果集上構(gòu)建貼近用戶意圖的主題層,并在文檔詞與主題間建立映射,將社會(huì)化標(biāo)注引入經(jīng)典的LDA模型,構(gòu)建一種基于主題-標(biāo)簽-文檔詞之間關(guān)系的三層主題模型,并將其用于偽相關(guān)反饋查詢擴(kuò)展詞的選取.實(shí)驗(yàn)結(jié)果表明,該模型提取的查詢擴(kuò)展詞能描述標(biāo)簽的語(yǔ)義,模型用于偽相關(guān)反饋后,提取的擴(kuò)展詞能覆蓋查詢條件,在多數(shù)情況下結(jié)果列表的NDCG值高于基本偽相關(guān)反饋和結(jié)果集聚類方法.
【作者單位】: 東北大學(xué)信息科學(xué)與工程學(xué)院;
【關(guān)鍵詞】: 主題模型 偽相關(guān)反饋 查詢擴(kuò)展 擴(kuò)展詞選取 社會(huì)化標(biāo)注
【基金】:遼寧省自然科學(xué)基金資助項(xiàng)目(20102060)
【分類號(hào)】:TP391.3
【正文快照】: 目前搜素引擎的工作方式是基于關(guān)鍵字匹配的方式.研究發(fā)現(xiàn),在許多情況下偽相關(guān)反饋能提高搜索引擎的查全率和查準(zhǔn)率[1-2].以下研究從多個(gè)方面對(duì)偽相關(guān)反饋提出了改進(jìn).文獻(xiàn)[2]將偽相關(guān)反饋方法提取的擴(kuò)展詞分為3類,使用單主題平均準(zhǔn)確率(mean averageprecision,MAP)加以判斷.
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 郭朋偉;高克寧;張斌;;基于評(píng)論修正的博客聚類算法[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年06期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 黃名選;嚴(yán)小衛(wèi);張師超;;基于矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘的偽相關(guān)反饋查詢擴(kuò)展[J];軟件學(xué)報(bào);2009年07期
2 裴飛;洪宇;孫常龍;姚建民;朱巧明;;基于Web的查詢擴(kuò)展[J];電腦知識(shí)與技術(shù);2011年06期
3 馮平;黃名選;;特征詞抽取和相關(guān)性融合的偽相關(guān)反饋查詢擴(kuò)展[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2011年01期
4 王麗君,高迎,王錫鋼;中文檢索系統(tǒng)中查詢的擴(kuò)展[J];小型微型計(jì)算機(jī)系統(tǒng);2002年07期
5 王會(huì)進(jìn),陳超華,李清;基于動(dòng)態(tài)知識(shí)庫(kù)搜索引擎的技術(shù)[J];暨南大學(xué)學(xué)報(bào);2004年01期
6 王明文,聶建云;基于Dempster-Shafer理論的查詢擴(kuò)展模型(英文)[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年03期
7 牟力科;張蕾;張曉孿;;基于概念圖的用戶興趣查詢擴(kuò)展模型的研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年06期
8 章旭;石進(jìn);謝立;;基于相似性敘詞表的模糊集合模型[J];計(jì)算機(jī)科學(xué);2008年09期
9 陳曉金;王兵;;信息檢索擴(kuò)展技術(shù)研究[J];圖書(shū)情報(bào)工作;2008年12期
10 閉劍婷;蘇一丹;;基于潛在語(yǔ)義分析的跨語(yǔ)言查詢擴(kuò)展方法[J];計(jì)算機(jī)工程;2009年10期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴(kuò)展的數(shù)字檔案檢索策略[A];廣西計(jì)算機(jī)學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
2 張志強(qiáng);孟慶海;謝曉芹;;個(gè)性化的社會(huì)標(biāo)簽查詢擴(kuò)展技術(shù)研究[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年
3 陳憶群;曹瑾音;印鑒;;查詢擴(kuò)展樹(shù):關(guān)系數(shù)據(jù)庫(kù)中的文本檢索[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
4 鐘敏娟;萬(wàn)常選;;基于偽反饋的XML查詢擴(kuò)展[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
5 馬云龍;林鴻飛;;基于權(quán)重標(biāo)準(zhǔn)化SimRank方法的查詢擴(kuò)展技術(shù)研究[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
6 黃名選;;基于正負(fù)關(guān)聯(lián)規(guī)則挖掘的局部反饋查詢擴(kuò)展[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
7 周斌;劉茂福;陳建勛;;IR4QA系統(tǒng)中基于維基百科的查詢擴(kuò)展[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
8 邵兵;關(guān)毅;王強(qiáng);王曉龍;任瑞春;;基于上下文平均互信息的問(wèn)句查詢擴(kuò)展模型[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
9 黃佳來(lái);王立波;袁道敏;;基于語(yǔ)義相似度的查詢擴(kuò)展研究[A];浙江省電子學(xué)會(huì)2008年學(xué)術(shù)年會(huì)論文集[C];2008年
10 晉松;林鴻飛;蘇綏;;基于標(biāo)簽共現(xiàn)的查詢擴(kuò)展研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 彭遂蒞 李濤;成都公開(kāi)保險(xiǎn)營(yíng)銷員信用信息[N];中國(guó)保險(xiǎn)報(bào);2011年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 仲兆滿;事件本體及其在查詢擴(kuò)展中的應(yīng)用[D];上海大學(xué);2011年
2 張毅波;史文結(jié)構(gòu)化信息檢索系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(軟件研究所);2001年
3 劉向威;NLP技術(shù)在中文信息檢索中的應(yīng)用研究[D];天津大學(xué);2005年
4 林建方;詞搭配抽取及在信息檢索中的應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2010年
5 朱鯤鵬;基于Web日志挖掘的智能信息檢索研究[D];哈爾濱工業(yè)大學(xué);2009年
6 王一川;基于內(nèi)容的海量文本探索式查詢導(dǎo)引中若干關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2011年
7 王秀娟;文本檢索中若干問(wèn)題研究[D];北京郵電大學(xué);2006年
8 王樹(shù)梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學(xué);2007年
9 胡佳妮;文本挖掘中若干關(guān)鍵問(wèn)題的研究[D];北京郵電大學(xué);2008年
10 蒲強(qiáng);基于獨(dú)立分量分析的語(yǔ)義聚類技術(shù)在信息檢索中的應(yīng)用研究[D];電子科技大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 賈淑芳;基于用戶日志聚類的查詢擴(kuò)展[D];北京郵電大學(xué);2010年
2 王水利;基于互信息的語(yǔ)義查詢擴(kuò)展技術(shù)研究[D];河南科技大學(xué);2011年
3 崔琰;基于用戶興趣及術(shù)語(yǔ)關(guān)系的查詢擴(kuò)展方法[D];河北大學(xué);2011年
4 劉清江;同義詞在文本特征提取與查詢擴(kuò)展中的應(yīng)用[D];河北大學(xué);2010年
5 方勇;基于語(yǔ)義的信息檢索方法研究與應(yīng)用[D];浙江大學(xué);2010年
6 于水;專利術(shù)語(yǔ)知識(shí)庫(kù)的建立與應(yīng)用[D];沈陽(yáng)航空工業(yè)學(xué)院;2010年
7 范丹;Web檢索中的查詢擴(kuò)展及結(jié)果聚類技術(shù)研究[D];遼寧師范大學(xué);2010年
8 周劍烽;基于語(yǔ)義本體的信息檢索方法的研究[D];杭州電子科技大學(xué);2010年
9 趙春輝;基于關(guān)聯(lián)規(guī)則挖掘的查詢擴(kuò)展[D];河南大學(xué);2011年
10 胡珍新;面向用戶的查詢擴(kuò)展研究與實(shí)現(xiàn)[D];江西師范大學(xué);2004年
,本文編號(hào):604137
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/604137.html