基于詞匯時間分布的微博查詢擴展
本文選題:微博檢索 + 查詢擴展; 參考:《計算機學報》2016年10期
【摘要】:該文提出了一種面向微博檢索的基于詞匯時間分布的查詢擴展方法.該方法利用擴展詞與查詢詞的時間分布的相似性來度量擴展詞與查詢詞之間的相關(guān)度,建立了基于詞匯時間分布的查詢模型.具體而言,該文在提出詞匯時間分布的定義和估計方法的基礎(chǔ)上,給出了查詢詞與擴展詞的時間分布相似性的度量,以此作為它們的相關(guān)度,完成擴展詞的選擇和查詢模型的重估.該文方法利用時間信息而不是內(nèi)容來擴展查詢,避免了基于內(nèi)容的查詢擴展方法因微博內(nèi)容短而無法準確估計擴展詞的不足.由TREC 2011和TREC 2012微博檢索評測數(shù)據(jù)上的實驗結(jié)果表明,基于詞匯時間分布的查詢擴展模型有效地提高了微博檢索的性能,不僅顯著優(yōu)于經(jīng)典的基于內(nèi)容的查詢擴展模型,而且優(yōu)于其他利用時間進行查詢擴展的方法.
[Abstract]:In this paper, a query extension method based on word time distribution for Weibo retrieval is proposed. This method uses the similarity of time distribution between extended words and query words to measure the correlation between extended words and query words, and establishes a query model based on word time distribution. Specifically, on the basis of the definition and estimation method of lexical time distribution, this paper gives a measure of the similarity of temporal distribution between query words and extended words, which is regarded as their correlation degree. The selection of extended words and the revaluation of query model are completed. In this paper, time information rather than content is used to extend the query, which avoids the shortage of the method of query expansion based on content because of the short content of Weibo, which can not accurately estimate the extension words. The experimental results of TREC 2011 and TREC 2012 Weibo retrieval and evaluation data show that the query expansion model based on lexical time distribution can effectively improve the performance of Weibo retrieval, and it is not only superior to the classical content-based query expansion model, but also better than that of the classical content-based query extension model. Moreover, it is superior to other methods of query expansion using time.
【作者單位】: 哈爾濱工業(yè)大學計算機科學與技術(shù)學院;黑龍江工程學院計算機科學與技術(shù)學院;
【基金】:國家自然科學基金(61370170,61402134,61173074) 國家社科基金(14CTQ032)資助~~
【分類號】:TP391.3
【相似文獻】
相關(guān)期刊論文 前10條
1 陽小華;蔣輝;馬家宇;;基于任務(wù)上下文的查詢擴展方法[J];鄭州大學學報(理學版);2010年01期
2 吳煈;張奇;黃萱菁;;基于整數(shù)線性規(guī)劃的查詢擴展[J];計算機研究與發(fā)展;2013年08期
3 何燕;;基于用戶反饋的查詢擴展研究[J];情報理論與實踐;2013年08期
4 黃偉群;;基于用戶視角的交互式查詢擴展研究[J];圖書情報工作;2014年05期
5 黃名選;嚴小衛(wèi);張師超;;查詢擴展技術(shù)進展與展望[J];計算機應(yīng)用與軟件;2007年11期
6 林國俊;葉飛躍;耿冬;鄭國良;;基于語義的概念查詢擴展[J];計算機工程與設(shè)計;2009年06期
7 鞏玉璽;王大玲;;一種改進的基于偽相關(guān)反饋的查詢擴展[J];微計算機信息;2009年15期
8 黃名選;張師超;嚴小衛(wèi);;基于查詢行為和關(guān)聯(lián)規(guī)則的相關(guān)反饋查詢擴展[J];計算機工程;2009年10期
9 張超盟;李戰(zhàn)懷;溫宗臣;;局部上下文分析剪枝概念樹的查詢擴展[J];計算機工程;2009年14期
10 羅小聰;;基于專用雙語詞典的查詢擴展[J];現(xiàn)代計算機(專業(yè)版);2009年10期
相關(guān)會議論文 前10條
1 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴展的數(shù)字檔案檢索策略[A];廣西計算機學會2010年學術(shù)年會論文集[C];2010年
2 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴展[A];第二屆全國信息檢索與內(nèi)容安全學術(shù)會議(NCIRCS-2005)論文集[C];2005年
3 林建方;李生;鄭德權(quán);;基于詞語搭配關(guān)系的查詢擴展方法[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
4 丁國棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴展方法[A];第二屆全國信息檢索與內(nèi)容安全學術(shù)會議(NCIRCS-2005)論文集[C];2005年
5 李東園;白宇;蔡東風;;基于用戶日志分析的查詢擴展研究[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
6 張志強;孟慶海;謝曉芹;;個性化的社會標簽查詢擴展技術(shù)研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學術(shù)會議論文集A輯二[C];2010年
7 王秉卿;張奇;吳立德;黃萱菁;;機器學習的查詢擴展在博客檢索中的應(yīng)用[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
8 王秉卿;黃萱菁;;基于線性模型的查詢擴展方法[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年
9 晉松;林鴻飛;蘇綏;;基于標簽共現(xiàn)的查詢擴展研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
10 郭文;史曉東;陳毅東;;跨語言信息檢索中的查詢擴展[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
相關(guān)博士學位論文 前3條
1 郭曉黎;煤礦安全事件本體及其在查詢擴展中的應(yīng)用研究[D];中國礦業(yè)大學(北京);2016年
2 仲兆滿;事件本體及其在查詢擴展中的應(yīng)用[D];上海大學;2011年
3 王俊義;正負相關(guān)反饋與查詢擴展技術(shù)的研究[D];內(nèi)蒙古大學;2012年
相關(guān)碩士學位論文 前10條
1 姚小同;查詢擴展技術(shù)研究[D];北京郵電大學;2009年
2 許威;基于概念格的查詢擴展系統(tǒng)及建格算法研究[D];北京郵電大學;2008年
3 胡保祥;基于查詢?nèi)罩镜牟樵償U展研究[D];北京郵電大學;2013年
4 董靜;基于信任網(wǎng)絡(luò)的查詢擴展技術(shù)研究[D];哈爾濱工程大學;2013年
5 郭青;基于用戶標注信息的查詢擴展方法研究[D];大連理工大學;2014年
6 尹俊杰;基于本體術(shù)語關(guān)系的局部查詢擴展[D];河北大學;2012年
7 瞿國忠;查詢擴展技術(shù)研究[D];華中師范大學;2007年
8 林智超;基于查詢擴展的網(wǎng)絡(luò)信息語義檢索服務(wù)的研究與實現(xiàn)[D];華東師范大學;2012年
9 陳U,
本文編號:2096626
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2096626.html