基于偽文檔的偽相關(guān)反饋方法
本文關(guān)鍵詞:基于偽文檔的偽相關(guān)反饋方法
更多相關(guān)文章: 偽相關(guān)反饋 偽文檔 主題分析 隱含主題
【摘要】:傳統(tǒng)的偽相關(guān)反饋(Pseudo Relevance Feedback,PRF)方法通常是以文檔作為擴(kuò)展源單元提取擴(kuò)展詞,提取粒度過大造成擴(kuò)展源質(zhì)量下降,使得檢索結(jié)果魯棒性差。該文研究利用主題分析技術(shù),嘗試將文本語義內(nèi)容作為擴(kuò)展源單元,緩解擴(kuò)展源質(zhì)量不高的問題。提出并實現(xiàn)了對文本集中各文檔內(nèi)容的偽文檔描述,通過對其進(jìn)行隱式多樣化處理,實現(xiàn)了從更細(xì)微的文本內(nèi)容角度出發(fā)提取擴(kuò)展詞。通過在真實NTCIR8中文語料的檢索結(jié)果表明,該方法可以有效地提升偽相關(guān)反饋的檢索性能。
【作者單位】: 內(nèi)蒙古大學(xué)計算機(jī)學(xué)院;
【關(guān)鍵詞】: 偽相關(guān)反饋 偽文檔 主題分析 隱含主題
【基金】:國家自然科學(xué)基金(61263037;61662053) 內(nèi)蒙古自然科學(xué)基金(2014BS0604)
【分類號】:TP391.1
【正文快照】: 1引言對于基于關(guān)鍵詞的檢索方式,通常用戶是通過構(gòu)造短查詢來表達(dá)其查詢需求的。這樣的結(jié)果是,檢索效果會因為用戶查詢需求表達(dá)不全而表現(xiàn)不佳。為了彌補用戶查詢表達(dá)不全的問題,查詢擴(kuò)展(Query Expansion)技術(shù)[1]通過將與用戶查詢意思相近的詞語引入用戶初始查詢,達(dá)到提高檢
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 徐博;林鴻飛;林原;王健;;一種基于排序?qū)W習(xí)方法的查詢擴(kuò)展技術(shù)[J];中文信息學(xué)報;2015年03期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 閆蓉;高光來;;基于偽文檔的偽相關(guān)反饋方法[J];中文信息學(xué)報;2016年06期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張建鋼;;文獻(xiàn)的主題分析[J];圖書情報工作;1986年03期
2 馬緒超;檔案主題分析初探[J];湖南檔案;1997年05期
3 馬緒超;檔案主題分析質(zhì)量初探[J];城建檔案;1998年04期
4 馬緒超;;論檔案主題分析質(zhì)量問題[J];黑龍江檔案;1998年04期
5 裴少紅;檔案主題分析常見誤差與對策[J];山東檔案;2003年02期
6 ;國家社會科學(xué)基金“圖書館·情報與文獻(xiàn)學(xué)”立項主題分析[J];當(dāng)代圖書館;2007年04期
7 陳晉;;我國開放獲取研究文獻(xiàn)的主題分析[J];現(xiàn)代情報;2011年06期
8 里帆;;檔案主題分析的一般方法[J];檔案工作;1986年02期
9 周亞男;;主題分析是文獻(xiàn)標(biāo)引的基礎(chǔ)[J];圖書館學(xué)刊;1991年01期
10 姚效秋;主題分析誤檢透析[J];江西圖書館學(xué)刊;1998年S1期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 黃熔秋;;醫(yī)學(xué)論文關(guān)鍵詞標(biāo)引與主題分析[A];學(xué)報編輯論叢(第十二集)[C];2004年
2 宋昭勛;;組織文化的幻想主題分析:理論架構(gòu)與分析步驟[A];全球信息化時代的華人傳播研究:力量匯聚與學(xué)術(shù)創(chuàng)新——2003中國傳播學(xué)論壇暨CAC/CCA中華傳播學(xué)術(shù)研討會論文集(上冊)[C];2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 周亦鵬;基于軟件人的情境主題分析及應(yīng)用研究[D];北京科技大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 文博;面向智能客服機(jī)器人的交互式問句理解研究[D];哈爾濱工業(yè)大學(xué);2014年
2 王立人;基于主題分析和社交圈發(fā)現(xiàn)的微博朋友推薦[D];昆明理工大學(xué);2016年
3 彭中正;基于Spark的社交主題分析與應(yīng)用[D];電子科技大學(xué);2016年
4 王偉祿;探尋生活之意——大衛(wèi)·馬梅特早期劇作主題分析[D];內(nèi)蒙古大學(xué);2010年
5 車鳳成;約翰·霍克斯《第二張皮》的主題分析[D];西北師范大學(xué);2001年
6 董麗;服務(wù)的信息抓取和分析模塊的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2015年
7 徐宏玲;《他們》的異化主題分析[D];安徽大學(xué);2010年
8 趙秀蘭;《五號屠場》的主題分析[D];西北師范大學(xué);2002年
9 靳君;《追風(fēng)箏的人》多重主題分析[D];遼寧大學(xué);2012年
10 李慧淑;及物性、態(tài)度系統(tǒng)與短篇小說主題分析[D];東北林業(yè)大學(xué);2009年
,本文編號:750876
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/750876.html