基于較高質(zhì)量擴展源和局部詞共現(xiàn)模型的XML查詢詞擴展
本文關(guān)鍵詞:基于較高質(zhì)量擴展源和局部詞共現(xiàn)模型的XML查詢詞擴展
更多相關(guān)文章: XML查詢擴展 擴展源 詞共現(xiàn) XML結(jié)構(gòu)
【摘要】:查詢詞擴展要解決兩個方面的問題:一是擴展詞的來源,二是如何在來源集合里挑選擴展詞項。對此,首先利用檢索結(jié)果聚類和排序模型獲取了較高質(zhì)量的相關(guān)文檔集合,并以此作為擴展源;然后結(jié)合XML文檔的特點,通過詞項間的局部共現(xiàn)特征進行查詢擴展。相關(guān)實驗結(jié)果表明,一方面,所采用的檢索結(jié)果聚類和排序模型的相關(guān)文檔集擴展源具有較高的用戶查詢相關(guān)性,相比傳統(tǒng)的偽反饋擴展源,具有更高的質(zhì)量;另一方面,提出的結(jié)合了XML結(jié)構(gòu)特點的詞共現(xiàn)查詢擴展方案能獲得與用戶查詢意圖相關(guān)的擴展信息,與初始查詢和無結(jié)構(gòu)的詞項擴展方法相比,所提方法能夠更有效地提高搜索引擎檢索性能。
【作者單位】: 江西財經(jīng)大學(xué)信息管理學(xué)院;江西財經(jīng)大學(xué)數(shù)據(jù)與知識工程江西省高校重點實驗室;
【基金】:國家自然科學(xué)基金(61173146,61262035,61363039,71361012) 國家社會科學(xué)基金(12CTQ042) 江西省教育廳科技項目(GJJ11729,GJJ12734)資助
【分類號】:TP391.3
【正文快照】: 1引言信息檢索中查詢質(zhì)量不高的一個很重要的原因就是用戶往往不能準確地描述自己的查詢意圖,使得提交的查詢詞與真實需求之間存在一定程度的偏差。查詢擴展是提高信息檢索性能的有效技術(shù)手段之一。通常,查詢詞擴展要解決兩個方面的問題:1)擴展詞的來源,2)如何在來源集合里挑
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 蒲強;何大慶;楊國緯;;一種基于統(tǒng)計語義聚類的查詢語言模型估計[J];計算機研究與發(fā)展;2011年02期
2 丁國棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴展方法[J];中文信息學(xué)報;2006年03期
3 萬常選;魯遠;;基于權(quán)重查詢詞的XML結(jié)構(gòu)查詢擴展[J];軟件學(xué)報;2008年10期
4 黃名選;嚴小衛(wèi);張師超;;基于矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘的偽相關(guān)反饋查詢擴展[J];軟件學(xué)報;2009年07期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 葉正;基于網(wǎng)絡(luò)挖掘與機器學(xué)習(xí)技術(shù)的相關(guān)反饋研究[D];大連理工大學(xué);2011年
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王云;黃建;;文本搜索的一種間接方法[J];四川兵工學(xué)報;2010年01期
2 王曉春;李慧;;面向教育的垂直搜索引擎框架及其應(yīng)用[J];電化教育研究;2011年09期
3 黃子越;萬常選;;XML檢索中基于聚類的查詢詞擴展[J];電子科技大學(xué)學(xué)報;2009年S1期
4 李衛(wèi)疆;趙鐵軍;王憲剛;;基于統(tǒng)計機器翻譯模型的查詢擴展[J];電子與信息學(xué)報;2008年03期
5 姚冬磊;趙曉鵬;衛(wèi)耀偉;;同義詞挖掘及表示研究[J];福建電腦;2010年03期
6 李衛(wèi)疆;;A new approach to query expansion in information retrieval[J];High Technology Letters;2008年01期
7 劉茂福;周斌;胡慧君;陳建勛;;問答系統(tǒng)中基于維基百科的問題擴展技術(shù)研究[J];工業(yè)控制計算機;2012年09期
8 李力沛;羅穎;;基于個性化詞典的搜索引擎查詢擴展模型[J];電腦知識與技術(shù);2012年28期
9 李力沛;羅穎;;基于修正TF-IDF的搜索引擎查詢擴展模型[J];福建電腦;2012年10期
10 李衛(wèi)疆;趙鐵軍;王憲剛;;基于上下文的查詢擴展[J];計算機研究與發(fā)展;2010年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 黃名選;嚴小衛(wèi);張師超;;基于完全加權(quán)關(guān)聯(lián)規(guī)則挖掘的信息檢索模型[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
2 林建方;李生;鄭德權(quán);;基于詞語搭配關(guān)系的查詢擴展方法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
3 晉松;林鴻飛;蘇綏;;基于標簽共現(xiàn)的查詢擴展研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年
4 黃名選;;基于正負關(guān)聯(lián)規(guī)則挖掘的局部反饋查詢擴展[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
5 周斌;劉茂福;陳建勛;;IR4QA系統(tǒng)中基于維基百科的查詢擴展[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
6 劉喜平;萬常選;劉德喜;;有效的XML模糊內(nèi)容與結(jié)構(gòu)檢索和計分[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
7 劉德喜;萬常選;劉喜平;焦賢沛;;XML檢索中的標簽權(quán)重設(shè)置模型[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年
8 張志強;孟慶海;謝曉芹;;個性化的社會標簽查詢擴展技術(shù)研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年
9 鐘敏娟;萬常選;;基于偽反饋的XML查詢擴展[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
10 溫馨;王鵬;李少亮;郭文琪;陳群;婁穎;;基于關(guān)鍵字的XML信息檢索反饋技術(shù)的研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李強;數(shù)據(jù)挖掘中關(guān)聯(lián)分析算法研究[D];哈爾濱工程大學(xué);2010年
2 陳曦;基于子串的文本分割與主題標注研究[D];武漢大學(xué);2009年
3 仲兆滿;事件本體及其在查詢擴展中的應(yīng)用[D];上海大學(xué);2011年
4 高雅田;基于MAS的數(shù)據(jù)挖掘模型自動選擇方法研究[D];東北石油大學(xué);2011年
5 王讓;KPI模式下海工裝備項目總進度偏差成因與數(shù)據(jù)挖掘[D];哈爾濱工程大學(xué);2011年
6 王樹梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學(xué);2007年
7 胡佳妮;文本挖掘中若干關(guān)鍵問題的研究[D];北京郵電大學(xué);2008年
8 劉海學(xué);基于語義標注的元數(shù)據(jù)自動構(gòu)建及其相關(guān)技術(shù)研究[D];華東師范大學(xué);2010年
9 蒲強;基于獨立分量分析的語義聚類技術(shù)在信息檢索中的應(yīng)用研究[D];電子科技大學(xué);2010年
10 林建方;詞搭配抽取及在信息檢索中的應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 孟慶海;基于社會書簽的個性化查詢詞擴展技術(shù)研究[D];哈爾濱工程大學(xué);2010年
2 晉松;基于社會化標注的查詢擴展技術(shù)研究[D];大連理工大學(xué);2010年
3 楊海南;基于語義詞典和局部分析的查詢擴展研究[D];武漢理工大學(xué);2010年
4 呂桃霞;基于Agent技術(shù)的網(wǎng)絡(luò)安全審計模型研究與實現(xiàn)[D];山東師范大學(xué);2011年
5 李彥偉;基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘方法研究[D];江南大學(xué);2011年
6 周源;基于本體的語義垂直搜索引擎研究[D];北京交通大學(xué);2011年
7 辛強;基于共現(xiàn)距離與查詢擴展的蒙古文信息檢索系統(tǒng)[D];內(nèi)蒙古大學(xué);2011年
8 顏婷;基于本體的語義搜索技術(shù)研究與實現(xiàn)[D];杭州師范大學(xué);2011年
9 呂海紅;基于MOSS的異源實體關(guān)聯(lián)方法研究[D];燕山大學(xué);2010年
10 解玉潔;基于樹結(jié)構(gòu)的精簡序列模式挖掘算法研究[D];燕山大學(xué);2010年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 曲衛(wèi)民,張俊林,孫樂;基于主題的漢語語言模型的研究[J];計算機研究與發(fā)展;2003年09期
2 譚義紅,林亞平;向量空間模型中完全加權(quán)關(guān)聯(lián)規(guī)則的挖掘[J];計算機工程與應(yīng)用;2003年13期
3 王志軍,于超;基于隱式反饋的個人信息檢索技術(shù)及實現(xiàn)[J];計算機工程;2003年06期
4 黃名選;嚴小衛(wèi);張師超;;查詢擴展技術(shù)進展與展望[J];計算機應(yīng)用與軟件;2007年11期
5 李小華;;一種帶反饋的XML信息檢索系統(tǒng)設(shè)計與研究[J];廈門理工學(xué)院學(xué)報;2006年01期
6 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴展[J];中文信息學(xué)報;2006年03期
7 丁國棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴展方法[J];中文信息學(xué)報;2006年03期
8 劉紹翰,武港山,張福炎;基于詞條權(quán)值的相關(guān)反饋算法在Web信息檢索中的應(yīng)用[J];情報學(xué)報;2002年06期
9 李劍波,李小華;基于XML的反饋式信息檢索系統(tǒng)研究[J];情報雜志;2005年10期
10 黃萱菁,夏迎炬,吳立德;基于向量空間模型的文本過濾系統(tǒng)[J];軟件學(xué)報;2003年03期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 耿煥同,陳少軍;一種基于傳統(tǒng)VSM和詞共現(xiàn)概念的中文文本聚類的研究[J];安徽師范大學(xué)學(xué)報(自然科學(xué)版);2005年01期
2 吳光遠,何丕廉,曹桂宏,聶頌;基于向量空間模型的詞共現(xiàn)研究及其在文本分類中的應(yīng)用[J];計算機應(yīng)用;2003年S1期
3 滿堂喝彩;;用千千靜聽制作高質(zhì)量MP3[J];電腦迷;2006年07期
4 李天鐸;快速高質(zhì)量開發(fā)附件[J];管理科學(xué)文摘;1998年11期
5 ;世界最先進的網(wǎng)格生成系統(tǒng)GridPro進入中國[J];航空動力學(xué)報;2009年05期
6 常鵬;馬輝;;高效的短文本主題詞抽取方法[J];計算機工程與應(yīng)用;2011年20期
7 張婷慧;耿煥同;蔡慶生;;一種改進的VSM及其在文本自動分類中的應(yīng)用[J];微電子學(xué)與計算機;2005年12期
8 ;Borland生命周期質(zhì)量管理方案增強IT推出高質(zhì)量軟件能力[J];電腦編程技巧與維護;2006年12期
9 曹恬;周麗;張國煊;;一種基于詞共現(xiàn)的文本相似度計算[J];計算機工程與科學(xué);2007年03期
10 朱松;高艷萍;;用于信息檢索的貝葉斯網(wǎng)絡(luò)模型擴展[J];內(nèi)蒙古科技與經(jīng)濟;2009年22期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 Raimund Parzmair;荊德君;;高溫產(chǎn)品的標記和跟蹤[A];1999中國鋼鐵年會論文集(上)[C];1999年
2 楊小冬;唐仲華;黃騰;;基于Java3D的高質(zhì)量虛擬地形漫游實現(xiàn)[A];第四屆海峽兩岸GIS發(fā)展研討會暨中國GIS協(xié)會第十屆年會論文集[C];2006年
3 俞舸;齊士鈐;張家錄;;漢語語音綜合資料庫錄音技術(shù)[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年
4 李斌;;對CUJA數(shù)據(jù)質(zhì)量及系統(tǒng)軟件的幾點建議[A];外向型文獻庫的數(shù)據(jù)質(zhì)量控制——首屆CUJA系統(tǒng)學(xué)術(shù)討論會論文集[C];1990年
5 王膺權(quán);;強化CUJA數(shù)據(jù)庫的質(zhì)量意識[A];外向型文獻庫的數(shù)據(jù)質(zhì)量控制——首屆CUJA系統(tǒng)學(xué)術(shù)討論會論文集[C];1990年
6 ;典藏藉數(shù)字化嘉惠學(xué)林 漢字又在手機展現(xiàn)異彩[A];中國中文信息學(xué)會第六次全國會員代表大會暨成立二十五周年學(xué)術(shù)會議中文信息處理重大成果匯報展資料匯編[C];2006年
7 劉君強;顧海全;王訊;李榮;;基于開源框架的高質(zhì)量J2EE應(yīng)用架構(gòu)[A];促進企業(yè)信息化進程——第九屆中國Java技術(shù)及應(yīng)用交流大會文集[C];2006年
8 王飛躍;;我的教學(xué)夢[A];新觀點新學(xué)說學(xué)術(shù)沙龍文集7:教育創(chuàng)新與創(chuàng)新人才培養(yǎng)[C];2007年
9 王秉卿;黃萱菁;;基于線性模型的查詢擴展方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
10 趙鑫;解梅;;基于DSP的虹膜識別系統(tǒng)[A];第七屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 賈靖峰;找錢也要探究“和諧”[N];經(jīng)理日報;2007年
2 王興山;中國企業(yè)資源計劃之路怎樣走[N];金融時報;2006年
3 ;UPS廠商發(fā)力中小企業(yè)信息化市場[N];人民郵電;2007年
4 李媛;走在客戶需求之前[N];中國經(jīng)營報;2008年
5 袁曉靜 高振平 魯元魁;編寫高質(zhì)量的PB應(yīng)用程序(上)[N];計算機世界;2002年
6 袁曉靜 高振平 魯元魁;編寫高質(zhì)量的PB應(yīng)用程序(下)[N];計算機世界;2002年
7 本報記者 瑜文;Silverlight:Web革命靜悄悄[N];中國電腦教育報;2007年
8 本報記者;甲骨文公司落戶福州[N];福建科技報;2007年
9 本報記者 趙海軍;國產(chǎn)軟件廠商破局有望[N];中國計算機報;2008年
10 本報記者 侯玉邋通訊員 肖麗;中國服務(wù)外包產(chǎn)業(yè)升級之路[N];國際商報;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 常鵬;基于詞共現(xiàn)的文本主題挖掘模型和算法研究[D];天津大學(xué);2010年
2 耿煥同;范例推理與互聯(lián)網(wǎng)文本信息處理研究[D];中國科學(xué)技術(shù)大學(xué);2006年
3 周迪斌;基于紋理的高質(zhì)量矢量可視化研究[D];浙江大學(xué);2008年
4 章舜仲;文本分類中詞共現(xiàn)關(guān)系的研究及其應(yīng)用[D];南京理工大學(xué);2010年
5 鄭杰;基于GPU的高質(zhì)量交互式可視化技術(shù)研究[D];西安電子科技大學(xué);2007年
6 管宇;圖像和視頻的便捷摳圖技術(shù)研究[D];浙江大學(xué);2008年
7 劉興林;中文詞匯知識獲取算法和語義計算研究及應(yīng)用[D];華南理工大學(xué);2012年
8 張英朝;基于全局視圖的虛擬組織信息共享方法與應(yīng)用研究[D];國防科學(xué)技術(shù)大學(xué);2004年
9 陳毅恒;文本檢索結(jié)果聚類及類別標簽抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 趙祥重;基于詞共現(xiàn)的語言模型信息檢索方法研究[D];哈爾濱工程大學(xué);2013年
2 侯小可;微博新聞話題的情感分析研究[D];華北電力大學(xué);2013年
3 張勇智;ITS中高質(zhì)量視頻的獲取及其在車輛壓黃線違章檢測中的應(yīng)用[D];西安電子科技大學(xué);2005年
4 尹倩;基于聚類分析的中文新聞網(wǎng)頁關(guān)鍵詞提取方法研究[D];合肥工業(yè)大學(xué);2009年
5 李星華;中英文新聞網(wǎng)頁關(guān)鍵詞抽取技術(shù)研究[D];合肥工業(yè)大學(xué);2009年
6 馮運;信息檢索中的查詢算法研究[D];湖南大學(xué);2007年
7 陳少明;基于用戶行為與本體的查詢詞擴展研究[D];西華大學(xué);2010年
8 吳春龍;宋詞風(fēng)格的計算機輔助分析研究[D];廈門大學(xué);2008年
9 梅筱;視頻特征及其描述詞匯的對齊研究[D];北京郵電大學(xué);2011年
10 唐守忠;文本挖掘關(guān)鍵技術(shù)研究[D];北京林業(yè)大學(xué);2013年
,本文編號:1197301
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1197301.html