一種基于語(yǔ)義單元的查詢(xún)擴(kuò)展方法
本文關(guān)鍵詞: 信息檢索 查詢(xún)擴(kuò)展 搜索引擎 語(yǔ)義單元 出處:《計(jì)算機(jī)科學(xué)》2008年02期 論文類(lèi)型:期刊論文
【摘要】:查詢(xún)擴(kuò)展技術(shù)通過(guò)向初始查詢(xún)請(qǐng)求中加入相似或者相關(guān)的詞,來(lái)減少查詢(xún)請(qǐng)求與相關(guān)文獻(xiàn)在表達(dá)上的不匹配現(xiàn)象,改善檢索性能。本文利用語(yǔ)義單元的語(yǔ)義表達(dá)能力和語(yǔ)義單元之間的關(guān)系,將與初始查詢(xún)具有密切語(yǔ)義關(guān)系的查詢(xún)?cè)~或短語(yǔ)加入到初始查詢(xún)請(qǐng)求中,更加全面地表示了用戶(hù)的查詢(xún)意愿。算法的時(shí)間復(fù)雜度為O(L),只與搜索請(qǐng)求的長(zhǎng)度L有關(guān),與語(yǔ)義單元表示庫(kù)的規(guī)模無(wú)關(guān),這對(duì)實(shí)時(shí)性要求較高的搜索引擎來(lái)講是很實(shí)用的。
[Abstract]:Query expansion technology reduces the mismatch between query request and related literature by adding similar or related words to the initial query request. To improve retrieval performance. In this paper, the semantic expression of semantic units and the relationship between semantic units, the query terms or phrases with close semantic relationship with the initial query are added to the initial query request. The time complexity of the algorithm is only related to the length of the search request L, and is independent of the size of the semantic unit representation library. This is very practical for the search engine with high real-time requirements.
【作者單位】: 北京科技大學(xué)信息工程學(xué)院 北京科技大學(xué)信息工程學(xué)院
【基金】:國(guó)家863高技術(shù)研究發(fā)展計(jì)劃項(xiàng)目基金(2006AA012140) 國(guó)家自然科學(xué)基金項(xiàng)目(60573014)的資助
【分類(lèi)號(hào)】:TP301.6
【正文快照】: 1引言在網(wǎng)絡(luò)信息檢索系統(tǒng)中,語(yǔ)言中大量存在的同義、多義、上下義等語(yǔ)義關(guān)系使得語(yǔ)言的表達(dá)方式多種多樣。而用戶(hù)提交的初始查詢(xún)請(qǐng)求是用戶(hù)搜索意愿的某一種表達(dá)方式,這種特定的表達(dá)形式使得原本具有語(yǔ)義聯(lián)系,但是以其他表達(dá)形式表示的相關(guān)網(wǎng)頁(yè)無(wú)法被搜索引擎搜索到,導(dǎo)致相關(guān)
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 黃名選;朱家安;馮平;;基于正負(fù)關(guān)聯(lián)規(guī)則融合的信息檢索模型[J];情報(bào)理論與實(shí)踐;2011年07期
2 ;第七屆全國(guó)信息檢索學(xué)術(shù)會(huì)議(CCIR 2011)征文通知[J];模式識(shí)別與人工智能;2011年03期
3 黃名選;馬瑞興;蘭慧紅;;面向查詢(xún)擴(kuò)展的特征詞頻繁項(xiàng)集挖掘算法[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2011年04期
4 黃名選;朱家安;陳燕紅;;面向查詢(xún)擴(kuò)展的詞間正負(fù)關(guān)聯(lián)規(guī)則挖掘算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年26期
5 顧小林;卞藝杰;浦徐進(jìn);;基于改進(jìn)KS方法的食品安全追溯信息檢索模型[J];軟科學(xué);2011年08期
6 張文慧;張冉;;基于中文分詞的農(nóng)業(yè)信息檢索平臺(tái)設(shè)計(jì)[J];安徽農(nóng)業(yè)科學(xué);2011年20期
7 楊永健;;淺議圖書(shū)館新型OPAC系統(tǒng)發(fā)展趨勢(shì)——以匯文OPAC系統(tǒng)為例[J];四川圖書(shū)館學(xué)報(bào);2011年03期
8 劉勁松;張彬;柴文磊;魏建行;劉振鵬;;校園網(wǎng)園區(qū)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];河北大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期
9 吳慶濤;芮躍峰;張衛(wèi)星;;個(gè)性化搜索引擎中的用戶(hù)興趣模型分析與研究[J];現(xiàn)代計(jì)算機(jī);2011年08期
10 艾丹祥;左暉;楊君;;網(wǎng)絡(luò)信息檢索中相關(guān)反饋技術(shù)的Java實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2011年16期
相關(guān)會(huì)議論文 前10條
1 陳志瑋;肖詩(shī)斌;施水才;王昕;;一種基于HTML位置信息的查詢(xún)擴(kuò)展技術(shù)[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
2 王秉卿;張奇;吳立德;黃萱菁;;機(jī)器學(xué)習(xí)的查詢(xún)擴(kuò)展在博客檢索中的應(yīng)用[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
3 劉全升;姚天f ;;基于關(guān)聯(lián)度模型的文本傾向性檢索研究[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
4 丁國(guó)棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢(xún)擴(kuò)展方法[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
5 周博;岑榮偉;劉奕群;張敏;馬少平;;相關(guān)反饋任務(wù)中一種基于文檔相似度的檢索結(jié)果重排序方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
6 羅偉;李陶深;;一種基于本體的個(gè)性化搜索引擎模型[A];廣西計(jì)算機(jī)學(xué)會(huì)2006年年會(huì)論文集[C];2006年
7 ;編者的話(huà)[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
8 米曉紅;;一種基于LSI的用戶(hù)興趣模型構(gòu)建方法[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國(guó)第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2006年
9 王敬成;;HNC農(nóng)村智能信息檢索系統(tǒng)[A];2006年首屆ICT大會(huì)信息、知識(shí)、智能及其轉(zhuǎn)換理論第一次高峰論壇會(huì)議論文集[C];2006年
10 李應(yīng)興;付婷;李勇;;基于LUCENE的藏文信息檢索的研究與應(yīng)用[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
相關(guān)重要報(bào)紙文章 前10條
1 希安;微軟試水信息檢索[N];經(jīng)濟(jì)日?qǐng)?bào);2004年
2 本報(bào)記者 潘永花;組件化平臺(tái)提升信息檢索效率[N];網(wǎng)絡(luò)世界;2003年
3 柏榮;國(guó)家973項(xiàng)目在因特網(wǎng)大規(guī)模信息檢索領(lǐng)域取得突破[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2003年
4 微軟中國(guó)研究院 陳正 李明鏡 馬維英;互聯(lián)網(wǎng)上圖像信息檢索[N];計(jì)算機(jī)世界;2001年
5 于振海;Microsoft Office 2003的翻譯服務(wù)你用了嗎?[N];中國(guó)電腦教育報(bào);2004年
6 高麗華;信息化遭遇新雷區(qū)[N];計(jì)算機(jī)世界;2007年
7 李茂 編譯;創(chuàng)新是技術(shù)素養(yǎng)的第一要求[N];中國(guó)教師報(bào);2007年
8 涂序彥 陳泓娟;在網(wǎng)絡(luò)信息海洋中淘金[N];計(jì)算機(jī)世界;2001年
9 西安 張樹(shù)忠 時(shí)劍;如何使用Word 2003翻譯功能[N];電子報(bào);2004年
10 清華大學(xué)計(jì)算機(jī)系智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室 張敏 金奕江;“海”中撈“珍”[N];計(jì)算機(jī)世界;2003年
相關(guān)博士學(xué)位論文 前10條
1 仲兆滿(mǎn);事件本體及其在查詢(xún)擴(kuò)展中的應(yīng)用[D];上海大學(xué);2011年
2 張毅波;史文結(jié)構(gòu)化信息檢索系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(軟件研究所);2001年
3 林建方;詞搭配抽取及在信息檢索中的應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2010年
4 王一川;基于內(nèi)容的海量文本探索式查詢(xún)導(dǎo)引中若干關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2011年
5 蒲強(qiáng);基于獨(dú)立分量分析的語(yǔ)義聚類(lèi)技術(shù)在信息檢索中的應(yīng)用研究[D];電子科技大學(xué);2010年
6 吳定峰;基于本體的語(yǔ)義搜索模型研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2012年
7 張華平;語(yǔ)言淺層分析與句子級(jí)新信息檢測(cè)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
8 丁國(guó)棟;基于統(tǒng)計(jì)語(yǔ)言建模的信息檢索及相關(guān)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年
9 董道國(guó);高維數(shù)據(jù)索引結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2005年
10 翟海軍;面向Web信息檢索的知識(shí)挖掘[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 周劍烽;基于語(yǔ)義本體的信息檢索方法的研究[D];杭州電子科技大學(xué);2010年
2 羅建利;基于用戶(hù)興趣的概念查詢(xún)擴(kuò)展研究[D];揚(yáng)州大學(xué);2005年
3 王水利;基于互信息的語(yǔ)義查詢(xún)擴(kuò)展技術(shù)研究[D];河南科技大學(xué);2011年
4 方勇;基于語(yǔ)義的信息檢索方法研究與應(yīng)用[D];浙江大學(xué);2010年
5 呂芳芳;基于查詢(xún)擴(kuò)展的垂直搜索研究[D];山東科技大學(xué);2010年
6 崔琰;基于用戶(hù)興趣及術(shù)語(yǔ)關(guān)系的查詢(xún)擴(kuò)展方法[D];河北大學(xué);2011年
7 方芳;中文信息檢索系統(tǒng)與文檔重排技術(shù)研究[D];武漢科技大學(xué);2010年
8 劉清江;同義詞在文本特征提取與查詢(xún)擴(kuò)展中的應(yīng)用[D];河北大學(xué);2010年
9 胡珍新;面向用戶(hù)的查詢(xún)擴(kuò)展研究與實(shí)現(xiàn)[D];江西師范大學(xué);2004年
10 范丹;Web檢索中的查詢(xún)擴(kuò)展及結(jié)果聚類(lèi)技術(shù)研究[D];遼寧師范大學(xué);2010年
,本文編號(hào):1475514
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1475514.html