一種面向域的高效倒排索引結(jié)構(gòu)及實(shí)時更新
本文選題:倒排索引 切入點(diǎn):增量更新 出處:《四川大學(xué)學(xué)報(自然科學(xué)版)》2011年02期 論文類型:期刊論文
【摘要】:倒排索引是搜索引擎的核心組成部分,對搜索的效率與質(zhì)量有著較大的影響.在一些主題搜索引擎中,關(guān)鍵詞被劃分為多個域以提高檢索質(zhì)量,針對這種特點(diǎn),本文提出了一種新的面向域的高效倒排索引結(jié)構(gòu),以及實(shí)時更新倒排索引的算法.實(shí)驗(yàn)結(jié)果表明,在每個域內(nèi)索引詞項(xiàng)個數(shù)接近詞典大小的情況卞,本文提出的倒排索引結(jié)構(gòu)可以有效地提高搜索引擎的檢索效率.
[Abstract]:Inverted index is the core part of search engine, which has great influence on the efficiency and quality of search. In some subject search engines, keywords are divided into multiple domains to improve retrieval quality. In this paper, a new domain oriented inverted index structure and an algorithm for updating inverted index in real time are proposed. The experimental results show that the number of words in each domain is close to the size of the dictionary. The inverted index structure proposed in this paper can effectively improve the search efficiency of search engines.
【作者單位】: 四川大學(xué)錦江學(xué)院;
【分類號】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳恒山,劉興宇,左瓊;一種基于可擴(kuò)展散列表的倒排索引更新策略[J];計(jì)算機(jī)工程;2004年08期
2 林懷忠,周波,鄭增威,陳純;移動數(shù)據(jù)庫的視圖增量更新算法[J];計(jì)算機(jī)集成制造系統(tǒng)-CIMS;2004年03期
3 段琢華;一種高效的關(guān)聯(lián)規(guī)則增量更新算法[J];機(jī)電工程技術(shù);2004年02期
4 白洪濤,孫吉貴,莫旭,楊鳳杰;一個專用ETL程序的實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2004年02期
5 王宏宇;;基于Native-XML數(shù)據(jù)庫倒排索引算法研究[J];情報科學(xué);2006年07期
6 顧頎;胡孔法;陳];唐曉麗;劉海東;;基于維層次的語義Cube存儲與增量更新技術(shù)研究[J];計(jì)算機(jī)應(yīng)用研究;2007年06期
7 蘇潭英;郭憲勇;金鑫;;一種基于Lucene的中文全文檢索系統(tǒng)[J];計(jì)算機(jī)工程;2007年23期
8 孫寶友;姜合;趙園園;;關(guān)聯(lián)規(guī)則的增量更新算法研究[J];計(jì)算機(jī)與信息技術(shù);2008年03期
9 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代情報;2009年07期
10 劉妍;韓秀峰;;導(dǎo)航電子地圖增量更新數(shù)據(jù)模型研究[J];吉林建筑工程學(xué)院學(xué)報;2010年04期
相關(guān)會議論文 前10條
1 劉小珠;孫莎;曾承;彭智勇;;基于緩存的倒排索引機(jī)制研究[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
2 李棟;史曉東;;對搜索引擎中倒排索引更新策略的研究和改進(jìn)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
3 夏燕;鄧緒斌;李岱;朱揚(yáng)勇;;生物數(shù)據(jù)倉庫半結(jié)構(gòu)化增量更新技術(shù)的研究與實(shí)現(xiàn)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年
4 董祥千;左志宏;劉強(qiáng)國;;Lucene倒排索引文件的實(shí)現(xiàn)與優(yōu)化[A];四川省通信學(xué)會2006年學(xué)術(shù)年會論文集(二)[C];2006年
5 溫磊;李敏強(qiáng);;基于有向項(xiàng)集圖的頻繁項(xiàng)集增量更新挖掘算法[A];2004中國控制與決策學(xué)術(shù)年會論文集[C];2004年
6 辛欣;李涓子;;基于Java語言全文信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];促進(jìn)企業(yè)信息化進(jìn)程——第十屆中國Java技術(shù)及應(yīng)用大會文集[C];2007年
7 羅曉燕;袁燕巖;郭金麗;張紅;;北京市數(shù)字線劃圖數(shù)據(jù)庫增量更新技術(shù)的應(yīng)用研究[A];數(shù)字測繪與GIS技術(shù)應(yīng)用研討交流會論文集[C];2008年
8 維尼拉·木沙江;吳俊森;吐爾根·依布拉音;;維吾爾文搜索引擎的倒排索引設(shè)計(jì)與實(shí)現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
9 林艷;劉萬增;陳軍;;GIS數(shù)據(jù)庫增量更新的模型研究[A];中國測繪學(xué)會九屆四次理事會暨2008年學(xué)術(shù)年會論文集[C];2008年
10 孫宇;劉憬;張宇;劉挺;;基于分詞和倒排索引的短文本檢索技術(shù)的研究與實(shí)現(xiàn)[A];黑龍江省計(jì)算機(jī)學(xué)會2007年學(xué)術(shù)交流年會論文集[C];2007年
相關(guān)重要報紙文章 前5條
1 清華大學(xué)計(jì)算機(jī)系智能技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室 張敏 金奕江;尋“寶”有術(shù)[N];計(jì)算機(jī)世界;2003年
2 特約作者 李巖;iOS5帶來什么[N];電腦報;2011年
3 本報通訊員 戴韞卓 李庭常;與時間賽跑[N];中國國土資源報;2011年
4 記者 王瑜婷;導(dǎo)航電子地圖現(xiàn)勢性將提高一倍[N];中國測繪報;2009年
5 賽迪顧問半導(dǎo)體產(chǎn)業(yè)研究中心咨詢師 徐鵬;國內(nèi)導(dǎo)航電子地圖市場將走向集中[N];中國計(jì)算機(jī)報;2009年
相關(guān)博士學(xué)位論文 前10條
1 王釗;車輛導(dǎo)航電子地圖的自增量更新[D];清華大學(xué);2012年
2 溫磊;基于有向項(xiàng)集圖的關(guān)聯(lián)規(guī)則挖掘算法研究與應(yīng)用[D];天津大學(xué);2004年
3 汪健;支持增量更新的多模式城市交通網(wǎng)絡(luò)時空數(shù)據(jù)模型研究[D];吉林大學(xué);2009年
4 周曉光;基于拓?fù)潢P(guān)系的地籍?dāng)?shù)據(jù)庫增量更新方法研究[D];中南大學(xué);2005年
5 于寶琴;成套電器企業(yè)異構(gòu)數(shù)據(jù)整合及其物流系統(tǒng)的研究[D];天津大學(xué);2006年
6 李文海;基于粗集的關(guān)系型聯(lián)機(jī)分析優(yōu)化技術(shù)研究[D];華中科技大學(xué);2007年
7 錢新林;面向自發(fā)地理信息的空間數(shù)據(jù)表達(dá)與管理方法研究[D];武漢大學(xué);2011年
8 吳煒;密文全文檢索系統(tǒng)中的索引機(jī)制研究[D];華中科技大學(xué);2009年
9 金雪云;基于XQuery的增量計(jì)算程序自動生成技術(shù)研究[D];北京工業(yè)大學(xué);2012年
10 周明;基于數(shù)據(jù)挖掘的制造業(yè)采購DSS理論及方法研究[D];天津大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 王勇;基于定時任務(wù)和增量更新技術(shù)的數(shù)據(jù)實(shí)時更新方法的研究[D];北京郵電大學(xué);2010年
2 黃文嘉;基于變化影像塊的遙感數(shù)據(jù)增量更新方法研究[D];中南大學(xué);2011年
3 董長春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年
4 王春華;增量更新關(guān)聯(lián)規(guī)則挖掘方法的研究[D];哈爾濱工程大學(xué);2012年
5 潘勝一;基于倒排索引的壓縮算法性能研究[D];杭州電子科技大學(xué);2009年
6 陳雪帆;基于固態(tài)硬盤的倒排索引構(gòu)建與維護(hù)策略研究[D];華中科技大學(xué);2012年
7 薛煜陽;農(nóng)業(yè)搜索引擎倒排索引緩沖機(jī)制研究[D];新疆農(nóng)業(yè)大學(xué);2011年
8 屈磊;動態(tài)全文索引系統(tǒng)關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2009年
9 劉春艷;關(guān)聯(lián)規(guī)則及關(guān)聯(lián)規(guī)則增量更新研究[D];四川師范大學(xué);2011年
10 吳俊森;維哈柯多語種搜索引擎倒排索引模塊的實(shí)現(xiàn)[D];新疆大學(xué);2007年
,本文編號:1628379
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1628379.html