基于Web的Lucene全文搜索排序算法優(yōu)化
本文關(guān)鍵詞:基于Web的Lucene全文搜索排序算法優(yōu)化
更多相關(guān)文章: lucene向量空間模型 相似度 排序算法
【摘要】:基于Lucene向量空間模型搜索的排序算法缺乏對自然語言語義理解的能力,直接有效的方法是根據(jù)用戶個體對搜索文檔的喜好,對選中的文檔得分加權(quán),由此提出Download-through Rank算法,對原有的排序算法進行了改進,設(shè)計并實現(xiàn)了個性化搜索引擎。實驗證明,改進后的搜索排序算法能夠有效提高信息檢索的準確度。
【作者單位】: 安徽工程大學計算機與信息學院;安徽工程大學計算機應(yīng)用技術(shù)重點實驗室;
【關(guān)鍵詞】: lucene向量空間模型 相似度 排序算法
【基金】:安徽工程大學青年基金項目(2013YQ29)
【分類號】:TP391.3
【正文快照】: 中小企業(yè)網(wǎng)絡(luò)服務(wù)器分布著數(shù)量龐大的文檔資源,管理這些不同格式的文檔變得越來越復雜,并隨著文檔數(shù)量的日益增加,搜索效率變低;而且,只是通過文件名進行搜索的方式,很多時候無法滿足用戶需求。由此,構(gòu)建基于全文搜索的Web搜索引擎系統(tǒng)能夠很好地解決文檔管理和搜索問題。基于
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 陳建峽;黃日;馬忠寶;;基于PageRank的Lucene排序算法優(yōu)化與實現(xiàn)[J];計算機工程與科學;2012年10期
2 李慶華 ,趙彥斌 ,趙峰 ,彭進勁;基于向量空間模型的并行信息檢索算法[J];小型微型計算機系統(tǒng);2005年09期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉全飛;周相兵;;基于lucene的站群全文檢索系統(tǒng)設(shè)計與實現(xiàn)[J];電腦與信息技術(shù);2015年01期
2 李臣龍;楊磊;鮑廣喜;;基于WEB的全文搜索引擎系統(tǒng)設(shè)計與實現(xiàn)[J];安徽科技學院學報;2014年06期
3 郭承坤;陳國松;阮懷軍;陳英義;屠星月;;基于Heritrix+Solr的農(nóng)業(yè)信息垂直搜索引擎研究與設(shè)計[J];廣東農(nóng)業(yè)科學;2015年05期
4 寧柏鋒;許冠中;;供電企業(yè)安全生產(chǎn)管理系統(tǒng)平臺的設(shè)計與應(yīng)用[J];電力信息與通信技術(shù);2015年03期
5 卜玉敏;侯聰聰;高國帥;高阿坤;;基于學術(shù)合作關(guān)系的學科專家導航實現(xiàn)算法研究[J];科技創(chuàng)新與應(yīng)用;2015年22期
6 胡章榮;王朝斌;;基于詞典的中文分詞算法及其性能評估[J];電子技術(shù)與軟件工程;2015年15期
7 周樸雄;;用于WEB文檔分類的并行KNN算法[J];計算機工程與應(yīng)用;2008年25期
8 谷萌萌;高茂庭;;搜索引擎研究與發(fā)展[J];計算機與數(shù)字工程;2008年07期
9 胡恒文;高智勇;王輝;;基于Clucene的電子病歷全文檢索系統(tǒng)研究與設(shè)計[J];計算機與數(shù)字工程;2014年03期
10 羅學禮;徐樹振;王森;楊莉;段嘉杰;;電力企業(yè)的非結(jié)構(gòu)化數(shù)據(jù)檢索研究[J];計算機與數(shù)字工程;2014年04期
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 曾歡;數(shù)據(jù)庫全文檢索方法研究及其應(yīng)用[D];大連理工大學;2011年
2 徐璐;基于Lucene和文本圖像的全文檢索系統(tǒng)的研究與應(yīng)用[D];北京郵電大學;2012年
3 張路;基于云計算平臺的海量圖片存儲系統(tǒng)設(shè)計與實現(xiàn)[D];北京郵電大學;2012年
4 丁新村;基于樹匹配和遺傳算法的構(gòu)件檢索算法研究[D];西安理工大學;2008年
5 皮靖;主題搜索引擎的研究與實現(xiàn)[D];湖北工業(yè)大學;2013年
6 張俊;基于Lucene的產(chǎn)品比價搜索系統(tǒng)的研究與設(shè)計[D];上海師范大學;2013年
7 丁文雯;面向水路基礎(chǔ)數(shù)據(jù)庫平臺的Lucene全文檢索技術(shù)研究[D];大連海事大學;2013年
8 林偉業(yè);基于爬蟲的Sohu新聞搜索引擎設(shè)計與實現(xiàn)[D];中山大學;2012年
9 孫強;輿情監(jiān)控系統(tǒng)的設(shè)計與實現(xiàn)[D];大連海事大學;2013年
10 黃翠平;基于自然語言理解的全文搜索研究[D];湖北大學;2013年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 吳偉;陳建峽;;基于Heritrix的web信息抽取優(yōu)化與實現(xiàn)[J];湖北工業(yè)大學學報;2012年02期
2 曹軍;Google的PageRank技術(shù)剖析[J];情報雜志;2002年10期
3 黃知義,周寧;Google搜索引擎的PageRank技術(shù)及其優(yōu)化研究[J];圖書館學研究;2005年08期
中國碩士學位論文全文數(shù)據(jù)庫 前3條
1 史鵬輝;專業(yè)服務(wù)網(wǎng)站搜索引擎的設(shè)計與實現(xiàn)[D];大連理工大學;2004年
2 王亮;搜索引擎及其相關(guān)性排序研究[D];武漢大學;2004年
3 壽周翔;專業(yè)搜索引擎的研究與設(shè)計[D];浙江大學;2005年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱建莉,劉宏強;常用排序算法綜述[J];勝利油田師范?茖W校學報;2002年04期
2 周海巖,郝保樹;一種新的桶分配鏈接排序算法[J];太原師范專科學校學報;2002年01期
3 趙忠孝;基于概率分布的排序算法(1)[J];計算機工程與應(yīng)用;2002年11期
4 趙忠孝;基于概率分布的排序算法(2)[J];計算機工程與應(yīng)用;2002年12期
5 何文明;針對任意分布數(shù)據(jù)的高效分檔混合排序算法[J];計算機工程與應(yīng)用;2003年22期
6 尤志強,張大方;數(shù)據(jù)等概率分檔排序算法有效性的定量研究[J];計算機學報;2003年01期
7 穆炯,蒲海波;對按位分段排序算法的研究[J];四川農(nóng)業(yè)大學學報;2004年01期
8 李井潤;一種基于統(tǒng)計的分段排序算法[J];微計算機應(yīng)用;2004年03期
9 曹清錄,王念平,張斌;合并排序算法的平均情形復雜性分析及其應(yīng)用[J];計算機工程;2004年21期
10 余炳惠,王克剛;排序算法的選擇及一些改進[J];安康師專學報;2004年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 周曉方;金志權(quán);;尋找最佳分布式排序算法[A];第九屆全國數(shù)據(jù)庫學術(shù)會議論文集(上)[C];1990年
2 張艷秋;李建中;;一種基于蛇型磁帶的排序算法[A];第十八屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2001年
3 劉春陽;葉君峰;母海龍;陸秋霞;陳滄;高鶯;;一種商品標題主題詞的重要性排序算法[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年
4 王少帥;湯慶新;姚路;;并行獨立集排序算法的改進與實現(xiàn)[A];第十六屆全國青年通信學術(shù)會議論文集(上)[C];2011年
5 于芳;王大玲;于戈;陳冬玲;鮑玉斌;;面向用戶的排序算法研究[A];第二十四屆中國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2007年
6 閆潑;馬軍;陳竹敏;;面向主題的網(wǎng)頁排序算法研究[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
7 張健沛;李連江;楊靜;;個性化搜索引擎排序算法的研究與改進[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
8 吳志彬;陳義華;;ANP中超矩陣排序算法研究[A];2006中國控制與決策學術(shù)年會論文集[C];2006年
9 陳叢叢;石冰;陳健;;面向主題的查詢相關(guān)網(wǎng)頁排序算法[A];第三屆中國智能計算大會論文集[C];2009年
10 齊曼;張珩;;實時視覺仿真中幀連貫性應(yīng)用[A];'2000系統(tǒng)仿真技術(shù)及其應(yīng)用學術(shù)交流會論文集[C];2000年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 廣東 黃陀;基本算法簡介(三)[N];電腦報;2001年
中國博士學位論文全文數(shù)據(jù)庫 前3條
1 趙立軍;基于歸并的高效排序算法的研究[D];中國科學院研究生院(計算技術(shù)研究所);1998年
2 崔筠;無向基因組的移位排序算法[D];山東大學;2006年
3 郝凡昌;有向基因組復合操作重組排序算法研究[D];山東大學;2011年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 王靖;數(shù)據(jù)庫管理系統(tǒng)中高能效排序算法[D];浙江工業(yè)大學;2012年
2 尹曉;基因組移位排序算法的改進和評測[D];山東大學;2006年
3 黃興;比特位拆分索引排序算法研究[D];清華大學;2007年
4 Mushtaq AbdulMutalib Hasson;一種論文時間與引用兼顧的科研論文排序算法[D];華中科技大學;2012年
5 劉聲田;基于第一降序小隊翻轉(zhuǎn)排序算法的設(shè)計與實現(xiàn)[D];山東大學;2006年
6 曹臻;基于粗糙集的粒度排序算法[D];上海海事大學;2007年
7 侯紅梅;圖像搜索重排序算法研究[D];山東大學;2014年
8 徐艷霞;面向數(shù)學搜索的排序算法研究[D];蘭州大學;2012年
9 張建英;稀疏正則化最小二乘排序算法[D];湖北大學;2011年
10 廉潔;改進的內(nèi)容分析排序算法在搜索引擎中的研究與應(yīng)用[D];大連交通大學;2013年
,本文編號:1116829
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1116829.html