基于領(lǐng)域本體的垂直搜索引擎頁面排序算法的研究
本文關(guān)鍵詞:基于領(lǐng)域本體的垂直搜索引擎頁面排序算法的研究,由筆耕文化傳播整理發(fā)布。
《蘭州理工大學(xué)》 2014年
基于領(lǐng)域本體的垂直搜索引擎頁面排序算法的研究
王清霞
【摘要】:伴隨著網(wǎng)絡(luò)信息資源的劇增,搜索引擎的重要性與日俱增。網(wǎng)頁排序算法是檢索引擎關(guān)鍵部分。如何有效的查找需要的信息是非常關(guān)鍵的,一個好的搜索引擎可以極大的節(jié)省用戶查找信息的時間。搜索引擎包含多個組成部分,其中網(wǎng)頁排序結(jié)果的準(zhǔn)確率直接決定了搜索引擎的性能和用戶體驗。信息檢索領(lǐng)域中有許多的網(wǎng)頁排序算法,其中基于鏈接分析的算法運(yùn)用比較廣泛。通過對垂直搜索引擎的工作原理與架構(gòu)、本體等相關(guān)技術(shù)的研究,在此基礎(chǔ)上,對基于電子商務(wù)領(lǐng)域本體的模型構(gòu)建、語義因素、排序算法優(yōu)化進(jìn)行了深入的研究。主要研究內(nèi)容包括以下幾個方面: 1.通過研究現(xiàn)有的頁面排序算法,分析了存在的不足,并介紹了網(wǎng)頁的評價標(biāo)準(zhǔn),針對返回結(jié)果相關(guān)性、用戶的體驗、響應(yīng)時間等問題,提出了基于PageRank算法的改進(jìn)策略,將語義因素應(yīng)用在垂直搜索排序算法中,從而提高了搜索結(jié)果的準(zhǔn)確率 2.本體相關(guān)技術(shù)的分析,構(gòu)建規(guī)則,建模元語以及分類,構(gòu)建了電子商務(wù)領(lǐng)域的本體,并引入WordNet語義關(guān)系的詞典,運(yùn)用在垂直搜索引擎的排序算法中。在此基礎(chǔ)上,提出一個基于電子商務(wù)領(lǐng)域的概念相似度計算方法。通過編程實現(xiàn)了詞網(wǎng)絡(luò),即給定一個詞語能夠查出該詞的所有同義詞,并通過實驗驗證了改進(jìn)后的相似度算法在中英文環(huán)境下進(jìn)行語義相似度計算效果。 3.對基于領(lǐng)域本體的垂直搜索引擎系統(tǒng)實現(xiàn),將改進(jìn)的PageRank算法應(yīng)用在本系統(tǒng)中,系統(tǒng)包括信息獲取模塊、Lucene索引模塊、本體的構(gòu)建與管理模塊和查詢擴(kuò)展與結(jié)果展示模塊。最后,用Loadrunner性能測試工具從吞吐量、平均響應(yīng)時間,Hits/second三個方面驗證了系統(tǒng)的性能,最終得出價值程度較高的頁面,進(jìn)而滿足用戶的需求。
【關(guān)鍵詞】:
【學(xué)位授予單位】:蘭州理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.3
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 余旸;夏國平;;基于鏈接結(jié)構(gòu)分析的主題搜索[J];北京工業(yè)大學(xué)學(xué)報;2011年04期
2 錢功偉;倪林;曹榮;;基于網(wǎng)頁鏈接和內(nèi)容分析的改進(jìn)PageRank算法[J];計算機(jī)工程與應(yīng)用;2007年21期
3 曹澤文;錢杰;張維明;鄧蘇;;一種綜合的概念相似度計算方法[J];計算機(jī)科學(xué);2007年03期
4 文坤梅;盧正鼎;孫小林;李瑞軒;;語義搜索研究綜述[J];計算機(jī)科學(xué);2008年05期
5 吳柏林;宋澤鋒;楊炳儒;;一種基于本體的垂直搜索引擎系統(tǒng)模型[J];計算機(jī)工程與科學(xué);2008年10期
6 張敏,宋睿華,馬少平;基于語義關(guān)系查詢擴(kuò)展的文檔重構(gòu)方法[J];計算機(jī)學(xué)報;2004年10期
7 丁岳偉;郭輝;;利用蟻群算法對PageRank算法的改進(jìn)[J];計算機(jī)應(yīng)用;2009年10期
8 張穎;王文杰;史忠植;;基于本體的文本分類方法[J];計算機(jī)仿真;2009年05期
9 蔣秀林;謝強(qiáng);丁秋林;;基于領(lǐng)域本體的用戶模型的研究[J];計算機(jī)應(yīng)用研究;2012年02期
10 溫泉;丁祥武;;基于主題聚焦模型的PageRank改進(jìn)算法[J];計算機(jī)應(yīng)用與軟件;2011年03期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 高煒;梁立;;基于概念匹配的本體映射算法[J];安徽大學(xué)學(xué)報(自然科學(xué)版);2010年06期
2 劉珊慧;萬韻;楊樂;;基于本體的農(nóng)業(yè)信息資源語義檢索過程研究[J];安徽農(nóng)業(yè)科學(xué);2009年23期
3 黃洪;劉增良;余達(dá)太;周紹華;;一種具有免疫特征的智能數(shù)據(jù)分類分級模型[J];兵工學(xué)報;2010年12期
4 黃洪;劉增良;余達(dá)太;;一種智能化的數(shù)據(jù)分類、分級及保護(hù)模型[J];北京工業(yè)大學(xué)學(xué)報;2011年06期
5 聞敬謙;李青;;基于本體的語義相似在維修案例推理中應(yīng)用[J];北京航空航天大學(xué)學(xué)報;2009年02期
6 張鵬;王國胤;陶春梅;羅海;;基于本體粗糙集的程序代碼相似度度量方法[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2008年06期
7 謝軼群;舒江波;;基于本體的構(gòu)件庫智能檢索方法研究(英文)[J];湖南文理學(xué)院學(xué)報(自然科學(xué)版);2007年03期
8 王鑫;王英;;基于本體增量學(xué)習(xí)的主題爬行[J];長春工程學(xué)院學(xué)報(自然科學(xué)版);2010年04期
9 饒祎;劉鵬;;基于本體的GridGIS服務(wù)發(fā)現(xiàn)框架研究[J];地理信息世界;2007年04期
10 王芳;滕桂法;張玉新;任力生;馬建斌;趙洋;;基于本體的農(nóng)業(yè)問答語義管理系統(tǒng)設(shè)計與實現(xiàn)[J];河北農(nóng)業(yè)大學(xué)學(xué)報;2008年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 徐立恒;劉洋;來斯惟;劉康;田野;王渝麗;趙軍;;基于多特征表示的本體概念掛載[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
2 張曉瑩;張桂平;王裴巖;;領(lǐng)域本體構(gòu)建中關(guān)系輔助判斷技術(shù)研究[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 李偉剛;張克亮;王慧蘭;;基于航空領(lǐng)域本體知識庫的語義檢索研究[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
4 畢魯雁;焦宗夏;范圣韜;趙四軍;;基于本體的機(jī)載機(jī)電系統(tǒng)故障診斷研究[A];第五屆全國流體傳動與控制學(xué)術(shù)會議暨2008年中國航空學(xué)會液壓與氣動學(xué)術(shù)會議論文集[C];2008年
5 張素智;李寶燕;樊得強(qiáng);;面向用戶和領(lǐng)域本體的Web信息采集系統(tǒng)[A];計算機(jī)研究新進(jìn)展(2010)——河南省計算機(jī)學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年
6 陳立;宋自林;鄭世明;張英;;基于本體的概念相似度計算研究[A];江蘇省系統(tǒng)工程學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
7 胡金柱;舒江波;陳志偉;杜志強(qiáng);竇桂琴;;基于本體構(gòu)件的工作流檢索研究[A];第四屆中國軟件工程大會論文集[C];2007年
8 徐惠;高志強(qiáng);陸青健;朱萬穎;;ORIGO:一種基于數(shù)字化圖書館資源的本體學(xué)習(xí)方法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 廖光忠;黃澤鑫;;基于HowNet語義算法的研究[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
10 劉兵;胡學(xué)鋼;;基于多鏈接分析的主題爬蟲設(shè)計實現(xiàn)[A];全國第20屆計算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集(上冊)[C];2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 宋巖;基于多Agent和本體的散雜貨港口集團(tuán)船舶調(diào)度系統(tǒng)研究[D];北京交通大學(xué);2011年
2 陳一稀;基于關(guān)系數(shù)據(jù)庫的遺留系統(tǒng)向語義Web移植的研究[D];浙江大學(xué);2010年
3 蔡盈芳;基于本體的航空產(chǎn)品知識庫構(gòu)建研究[D];北京交通大學(xué);2011年
4 仲兆滿;事件本體及其在查詢擴(kuò)展中的應(yīng)用[D];上海大學(xué);2011年
5 唐素勤;面向語義Web的描述邏輯本體構(gòu)建[D];中南大學(xué);2011年
6 田俊華;基于本體知識庫的教學(xué)資源自動采集技術(shù)研究[D];南京師范大學(xué);2011年
7 陳建輝;基于腦信息學(xué)的數(shù)據(jù)腦建模及其應(yīng)用[D];北京工業(yè)大學(xué);2011年
8 張楊;語義Web服務(wù)組合的可信性度量研究[D];重慶大學(xué);2011年
9 袁侃;復(fù)雜系統(tǒng)的故障診斷及容錯控制研究[D];南京航空航天大學(xué);2010年
10 郭春芬;基于本體的工藝知識管理關(guān)鍵技術(shù)研究[D];山東科技大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 呂芳芳;基于查詢擴(kuò)展的垂直搜索研究[D];山東科技大學(xué);2010年
2 劉洋;基于本體的醫(yī)保審計知識庫構(gòu)建研究[D];哈爾濱工程大學(xué);2010年
3 樸紅吉;基于分布式多索引融合的專利信息檢索研究[D];大連理工大學(xué);2010年
4 程波波;基于文本的茶學(xué)本體學(xué)習(xí)方法研究[D];安徽農(nóng)業(yè)大學(xué);2010年
5 徐濟(jì)成;面向農(nóng)業(yè)領(lǐng)域的本體學(xué)習(xí)建模研究[D];安徽農(nóng)業(yè)大學(xué);2010年
6 劉林;基于語義的元搜索引擎關(guān)鍵技術(shù)研究[D];河南工業(yè)大學(xué);2010年
7 杜海波;本體在醫(yī)療信息檢索系統(tǒng)中的應(yīng)用研究[D];長春工業(yè)大學(xué);2010年
8 劉小齊;可復(fù)用測試用例的分類與智能檢索研究[D];華東理工大學(xué);2011年
9 史磊峰;移動垂直搜索系統(tǒng)的研究[D];北京交通大學(xué);2010年
10 樊春雷;基于語義分析的糖尿病健康教育系統(tǒng)研究與實現(xiàn)[D];華東理工大學(xué);2011年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學(xué)學(xué)報(自然科學(xué)版);2002年05期
2 李震;;移動垂直搜索:隨時得到有用信息[J];中國傳媒科技;2006年12期
3 吳勁,陳澤琳;基于部分匹配的XML文本文檔向量檢索模型[J];電子學(xué)報;2002年S1期
4 盛曉煒,江銘虎;基于Rough集約簡算法的中文文本自動分類系統(tǒng)[J];電子與信息學(xué)報;2005年07期
5 崔瑩瑩;;垂直搜索:小搜索公司的活路[J];法人雜志;2006年03期
6 李智超;熊風(fēng);富羽鵬;馬少平;;分布式大規(guī)模文本檢索系統(tǒng)[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期
7 盧代軍;夏學(xué)知;張子鶴;沙基昌;;目標(biāo)信息的時效性分析[J];火力與指揮控制;2007年01期
8 劉林,汪濤,樊孝忠;主題爬蟲的解決方案[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2004年S1期
9 朱禮軍,陶蘭,劉慧;領(lǐng)域本體中的概念相似度計算[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2004年S1期
10 王建勇,單松巍,雷鳴,謝正茂,李曉明;海量Web搜索引擎系統(tǒng)中用戶行為的分布特征及其啟示[J];中國科學(xué)E輯:技術(shù)科學(xué);2001年04期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 陳文亮;朱靖波;姚天順;張宇新;;基于Bootstrapping的領(lǐng)域詞匯自動獲取[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 鄭麗萍;本體映射的研究[D];山東科技大學(xué);2005年
2 尹紅麗;基于本體的個性化信息檢索系統(tǒng)模型研究[D];山東大學(xué);2006年
3 宋迪;基于用戶偏好的搜索引擎的指標(biāo)分析與評價[D];哈爾濱工業(yè)大學(xué);2007年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 莊芯;;風(fēng)投押寶垂直搜索 各方巨頭介入又添疑點[J];IT時代周刊;2008年01期
2 顧鵬堯;;讓搜索引擎更好地服務(wù)于教育教學(xué)[J];科學(xué)24小時;2003年Z1期
3 陳新顏;垂直搜索引擎辨析[J];現(xiàn)代情報;2004年09期
4 胡文勝;;垂直搜索助號碼百事通與商務(wù)領(lǐng)航[J];每周電腦報;2006年32期
5 胡潔;丁寧;關(guān)靜;曹福年;張磊;;基于“PUBMED+PDF”的醫(yī)學(xué)垂直搜索引擎的實踐[J];信息系統(tǒng)工程;2009年05期
6 一林;;垂直搜索:前進(jìn)路上的喜與憂[J];互聯(lián)網(wǎng)天地;2010年02期
7 牟思;;基于垂直搜索引擎的學(xué)校網(wǎng)站的研究與建設(shè)[J];中國教育技術(shù)裝備;2011年21期
8 田野;垂直搜索火熱為哪般[J];中國計算機(jī)用戶;2005年37期
9 胡文勝;;垂直搜索助號碼百事通與商務(wù)領(lǐng)航[J];每周電腦報;2006年31期
10 邊凱;;你會搜索嗎?[J];中國計算機(jī)用戶;2007年23期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計與實現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
2 林歡歡;王文杰;史忠植;;移動環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
3 王旭;杜軍平;;質(zhì)檢總局互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)中聚焦爬蟲的研究[A];中國電子學(xué)會第十七屆信息論學(xué)術(shù)年會論文集[C];2010年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報研究所 周峻松;[N];計算機(jī)世界;2010年
2 王艷;[N];中國旅游報;2000年
3 賽迪網(wǎng) 方剛;[N];中國計算機(jī)報;2000年
4 王靖;[N];人民日報海外版;2000年
5 記者 王滸;[N];中國旅游報;2009年
6 本報記者 王宏;[N];中國計算機(jī)報;2001年
7 徐瑾 張玉;[N];人民郵電;2009年
8 本報記者 王曉雁;[N];法制日報;2009年
9 記者 吳德群;[N];深圳特區(qū)報;2009年
10 本報記者 胡鈺;[N];華夏時報;2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
2 吳羽;面向時間敏感對象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年
4 汲業(yè);面向圖像的垂直搜索引擎關(guān)鍵技術(shù)研究[D];大連海事大學(xué);2013年
5 李傳席;基于本體的自適應(yīng)Web信息抽取方法研究[D];中國科學(xué)技術(shù)大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李春燕;企業(yè)信息垂直搜索引擎的研究與實現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2010年
2 齊鵬;垂直搜索引擎分類索引系統(tǒng)的設(shè)計與實現(xiàn)[D];大連海事大學(xué);2010年
3 張楠;面向汽車主題的垂直搜索引擎研究與實現(xiàn)[D];西南交通大學(xué);2010年
4 陳向東;寵物用品垂直搜索引擎研究與設(shè)計[D];西北農(nóng)林科技大學(xué);2010年
5 周佳慶;實時垂直搜索引擎數(shù)據(jù)抓取調(diào)度研究[D];浙江大學(xué);2010年
6 華大年;手機(jī)產(chǎn)品信息垂直搜索引擎系統(tǒng)設(shè)計與開發(fā)[D];武漢理工大學(xué);2011年
7 薛萍;基于教育領(lǐng)域的垂直搜索引擎的研究與實現(xiàn)[D];天津師范大學(xué);2011年
8 馮效棟;垂直搜索引擎技術(shù)在網(wǎng)絡(luò)輿情巡控中的研究與應(yīng)用[D];中國海洋大學(xué);2010年
9 張贏;個性化多媒體資源垂直搜索引擎技術(shù)研究[D];華東交通大學(xué);2009年
10 李海升;垂直搜索引擎的研究與實現(xiàn)[D];西安電子科技大學(xué);2009年
本文關(guān)鍵詞:基于領(lǐng)域本體的垂直搜索引擎頁面排序算法的研究,,由筆耕文化傳播整理發(fā)布。
本文編號:113263
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/113263.html