基于開放鏈接模式的網(wǎng)站分類技術(shù)研究
本文關(guān)鍵詞:基于開放鏈接模式的網(wǎng)站分類技術(shù)研究
更多相關(guān)文章: 網(wǎng)站分類 知識庫 導(dǎo)航站點 分類算法 開放鏈接模式
【摘要】:網(wǎng)站分類是將一些已有的分類標簽指定給特定網(wǎng)站的過程,對網(wǎng)站進行分類不僅可以有效的幫助用戶準確的定位到所需的資源,而且可以很大程度上緩解信息雜亂的問題。本文對基于開放鏈接模式的網(wǎng)站分類技術(shù)進行了研究,本文內(nèi)容主要包括:1.基于開放鏈接模式相關(guān)工作zhishi:schema構(gòu)建了網(wǎng)站分類體系以及根據(jù)Zhishi.me、Babel.Net以及哈工大同義詞詞林三個知識庫獲取了各分類對應(yīng)的特征詞表,以作為網(wǎng)站分類的基礎(chǔ)。2.提出了根據(jù)網(wǎng)站主頁內(nèi)部HTML頁面標記及相應(yīng)文本,以及主頁鏈接頁面的標記及相應(yīng)文本,構(gòu)建能表示網(wǎng)站特征的特征詞表的方法。3.設(shè)計了網(wǎng)站特征詞表與可能網(wǎng)站分類的各類別的特征詞表的加權(quán)匹配算法及基于最大匹配度的網(wǎng)站分類算法。4.通過實驗,驗證了所提出的匹配算法及網(wǎng)站分類算法的有效性。5.基于網(wǎng)站分類算法,實現(xiàn)了網(wǎng)站推薦算法并設(shè)計了實現(xiàn)了網(wǎng)站分類和網(wǎng)站推薦功能的網(wǎng)站導(dǎo)航系統(tǒng)。本文的主要貢獻是提出了基于開放鏈接模式的網(wǎng)站分類算法,將網(wǎng)站標簽內(nèi)容和鄰居網(wǎng)頁的概念運用到站點分類,并綜合使用了多個中文知識庫對分類文本特征進行擴充。
【關(guān)鍵詞】:網(wǎng)站分類 知識庫 導(dǎo)航站點 分類算法 開放鏈接模式
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1;TP393.092
【目錄】:
- 摘要4-5
- Abstract5-10
- 第一章 緒論10-13
- 1.1 研究背景與意義10-11
- 1.2 相關(guān)研究現(xiàn)狀11-12
- 1.3 研究內(nèi)容12
- 1.4 本文結(jié)構(gòu)安排12-13
- 第二章 背景知識13-20
- 2.1 網(wǎng)頁分類13-15
- 2.1.1 網(wǎng)頁分類特征13-15
- 2.1.2 網(wǎng)頁分類算法綜述15
- 2.2 網(wǎng)站分類15-16
- 2.3 開放鏈接數(shù)據(jù)16-18
- 2.4 開放鏈接模式18-19
- 2.5 導(dǎo)航站點19-20
- 第三章 基于開放鏈接模式的網(wǎng)站分類20-29
- 3.1 問題定義20-21
- 3.1.1 基于開放鏈接模式的分類體系20
- 3.1.2 分類算法輸入輸出20-21
- 3.2 站點去重之Simhash算法21-23
- 3.2.1 Simhash算法介紹21-22
- 3.2.2 Simhash算法用于站點去重22-23
- 3.3 網(wǎng)站分類算法描述23-27
- 3.3.1 獲取網(wǎng)站內(nèi)容23-25
- 3.3.2 獲取分類特征25-26
- 3.3.3 綜合站點內(nèi)容和分類特征計算26-27
- 3.4 網(wǎng)站分類應(yīng)用——網(wǎng)站推薦27-29
- 3.4.1 網(wǎng)站推薦介紹27-28
- 3.4.2 網(wǎng)站推薦算法28-29
- 第四章 實驗與評估29-40
- 4.1 實驗流程29
- 4.2 實驗數(shù)據(jù)準備29-34
- 4.2.1 導(dǎo)航站點爬取29-31
- 4.2.2 分類特征獲取31-33
- 4.2.3 站點內(nèi)容爬取33-34
- 4.3 站點分類對比實驗34-37
- 4.3.1 站點特征范圍選擇34-35
- 4.3.2 網(wǎng)站標簽內(nèi)容權(quán)值選擇35-37
- 4.4 對比實驗37
- 4.5 基于開放鏈接模式的站點推薦實驗37-40
- 第五章 基于站點分類的導(dǎo)航站點設(shè)計40-43
- 5.1 導(dǎo)航站點設(shè)計思路40
- 5.2 導(dǎo)航站點設(shè)計結(jié)果40-43
- 5.2.1 站點首頁設(shè)計40-41
- 5.2.2 導(dǎo)航網(wǎng)站功能41-43
- 第六章 總結(jié)與展望43-44
- 6.1 工作總結(jié)43
- 6.2 未來展望43-44
- 致謝44-45
- 參考文獻45-49
- 攻讀碩士學(xué)位期間科研成果49
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 程舒通;徐從富;;網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)研究進展[J];計算機應(yīng)用研究;2009年06期
2 徐t;;談網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)研究進展[J];東方企業(yè)文化;2010年03期
3 許波勇;;論企業(yè)網(wǎng)站的推廣[J];電腦開發(fā)與應(yīng)用;2011年06期
4 程舒通;;網(wǎng)站結(jié)構(gòu)優(yōu)化系統(tǒng)研究[J];科技傳播;2011年24期
5 王春艷;張彥芳;;網(wǎng)站結(jié)構(gòu)規(guī)劃探討[J];東方企業(yè)文化;2013年04期
6 ;1999百家頂級網(wǎng)站(一)[J];現(xiàn)代計算機;2000年01期
7 馮江,周毅剛;網(wǎng)站介紹(5)[J];新建筑;2001年05期
8 董玉民;青島建筑工程學(xué)院網(wǎng)站的規(guī)劃與建立[J];青島建筑工程學(xué)院學(xué)報;2001年03期
9 胡綱;輕松更新自己的網(wǎng)站[Macromedia Contribute 1.0][J];個人電腦;2003年02期
10 王有為,汪定偉;基于關(guān)聯(lián)系數(shù)的電子超市網(wǎng)站結(jié)構(gòu)優(yōu)化模型及算法復(fù)雜性分析[J];小型微型計算機系統(tǒng);2004年04期
中國重要報紙全文數(shù)據(jù)庫 前10條
1 正言;企業(yè)網(wǎng)站步入互動通道[N];中國經(jīng)營報;2007年
2 王兆成;旅行社網(wǎng)站服務(wù)功能探討[N];中國旅游報;2008年
3 孟輝邋薛麗英;山西太原搗毀兩個淫穢色情網(wǎng)站[N];中國新聞出版報;2008年
4 劉安;檔案期刊與網(wǎng)絡(luò)相互強身[N];中國檔案報;2003年
5 何佳訊;撒“網(wǎng)”捕金[N];廠長經(jīng)理日報;2001年
6 小新;用BlazingTools Instant Source工具 分析網(wǎng)站代碼[N];中國電腦教育報;2004年
7 肖丹 陳蘭琴 念紅梅 陳正紅;全球“最佳中之最佳”BtoB網(wǎng)站[N];國際經(jīng)貿(mào)消息;2000年
8 本報記者 陳亮;Google重納寶馬德國網(wǎng)站[N];南方日報;2006年
9 飛飛;專業(yè)級的選擇[N];中國電腦教育報;2002年
10 ;小生產(chǎn)與大市場 網(wǎng)上溝通[N];農(nóng)民日報;2000年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 翁錦琳;基于Web使用挖掘的網(wǎng)站日志分析系統(tǒng)的研究與實現(xiàn)[D];福州大學(xué);2014年
2 雷軍;基于ThinkPHP框架的視頻教學(xué)網(wǎng)站的設(shè)計和實現(xiàn)[D];湖北大學(xué);2015年
3 劉明鳴;基于Web使用挖掘的網(wǎng)站結(jié)構(gòu)優(yōu)化技術(shù)研究[D];電子科技大學(xué);2016年
4 芮文;基于開放鏈接模式的網(wǎng)站分類技術(shù)研究[D];東南大學(xué);2015年
5 何坤鵬;基于本體的網(wǎng)站結(jié)構(gòu)知識獲取與分析[D];北京化工大學(xué);2007年
6 杜華;電子商務(wù)網(wǎng)站結(jié)構(gòu)優(yōu)化模型與算法研究[D];首都師范大學(xué);2009年
7 賈夢青;基于用戶訪問行為分析的網(wǎng)站分類研究[D];鄭州大學(xué);2009年
8 郜鑫博;基于關(guān)鍵資源的網(wǎng)站分類研究[D];哈爾濱工業(yè)大學(xué);2009年
9 賈小娟;基于交互理論的兒童網(wǎng)站引導(dǎo)性界面設(shè)計研究[D];河北工業(yè)大學(xué);2015年
10 叢帥;基于關(guān)鍵資源的網(wǎng)站分類研究[D];哈爾濱工業(yè)大學(xué);2010年
,本文編號:1057176
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1057176.html