天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

網(wǎng)絡(luò)原創(chuàng)文章優(yōu)先的搜索引擎排序算法研究

發(fā)布時間:2016-10-17 10:09

  本文關(guān)鍵詞:網(wǎng)絡(luò)原創(chuàng)文章優(yōu)先的搜索引擎排序算法研究,由筆耕文化傳播整理發(fā)布。


《重慶大學(xué)》 2007年

網(wǎng)絡(luò)原創(chuàng)文章優(yōu)先的搜索引擎排序算法研究

郝金隆  

【摘要】: 隨著網(wǎng)絡(luò)規(guī)模的擴大,搜索引擎正在現(xiàn)代網(wǎng)絡(luò)競爭中占據(jù)越來越重要的地位,而搜索引擎的核心——排序算法正在對網(wǎng)絡(luò)競爭能否公平方面產(chǎn)生著巨大的影響。與此同時,網(wǎng)絡(luò)文章輕易的被轉(zhuǎn)載這一現(xiàn)實情況正使得原創(chuàng)站點在網(wǎng)絡(luò)競爭中處于很不利的地位。通過改進(jìn)搜索引擎排序算法,提高網(wǎng)絡(luò)原創(chuàng)文章的搜索引擎排名無疑能使得現(xiàn)代網(wǎng)絡(luò)競爭更為公平,具有很重要的現(xiàn)實意義和社會效益。 本文提出了一種適用于專業(yè)搜索引擎的新型排序算法,此算法在排序時優(yōu)先考慮了網(wǎng)絡(luò)原創(chuàng)文章,可以使原創(chuàng)文章的搜索排名得到提高,有助于新興原創(chuàng)網(wǎng)站的發(fā)展,從而能提高現(xiàn)代網(wǎng)絡(luò)社會競爭的公平性。 論文的主要工作有: ①分析了現(xiàn)有的搜索引擎排序算法,對其進(jìn)行了優(yōu)缺點的比較,指出了它們對于原創(chuàng)文章的不利之處,提出了要通過改進(jìn)搜索引擎排序算法來提高網(wǎng)絡(luò)原創(chuàng)文章的搜索引擎排名,以提高搜索引擎的公平合理性。 ②構(gòu)建了網(wǎng)絡(luò)原創(chuàng)文章判定算法,通過網(wǎng)絡(luò)上可見的信息,對網(wǎng)絡(luò)文章的原創(chuàng)可能性進(jìn)行量化。 ③說明了網(wǎng)絡(luò)原創(chuàng)文章判定算法在搜索引擎中的應(yīng)用方法,指出了如何利用網(wǎng)絡(luò)原創(chuàng)文章的判定結(jié)果對原有搜索引擎排名結(jié)果進(jìn)行修正。 ④綜合網(wǎng)頁關(guān)鍵詞相關(guān)度計算方法、PageRank算法以及原創(chuàng)文章的判定算法,構(gòu)造了搜索引擎的綜合排序模型,使之可以應(yīng)用到實際的搜索引擎之中。 ⑤構(gòu)建原型系統(tǒng),應(yīng)用原創(chuàng)優(yōu)先的搜索引擎排序模型,提高了網(wǎng)絡(luò)原創(chuàng)文章的搜索引擎排名,實驗統(tǒng)計結(jié)果良好。

【關(guān)鍵詞】:
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2007
【分類號】:TP391.3
【目錄】:

  • 摘要3-4
  • ABSTRACT4-8
  • 1 緒論8-18
  • 1.1 搜索引擎的現(xiàn)狀8-10
  • 1.1.1 搜索引擎的發(fā)展歷史8-9
  • 1.1.2 搜索引擎的分類9-10
  • 1.2 典型搜索引擎介紹10-12
  • 1.2.1 Google10-11
  • 1.2.2 Baidu11
  • 1.2.3 Yahoo11
  • 1.2.4 Sogou11-12
  • 1.3 SEO 技術(shù)12-16
  • 1.3.1 SEO 技術(shù)的主要方法和策略12-13
  • 1.3.2 SEO 技術(shù)的發(fā)展趨勢13-14
  • 1.3.3 網(wǎng)頁作弊的幾種方式14-16
  • 1.4 本文的主要工作16-17
  • 1.5 本章小結(jié)17-18
  • 2 經(jīng)典排序算法及其比較18-28
  • 2.1 PageRank 算法18-21
  • 2.2 HITS 算法21-23
  • 2.3 Hilltop 算法23
  • 2.4 收費排名23-25
  • 2.5 經(jīng)典算法評價25-27
  • 2.5.1 PageRank 算法的缺點與改進(jìn)25-26
  • 2.5.2 HITS 算法的缺點與改進(jìn)26
  • 2.5.3 經(jīng)典排序算法對網(wǎng)絡(luò)原創(chuàng)文章的不公平之處26-27
  • 2.6 本章小結(jié)27-28
  • 3 網(wǎng)絡(luò)原創(chuàng)文章的判定算法28-32
  • 3.1 網(wǎng)絡(luò)文章的分類28
  • 3.2 網(wǎng)站的三個“信用度”28-29
  • 3.3 文章原創(chuàng)可能性的確定29-30
  • 3.4 文章原創(chuàng)可能性對網(wǎng)站信用度的修正30-31
  • 3.5 本章小結(jié)31-32
  • 4 原創(chuàng)優(yōu)先的搜索引擎排序算法32-42
  • 4.1 內(nèi)容重復(fù)網(wǎng)頁的確定32-36
  • 4.1.1 網(wǎng)頁的重復(fù)特點32
  • 4.1.2 現(xiàn)有網(wǎng)頁去重的方法簡介32-33
  • 4.1.3 基于特征串重復(fù)網(wǎng)頁判定方法33-36
  • 4.2 原創(chuàng)文章判定結(jié)果對網(wǎng)頁權(quán)威度的修正36-38
  • 4.3 綜合排序模型38-41
  • 4.3.1 基于網(wǎng)頁內(nèi)容的相關(guān)度算法38-39
  • 4.3.2 最終檢索排名方法39-41
  • 4.4 本章小結(jié)41-42
  • 5 原型系統(tǒng)研究42-57
  • 5.1 技術(shù)選型42-43
  • 5.1.1 數(shù)據(jù)庫選擇42
  • 5.1.2 搜索引擎平臺選擇42
  • 5.1.3 開發(fā)平臺選擇42-43
  • 5.2 Nutch43-48
  • 5.2.1 Lucene43-46
  • 5.2.2 Nutch 爬蟲46-48
  • 5.3 系統(tǒng)設(shè)計與實現(xiàn)48-55
  • 5.3.1 系統(tǒng)用例48-49
  • 5.3.2 系統(tǒng)構(gòu)建流程49-50
  • 5.3.3 系統(tǒng)結(jié)構(gòu)分析50
  • 5.3.4 主要數(shù)據(jù)表定義50-52
  • 5.3.5 程序設(shè)計52-54
  • 5.3.6 程序運行效果54-55
  • 5.4 算法驗證55
  • 5.4.1 算法驗證方法55
  • 5.4.2 結(jié)果分析55
  • 5.5 本章小結(jié)55-57
  • 6 結(jié)論與展望57-59
  • 6.1 總結(jié)57
  • 6.2 展望57-59
  • 致謝59-60
  • 參考文獻(xiàn)60-62
  • 附錄62
  • 下載全文 更多同類文獻(xiàn)

    CAJ全文下載

    (如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)

    CAJViewer閱讀器支持CAJ、PDF文件格式


    【相似文獻(xiàn)】

    中國期刊全文數(shù)據(jù)庫 前10條

    1 王巧玲;彭靜;王春紅;;中文分詞技術(shù)的研究及在Nutch中的實現(xiàn)[J];科技信息;2011年19期

    2 ;李彥宏論搜索引擎三個定律[J];新電子;2001年02期

    3 相春雷;;2009年中國搜索引擎市場趨勢分析[J];軟件世界;2010年02期

    4 ;揭秘搜索引擎收錄網(wǎng)站的秘密[J];計算機與網(wǎng)絡(luò);2010年Z1期

    5 楊超;李杰;李浩宇;;基于PageRank的頁面排序算法研究[J];電腦編程技巧與維護(hù);2011年16期

    6 劉荷花;;搜索引擎技術(shù)的研究——基于后綴數(shù)組的搜索技術(shù)[J];中國教育信息化;2011年07期

    7 詹圣君;邵雄凱;劉建舟;;一種考慮用戶行為的改進(jìn)N—PageRank算法[J];計算機技術(shù)與發(fā)展;2011年08期

    8 馬玥;;王小川:絕境之外[J];中國經(jīng)濟(jì)和信息化;2011年12期

    9 魏蕾如;;基于搜索引擎的網(wǎng)絡(luò)中文信息檢索工具評價[J];數(shù)字技術(shù)與應(yīng)用;2011年06期

    10 ;創(chuàng)新工業(yè)搜索引擎[J];中國制造業(yè)信息化;2011年12期

    中國重要會議論文全文數(shù)據(jù)庫 前10條

    1 張健沛;李連江;楊靜;;個性化搜索引擎排序算法的研究與改進(jìn)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

    2 郭鴻志;陳清才;康永燕;王曉龍;;一種基于網(wǎng)站特征識別的搜索引擎排序算法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

    3 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計算機學(xué)會2008年年會論文集[C];2008年

    4 梁婷婷;張志強;謝曉芹;;搜索引擎評估算法綜述[A];黑龍江省計算機學(xué)會2009年學(xué)術(shù)交流年會論文集[C];2010年

    5 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會第五屆學(xué)術(shù)年會論文集[C];2008年

    6 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會第二屆理事大會暨學(xué)術(shù)交流會議論文匯編[C];2003年

    7 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2001年

    8 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計與實現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

    9 楊磊;束罡;牛振東;;基于引力模型的鏈接分析(英文)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

    10 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計算學(xué)術(shù)會議論文集[C];2005年

    中國重要報紙全文數(shù)據(jù)庫 前10條

    1 主持人 本報記者 姜晨怡 本報實習(xí)生 馮志云;[N];科技日報;2011年

    2 王立群;[N];中國計算機報;2005年

    3 主持人 陳建棟;[N];光明日報;2005年

    4 本報記者 陳建棟;[N];光明日報;2005年

    5 曾正樂;[N];經(jīng)濟(jì)日報;2005年

    6 本報記者 秦海波;[N];經(jīng)濟(jì)日報;2005年

    7 FN記者 柳立;[N];金融時報;2005年

    8 閆輝;[N];計算機世界;2005年

    9 本報記者 李劍;[N];通信信息報;2005年

    10 華夏;[N];江蘇科技報;2008年

    中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

    1 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年

    2 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學(xué);2010年

    3 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年

    4 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年

    5 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年

    6 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學(xué);2011年

    7 王镠璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年

    8 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

    9 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年

    10 陳紅濤;基于搜索日志的用戶行為研究及應(yīng)用[D];北京郵電大學(xué);2008年

    中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

    1 李連江;個性化搜索引擎模型的研究與改進(jìn)[D];哈爾濱工程大學(xué);2008年

    2 程建;一種網(wǎng)頁搜索引擎原型系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2009年

    3 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年

    4 劉青偉;搜索引擎中的Pagerank排序算法研究分析[D];電子科技大學(xué);2010年

    5 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年

    6 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年

    7 崔頃頃;基于個性化搜索的系統(tǒng)研究與設(shè)計[D];北京交通大學(xué);2011年

    8 徐財應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進(jìn)[D];長春理工大學(xué);2010年

    9 金祖旭;基于用戶反饋的搜索引擎排名算法研究[D];復(fù)旦大學(xué);2010年

    10 劉輝;搜索引擎聯(lián)邦算法設(shè)計與系統(tǒng)實現(xiàn)[D];清華大學(xué);2004年


      本文關(guān)鍵詞:網(wǎng)絡(luò)原創(chuàng)文章優(yōu)先的搜索引擎排序算法研究,,由筆耕文化傳播整理發(fā)布。



    本文編號:142603

    資料下載
    論文發(fā)表

    本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/142603.html


    Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

    版權(quán)申明:資料由用戶79105***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com