天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

Web信息檢索中主題精選算法的研究與改進(jìn)

發(fā)布時間:2018-09-10 14:10
【摘要】:搜索引擎是目前最主要的Web信息檢索工具,然而它的效果還不能令人滿意。基于Web鏈接結(jié)構(gòu)的主題精選算法的鏈接分析迭代往往會收斂于鏈接圖中與查詢主題不太相關(guān)的緊密交織區(qū)域(TKC),從而導(dǎo)致主題偏移。筆者對經(jīng)典主題精選算法HITS的分析表明該算法還有給不同的Web站點規(guī)定了不平等的影響權(quán)重以及不能滿足用戶多粒度的信息需求等缺點。文章在分析主題精選算法研究的基礎(chǔ)上針對其不足提出了改進(jìn)算法g-HITSc,實驗表明該算法是合理和有效的。
[Abstract]:Search engine is the most important Web information retrieval tool, but its effect is not satisfactory. The link analysis iteration of the topic selection algorithm based on Web link structure often converges to the closely interlaced region (TKC), which is not related to the query subject in the link graph which leads to the topic offset. The author's analysis of the classical theme selection algorithm (HITS) shows that the algorithm also provides unequal influence weights for different Web sites and fails to meet the multi-granularity information requirements of users. In this paper, based on the analysis of the topic selection algorithm, an improved algorithm g-HITScis is proposed, which is proved to be reasonable and effective.
【作者單位】: 河海大學(xué)計算機及信息工程學(xué)院 東南大學(xué)計算機科學(xué)與工程系 東南大學(xué)計算機科學(xué)與工程系
【基金】:國家自然科學(xué)基金項目(編號:60173036) 江蘇省“十五”高科技項目(編號:BG2001013)資助
【分類號】:TP393.092

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張彬;蔣濤;徐雨明;;Web Spam技術(shù)研究綜述(英文)[J];衡陽師范學(xué)院學(xué)報;2008年06期

2 何曉陽,吳強,吳治蓉;HITS算法與PageRank算法比較分析[J];情報雜志;2004年02期

3 鄭煜;錢榕;;一個基于鏈接分析的相關(guān)度排序算法及其在專題搜索引擎中應(yīng)用[J];計算機應(yīng)用與軟件;2007年07期

4 蔣衛(wèi)星;金甌;張彬;;Web搜索算法研究綜述[J];計算機技術(shù)與發(fā)展;2007年04期

5 陳學(xué)進(jìn);;網(wǎng)絡(luò)結(jié)構(gòu)挖掘算法研究[J];計算機技術(shù)與發(fā)展;2009年05期

6 許卓明,曹瀟,韓亞洪,董逸生;主題精選算法中Web鄰域圖的構(gòu)造[J];計算機應(yīng)用研究;2004年01期

7 陳定權(quán);Web信息檢索技術(shù)最新進(jìn)展[J];現(xiàn)代圖書情報技術(shù);2002年02期

8 陳太洋;;我國大學(xué)圖書館網(wǎng)站鏈接的實證分析——以中國“211工程”高校為例[J];圖書館雜志;2007年03期

9 周濤;陳向東;;基于鏈接分析的網(wǎng)站評價[J];廣西教育學(xué)院學(xué)報;2008年04期

10 劉彥祖;;Web of Science數(shù)據(jù)庫中網(wǎng)絡(luò)鏈接分析研究論文的定量分析[J];情報探索;2010年02期

相關(guān)會議論文 前10條

1 劉兵;胡學(xué)鋼;;基于多鏈接分析的主題爬蟲設(shè)計實現(xiàn)[A];全國第20屆計算機技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集(上冊)[C];2009年

2 宋丹;林鴻飛;楊志豪;;一種利用鏈接分析的Web話題跟蹤方法[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年

3 鄒綱;孟遙;于浩;西野文人;;一種基于網(wǎng)站主頁信息建立公司名稱知識庫的方法[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

4 劉悅;張剛;王斌;許洪波;;查詢相關(guān)鏈接分析算法優(yōu)化策略研究[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

5 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁排序研究[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年

6 吳煒;梁昆;李瑞軒;辜希武;盧正鼎;;一種基于主題相關(guān)度的網(wǎng)頁排序算法[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2008年

7 馮迪;李晉宏;曹原;;基于網(wǎng)頁的數(shù)據(jù)挖掘研究[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年

8 楊宇航;趙鐵軍;鄭德權(quán);于浩;;基于鏈接分析的重要Blog信息源發(fā)現(xiàn)[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年

9 劉強國;左志宏;董祥千;;基于WEB超鏈接分析算法的研究綜述[A];四川省通信學(xué)會2006年學(xué)術(shù)年會論文集(二)[C];2006年

10 葛先軍;李志勇;宋巍巍;;基于網(wǎng)頁惡意腳本鏈接分析的木馬檢測技術(shù)[A];第五屆中國測試學(xué)術(shù)會議論文集[C];2008年

相關(guān)重要報紙文章 前10條

1 上海證券研究發(fā)展中心 張瑾;嘉實主題精選 股票調(diào)整積極[N];中國證券報;2007年

2 本報記者 馬薪婷;明年一季度布局“先手”:跨年度投資主題[N];證券日報;2010年

3 本報記者  賈寶麗;搭乘國航 嘉實精選“喜從天降”[N];上海證券報;2006年

4 任瞳;嘉實主題精選VS南方穩(wěn)健成長2號[N];中國證券報;2007年

5 旺贏;利用主題投資 分享A股盛宴[N];市場報;2006年

6 劉偉;嘉實主題精選基金獲批發(fā)行[N];深圳商報;2006年

7 王影;嘉實主題精選基金獲批發(fā)行[N];中國經(jīng)濟導(dǎo)報;2006年

8 證券時報記者  徐幸福;市場風(fēng)向漸變 二線基金發(fā)威[N];證券時報;2006年

9 吳汀煌;利用主題投資分享A股“盛宴”[N];廈門日報;2006年

10 吳慧邋謝潞錦;竇玉明卸任嘉實主題精選基金經(jīng)理引猜想[N];第一財經(jīng)日報;2008年

相關(guān)博士學(xué)位論文 前10條

1 毛照f ;面向客戶價值和精/敏戰(zhàn)略的制造供應(yīng)網(wǎng)絡(luò)績效評價研究[D];天津大學(xué);2006年

2 段宇鋒;網(wǎng)絡(luò)鏈接分析與網(wǎng)站評價研究[D];武漢大學(xué);2004年

3 褚武英;三種石首魚緊密連鎖的α-和β-珠蛋白基因的克隆及其順式調(diào)控元件的分析[D];浙江大學(xué);2006年

4 劉洪波;INTERNET中的信息網(wǎng)絡(luò)提取分析及Rank相關(guān)研究[D];清華大學(xué);2007年

5 江開忠;上下文感知的Web搜索關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2008年

6 田俊華;基于本體知識庫的教學(xué)資源自動采集技術(shù)研究[D];南京師范大學(xué);2011年

7 張長利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學(xué);2011年

8 吳剛;RDF圖數(shù)據(jù)管理的關(guān)鍵技術(shù)研究[D];清華大學(xué);2008年

9 徐秀娟;商務(wù)智能中的利潤挖掘研究[D];吉林大學(xué);2008年

10 張乃洲;實體搜索爬蟲和信息抽取研究[D];武漢大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 韓亞洪;結(jié)合內(nèi)容與鏈接分析搜索特定主題的權(quán)威Web信息源[D];河海大學(xué);2003年

2 夏斌;Web結(jié)構(gòu)挖掘中HITS算法的優(yōu)化與實現(xiàn)[D];河南大學(xué);2007年

3 郭坤銀;基于頁面分塊和鏈接分析的Web圖片檢索研究[D];重慶大學(xué);2009年

4 高文梁;改進(jìn)的基于歷史信息分析的網(wǎng)頁排序算法[D];大連理工大學(xué);2009年

5 陳翰生;基于改進(jìn)HITS算法及位置信息的關(guān)鍵網(wǎng)頁信息抽取方法[D];復(fù)旦大學(xué);2009年

6 楊鑫;基于鏈接分析的電信呼叫數(shù)據(jù)研究與應(yīng)用[D];北京郵電大學(xué);2009年

7 朱自強;網(wǎng)絡(luò)信息計量學(xué)理論與方法:大學(xué)網(wǎng)站網(wǎng)絡(luò)流量及頁面鏈接分析研究[D];南京理工大學(xué);2005年

8 付克志;基于Web的文本信息檢索算法的研究[D];大連理工大學(xué);2006年

9 岳增慧;高校圖書館網(wǎng)絡(luò)空間鏈接特征研究[D];曲阜師范大學(xué);2011年

10 沈勇明;復(fù)雜網(wǎng)絡(luò)中的鏈接預(yù)測[D];華南理工大學(xué);2011年

,

本文編號:2234668

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2234668.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5830b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com