天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于決策樹和鏈接相似的Deep Web查詢接口判定

發(fā)布時間:2018-11-27 07:43
【摘要】:針對現(xiàn)有Deep Web查詢接口判定方法誤判較多、無法有效區(qū)分搜索引擎類接口的不足,提出了基于決策樹和鏈接相似的Deep Web查詢接口判定方法。該方法利用信息增益率選取重要屬性,并構(gòu)建決策樹對接口表單進行預(yù)判定,識別特征較為明顯的接口;然后利用基于鏈接相似的判定方法對未識別出的接口進行二次判定,準確識別真正查詢接口,排除搜索引擎類接口。結(jié)果表明,該方法能有效區(qū)分搜索引擎類接口,提高了分類的準確率和查全率。
[Abstract]:In view of the shortcomings of the existing Deep Web query interface judgment methods which can not effectively distinguish the search engine interface, a Deep Web query interface decision method based on decision tree and link similarity is proposed. The method uses the information gain rate to select the important attributes, and constructs a decision tree to pre-judge the interface form to identify the interface with obvious features. Then we use the method based on link similarity to determine the unrecognized interface accurately identify the real query interface and exclude the search engine interface. The results show that this method can effectively distinguish search engine interface and improve the accuracy and recall of classification.
【作者單位】: 江蘇大學(xué)計算機科學(xué)與通信工程學(xué)院;
【基金】:江蘇省高校自然科學(xué)重大基金資助項目(08KJA520001) 國家自然科學(xué)基金資助項目(70971067)
【分類號】:TP391.3;TP18

【共引文獻】

相關(guān)碩士學(xué)位論文 前1條

1 吳兵華;基于深度網(wǎng)絡(luò)的信息檢索模型研究[D];武漢理工大學(xué);2008年

【二級參考文獻】

相關(guān)期刊論文 前10條

1 陸玉昌,魯明羽,李凡,周立柱;向量空間法中單詞權(quán)重函數(shù)的分析和構(gòu)造[J];計算機研究與發(fā)展;2002年10期

2 丁建立,陳增強,袁著祉;遺傳算法與螞蟻算法的融合[J];計算機研究與發(fā)展;2003年09期

3 唐煥玲,孫建濤,陸玉昌;文本分類中結(jié)合評估函數(shù)的TEF-WA權(quán)值調(diào)整技術(shù)[J];計算機研究與發(fā)展;2005年01期

4 李榮陸,王建會,陳曉云,陶曉鵬,胡運發(fā);使用最大熵模型進行中文文本分類[J];計算機研究與發(fā)展;2005年01期

5 陳文亮;朱靖波;朱慕華;姚天順;;基于領(lǐng)域詞典的文本特征表示[J];計算機研究與發(fā)展;2005年12期

6 姜遠;周志華;;基于詞頻分類器集成的文本分類方法[J];計算機研究與發(fā)展;2006年10期

7 尚文倩;黃厚寬;劉玉玲;林永民;瞿有利;董紅斌;;文本分類中基于基尼指數(shù)的特征選擇算法研究[J];計算機研究與發(fā)展;2006年10期

8 王煜,王正歐;基于模糊決策樹的文本分類規(guī)則抽取[J];計算機應(yīng)用;2005年07期

9 魯明羽,李凡,龐淑英,陸玉昌,周立柱;基于權(quán)值調(diào)整的文本分類改進方法[J];清華大學(xué)學(xué)報(自然科學(xué)版);2003年04期

10 蘇金樹;張博鋒;徐昕;;基于機器學(xué)習(xí)的文本分類技術(shù)研究進展[J];軟件學(xué)報;2006年09期

相關(guān)博士學(xué)位論文 前1條

1 宋楓溪;自動文本分類若干基本問題研究[D];南京理工大學(xué);2004年

【相似文獻】

相關(guān)期刊論文 前10條

1 李明;李秀蘭;;基于結(jié)果模式的Deep Web數(shù)據(jù)標注方法[J];計算機應(yīng)用;2011年07期

2 楊舟;岳亮;卓林;趙朋朋;崔志明;;一種基于領(lǐng)域本體的Deep Web數(shù)據(jù)自動標注方法[J];蘇州大學(xué)學(xué)報(工科版);2011年04期

3 卓林;楊舟;岳亮;趙朋朋;崔志明;;Deep Web爬蟲的一種增量式更新策略[J];蘇州大學(xué)學(xué)報(工科版);2011年04期

4 邵秀麗;孫杰;侯樂彩;;基于整體模式匹配的深度網(wǎng)集成系統(tǒng)的研究[J];計算機工程與設(shè)計;2011年08期

5 顧晟;袁紅娟;;基于WEB技術(shù)的圖像索引體系的建構(gòu)[J];南京工程學(xué)院學(xué)報(自然科學(xué)版);2011年01期

6 余肖生;司新霞;;基于聚類分析的元搜索引擎模型[J];重慶理工大學(xué)學(xué)報(自然科學(xué));2011年06期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相關(guān)會議論文 前10條

1 陶然;江錦華;吳羽;陳剛;;基于樹合并的Deep Web查詢接口集成[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年

2 梁浩;左萬利;任斐;赫楓齡;;基于啟發(fā)式信息的Deep Web查詢接口屬性抽取[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年

3 王鐸;李文輝;公正;江琦;;深層網(wǎng)查詢接口的自動集成[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年

4 余偉;李石君;洪輝;田建偉;;基于覆蓋關(guān)系的Deep Web數(shù)據(jù)源排名[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年

5 王英;左萬利;王鑫;彭濤;;Deep Web查詢轉(zhuǎn)換研究[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年

6 方巍;胡鵬昱;趙朋朋;崔志明;;基于語義的Deep Web數(shù)據(jù)源自動發(fā)現(xiàn)技術(shù)[A];2007年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2007年

7 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計與實現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年

8 閆中敏;李慶忠;彭朝暉;董永權(quán);丁艷輝;張永新;徐秀星;;DWDIS:面向分析的Deep Web數(shù)據(jù)集成系統(tǒng)[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年

9 趙朋朋;高嶺;崔志明;;基于查詢接口特征的Deep Web數(shù)據(jù)源自動分類[A];2006年全國開放式分布與并行計算學(xué)術(shù)會議論文集(二)[C];2006年

10 李昭原;劉瑞;陳微;;開放—分布—異構(gòu)多數(shù)據(jù)庫互連查詢接口的基本框架[A];數(shù)據(jù)庫研究與進展95——第十三屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1995年

相關(guān)重要報紙文章 前1條

1 上海交通大學(xué)APEX數(shù)據(jù)和知識管理實驗室 王昊奮邋俞勇;語義Web推動下一代搜索[N];計算機世界;2007年

相關(guān)博士學(xué)位論文 前10條

1 王英;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)研究[D];吉林大學(xué);2010年

2 梁浩;Deep Web信息集成架構(gòu)及相關(guān)問題研究[D];吉林大學(xué);2010年

3 吳春明;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)及其在農(nóng)業(yè)領(lǐng)域的應(yīng)用[D];西南大學(xué);2011年

4 田建偉;面向領(lǐng)域的高質(zhì)量Deep Web數(shù)據(jù)集成技術(shù)研究[D];武漢大學(xué);2010年

5 潘鵬;Deep Web查詢中的不確定性問題研究[D];山東大學(xué);2010年

6 董永權(quán);Deep Web數(shù)據(jù)集成關(guān)鍵問題研究[D];山東大學(xué);2010年

7 陳珂銳;基于本體演化的Deep Web數(shù)據(jù)抽取與注釋[D];吉林大學(xué);2011年

8 黃健斌;基于條件概率圖模型的Deep Web數(shù)據(jù)抽取與集成研究[D];西安電子科技大學(xué);2007年

9 趙朋朋;Deep Web信息集成若干關(guān)鍵技術(shù)研究[D];蘇州大學(xué);2008年

10 寇月;Deep Web實體搜索的關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 陳雅冰;基于領(lǐng)域的Deep Web查詢接口抽取[D];華南理工大學(xué);2011年

2 賀迅;Deep Web查詢接口發(fā)現(xiàn)與特征提取技術(shù)研究[D];重慶大學(xué);2012年

3 楊柳;Deep Web查詢接口識別與抽取技術(shù)研究[D];西安電子科技大學(xué);2011年

4 朱會峰;Deep Web查詢接口模式抽取研究[D];吉林大學(xué);2011年

5 龔桂芬;基于查詢接口的Deep Web模式匹配方法研究[D];蘇州大學(xué);2011年

6 羅斐;基于本體的Deep Web數(shù)據(jù)源分類和查詢接口模式抽取[D];南京航空航天大學(xué);2010年

7 杜鑫;Deep Web數(shù)據(jù)源發(fā)現(xiàn)與采樣研究[D];山東大學(xué);2011年

8 高川;Deep Web數(shù)據(jù)源的發(fā)現(xiàn)與聚類研究[D];北京化工大學(xué);2010年

9 劉凱;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)研究[D];長春工業(yè)大學(xué);2012年

10 陳文;Deep Web入口識別和個性化搜索研究與設(shè)計[D];江蘇大學(xué);2010年



本文編號:2359917

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2359917.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c8d8b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com