天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

深層網(wǎng)中基于入口查詢的表單填充策略

發(fā)布時間:2018-05-02 20:02

  本文選題:深層網(wǎng) + 入口查詢。 參考:《計算機工程》2010年07期


【摘要】:針對深層網(wǎng)中數(shù)據(jù)量大導(dǎo)致無法被傳統(tǒng)搜索引擎索引的問題,在提取網(wǎng)頁中,改進啟發(fā)式規(guī)則識別表單查詢?nèi)肟?在表單標簽與內(nèi)容匹配時,改進基于語義的相似度匹配算法進行表單內(nèi)容填充。實驗結(jié)果表明,提取表單標簽的準確率達到94.23%,匹配成功率達到88.83%,填充成功率達到95.43%。
[Abstract]:Aiming at the problem that the large amount of data in the deep web can not be indexed by the traditional search engine, the heuristic rules are improved to identify the entry of the form query in the extraction page, and when the form label and the content match, An improved similarity matching algorithm based on semantics is used to fill the form content. The experimental results show that the accuracy of extracting form labels is 94.23, the matching success rate is 88.83, and the filling success rate is 95.43.
【作者單位】: 南京郵電大學(xué)教務(wù)處;南京師范大學(xué)教育技術(shù)系;
【分類號】:TP391.3

【相似文獻】

相關(guān)期刊論文 前10條

1 袁小龍;李曉霞;郭力;;深層網(wǎng)技術(shù)在專利數(shù)據(jù)提取中的應(yīng)用[J];計算機與應(yīng)用化學(xué);2011年08期

2 ;[J];;年期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相關(guān)碩士學(xué)位論文 前2條

1 李三義;基于模型匹配的Deep Web數(shù)據(jù)庫分類[D];吉林大學(xué);2010年

2 郭若飛;支持Ajax的Deep Web爬蟲技術(shù)研究[D];蘇州大學(xué);2010年

,

本文編號:1835282

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1835282.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶df270***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com