基于組合驗證的Web頁面抽取算法研究
本文選題:信息抽取 + 組合驗證 ; 參考:《江西師范大學(xué)學(xué)報(自然科學(xué)版)》2013年02期
【摘要】:通過研究抽取算法的本質(zhì)和抽取算法之間的關(guān)系,對抽取算法的互補性進行分析,提出了一種多算法組合驗證機制,該機制能檢測出抽取算法的錯誤,并通過結(jié)合動態(tài)閾值調(diào)整的方法,提高抽取算法的抽取準(zhǔn)確率.
[Abstract]:By studying the nature of the extraction algorithm and the relationship between the extraction algorithm and the complementarity of the extraction algorithm, a multi-algorithm combination verification mechanism is proposed, which can detect the errors of the extraction algorithm. The extraction accuracy of the extraction algorithm is improved by combining the dynamic threshold adjustment method.
【作者單位】: 北京大學(xué)軟件與微電子學(xué)院;中國科學(xué)院計算技術(shù)研究所;
【分類號】:TP393.092
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉云峰;;一種基于標(biāo)簽路徑聚類的文本信息抽取算法[J];計算機應(yīng)用與軟件;2010年11期
2 韓忠明;李文正;莫倩;;有效HTML文本信息抽取方法的研究[J];計算機應(yīng)用研究;2008年12期
3 鄧擘;鄭彥寧;樊孝忠;;信息抽取中實體關(guān)系模式的可信度評估[J];情報理論與實踐;2009年12期
4 王利鑫;耿煥同;孫凱;張茜;;基于自然語言處理的文本泄密自動檢測技術(shù)[J];計算機工程與設(shè)計;2011年08期
5 陸科進,李新穎;基于Ontology的文本信息抽取[J];計算機應(yīng)用研究;2003年07期
6 李向陽;苗壯;肖江;;無結(jié)構(gòu)文本信息抽取綜述[J];軍事通信技術(shù);2004年02期
7 賀令亞;柳佳剛;;基于Web的包裝器技術(shù)的現(xiàn)狀與發(fā)展[J];電腦開發(fā)與應(yīng)用;2007年06期
8 張春明;;Web挖掘技術(shù)研究[J];廊坊師范學(xué)院學(xué)報(自然科學(xué)版);2008年05期
9 張巖;;基于本體的信息抽取技術(shù)研究[J];科技信息(學(xué)術(shù)研究);2008年36期
10 鄒榮;;對垂直搜索技術(shù)的分析[J];福建電腦;2009年02期
相關(guān)會議論文 前10條
1 高建軍;陳小宏;;凸集投影重建方法中的閾值集合模型設(shè)計研究[A];中國地球物理2010——中國地球物理學(xué)會第二十六屆年會、中國地震學(xué)會第十三次學(xué)術(shù)大會論文集[C];2010年
2 安代志;張召輝;孫西戰(zhàn);顏培實;;溫?zé)岘h(huán)境與奶牛體溫調(diào)節(jié)的晝夜差異[A];第十屆全國家畜環(huán)境科學(xué)討論會論文集[C];2006年
3 孔平;嚴(yán)廣樂;;基于分形維數(shù)的二值化算法在車牌識別中的應(yīng)用[A];第十一屆全國非線性振動學(xué)術(shù)會議暨第八屆全國非線性動力學(xué)和運動穩(wěn)定性學(xué)術(shù)會議論文集[C];2007年
4 李華;程偉;;一種改進的小波模極大值檢測與消噪算法[A];2009中國控制與決策會議論文集(3)[C];2009年
5 宋宇;張元平;周海軍;;基于小波變換的圖像去噪中兩個關(guān)鍵問題研究[A];中國電子學(xué)會第十六屆信息論學(xué)術(shù)年會論文集[C];2009年
6 錢奇;王琰;楊鋼鋒;張勤遠(yuǎn);姜中宏;;碲酸鹽玻璃飛秒激光刻寫特性研究[A];中國硅酸鹽學(xué)會特種玻璃分會第三屆全國特種玻璃會議論文集[C];2007年
7 徐海衛(wèi);牛朝;周倩;;基于遺傳算法的最大類間方差圖像分割及實現(xiàn)[A];'2008系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會議論文集[C];2008年
8 雷超陽;劉軍華;楊愛蓮;;一種利用人眼視覺特性的加權(quán)中值濾波算法[A];全國第19屆計算機技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集(上冊)[C];2008年
9 馮志威;;一種基于平均隊列改進的RED網(wǎng)絡(luò)擁塞算法[A];2008全國第十三屆自動化應(yīng)用技術(shù)學(xué)術(shù)交流會論文集[C];2008年
10 鄭康;;時變OFDM系統(tǒng)中參數(shù)化時域信道估計的改進[A];第十三屆全國信號處理學(xué)術(shù)年會(CCSP-2007)論文集[C];2007年
相關(guān)重要報紙文章 前10條
1 史小敏;前景廣闊的信息抽取技術(shù)[N];解放軍報;2004年
2 趙 糧、吳麗輝;設(shè)定閾值打補丁[N];中國計算機報;2004年
3 小正;僅憑T值閾值不足以評估骨折危險[N];保健時報;2005年
4 彭芳;搜索也專業(yè)[N];中國計算機報;2004年
5 黃帝榮;為什么“第一”的事情反被忽視[N];人民日報;2009年
6 ;直腸內(nèi)溫度變化影響腸易激綜合征患者內(nèi)臟感覺閾值[N];中國醫(yī)藥報;2003年
7 本報記者 王翌;8848:優(yōu)化EC流程[N];計算機世界;2004年
8 孫業(yè)要;唾液能查酒后駕車[N];中國質(zhì)量報;2007年
9 周秋根;幾種血壓概念在臨床的應(yīng)用[N];中國中醫(yī)藥報;2004年
10 中國經(jīng)濟體制改革研究會首席法律顧問、中央國家機關(guān)政府采購中心顧問、北京市遼海律師事務(wù)所高級律師 谷遼海;GPA瞅準(zhǔn)“大蛋糕”(下)[N];中國財經(jīng)報;2007年
相關(guān)博士學(xué)位論文 前10條
1 唐小鋒;閾值光電子—光離子符合速度成像及其應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2011年
2 劉亞清;開放式環(huán)境中的本體演化及其在信息抽取的應(yīng)用研究[D];大連海事大學(xué);2011年
3 劉娜;文本自動摘要和信息抽取方法及其應(yīng)用研究[D];大連海事大學(xué);2012年
4 李傳席;基于本體的自適應(yīng)Web信息抽取方法研究[D];中國科學(xué)技術(shù)大學(xué);2012年
5 陳月玲;同步檢測神經(jīng)元在閾下含噪信號檢測中的作用[D];蘭州大學(xué);2013年
6 李財蓮;圖像多尺度幾何分析及去噪算法研究[D];國防科學(xué)技術(shù)大學(xué);2011年
7 楊潔;模糊神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)收斂性與閾值可去性[D];大連理工大學(xué);2006年
8 張奇;信息抽取中實體關(guān)系識別研究[D];中國科學(xué)技術(shù)大學(xué);2010年
9 胡國平;基于超大規(guī)模問答對庫和語音界面的非受限領(lǐng)域自動問答系統(tǒng)研究[D];中國科學(xué)技術(shù)大學(xué);2007年
10 王莉萍;多維復(fù)合極值分布理論及其工程應(yīng)用[D];中國海洋大學(xué);2005年
相關(guān)碩士學(xué)位論文 前10條
1 金璐鈺;基于框架的事件抽取關(guān)鍵技術(shù)研究[D];蘇州大學(xué);2010年
2 楊柱;基于DIV標(biāo)簽樹的網(wǎng)頁主題信息抽取方法[D];湖南大學(xué);2010年
3 田紅;表格信息抽取引擎的設(shè)計與實現(xiàn)[D];西北師范大學(xué);2004年
4 楊文柱;基于領(lǐng)域知識和信息抽取的個性化Web查詢系統(tǒng)[D];河北大學(xué);2002年
5 張志強;Web信息抽取技術(shù)研究與基于Web service的實現(xiàn)[D];河北大學(xué);2004年
6 陳蘭;基于ontology的信息抽取系統(tǒng)的研究與實現(xiàn)[D];電子科技大學(xué);2004年
7 孟令謙;基于ontology的中文信息抽取系統(tǒng)的研究與實現(xiàn)[D];電子科技大學(xué);2004年
8 王花;Web信息抽取技術(shù)研究[D];西北農(nóng)林科技大學(xué);2010年
9 楊秀麗;基于網(wǎng)頁內(nèi)容分析的Web信息抽取技術(shù)及其應(yīng)用[D];河北科技大學(xué);2010年
10 廉成洋;基于樹結(jié)構(gòu)的Web信息抽取技術(shù)研究[D];南京航空航天大學(xué);2010年
,本文編號:1924415
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1924415.html