天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的Web信息抽取研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-04-03 22:41

  本文選題:信息抽取 切入點(diǎn):深度學(xué)習(xí) 出處:《浙江大學(xué)》2017年碩士論文


【摘要】:近年來(lái),海量的信息數(shù)據(jù)隨互聯(lián)網(wǎng)時(shí)代的飛速發(fā)展不斷注入到Web當(dāng)中,因此從Web中精確地獲取所需信息的重要性也日益凸顯。但由于Web頁(yè)面中信息種類(lèi)的繁多、結(jié)構(gòu)格式之間的差異等原因,使得傳統(tǒng)利用手工編寫(xiě)規(guī)則進(jìn)行信息抽取的方法過(guò)分依賴(lài)于具有專(zhuān)業(yè)領(lǐng)域知識(shí)的人的勞動(dòng)并且通常具有較差的可移植性。循環(huán)神經(jīng)網(wǎng)絡(luò)在文本語(yǔ)義理解以及處理序列化數(shù)據(jù)中的優(yōu)勢(shì)使其十分適用于對(duì)Web頁(yè)面進(jìn)行信息抽取,有鑒于此,本文構(gòu)建了一種基于雙層循環(huán)神經(jīng)網(wǎng)絡(luò)的模型用于Web頁(yè)面信息的抽取,其中第一層循環(huán)神經(jīng)網(wǎng)絡(luò)用于理解Web頁(yè)面中每個(gè)文本節(jié)點(diǎn)中字詞序列的語(yǔ)義,而第二層網(wǎng)絡(luò)用于理解頁(yè)面中多個(gè)文本節(jié)點(diǎn)相互間的序列化描述關(guān)系。在模型成功建立之后,本文使用TensorFlow深度學(xué)習(xí)編程系統(tǒng)對(duì)模型進(jìn)行了實(shí)現(xiàn),并在實(shí)驗(yàn)中對(duì)模型中各個(gè)主要參數(shù)逐一進(jìn)行調(diào)整對(duì)比,在優(yōu)化了模型的同時(shí)也得到了不同參數(shù)對(duì)于模型整體識(shí)別準(zhǔn)確率的影響,并給出一般性的結(jié)論。本文構(gòu)建的信息抽取模型經(jīng)實(shí)驗(yàn)分析及優(yōu)化后,對(duì)于同網(wǎng)站的Web頁(yè)面識(shí)別準(zhǔn)確率可達(dá)到900%以上。在此基礎(chǔ)上,本文又對(duì)模型做了改進(jìn),使其可以對(duì)跨網(wǎng)站同類(lèi)Web頁(yè)面進(jìn)行信息抽取,且信息抽取的準(zhǔn)確率同樣可以達(dá)到較為理想的水平,為提升Web信息抽取的效率及移植性提供了一種新的方法。
[Abstract]:In recent years, with the rapid development of the Internet era, massive information data has been continuously injected into the Web, so the importance of accurately obtaining the required information from the Web has become increasingly prominent.However, due to the variety of information in Web pages and the differences in structure and format,The traditional method of information extraction by manual writing rules is too dependent on the labor of people with professional domain knowledge and usually has poor portability.The advantage of circular neural network in semantic understanding of text and processing serialized data makes it very suitable for information extraction from Web pages.In this paper, a model based on double-layer cyclic neural network is constructed for extracting the information of Web pages. The first layer of cyclic neural networks is used to understand the semantics of word sequences in each text node in a Web page.The second layer network is used to understand the serialization relationship between multiple text nodes in the page.After the successful establishment of the model, this paper uses the TensorFlow depth learning programming system to implement the model, and adjusts and compares the main parameters of the model one by one in the experiment.At the same time, the influence of different parameters on the recognition accuracy of the model is obtained, and a general conclusion is given.After the experimental analysis and optimization of the information extraction model constructed in this paper, the recognition accuracy of Web pages of the same website can reach more than 900%.On this basis, the model is improved so that it can extract information from similar Web pages, and the accuracy of information extraction can reach an ideal level.It provides a new method to improve the efficiency and portability of Web information extraction.
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP181;TP393.09

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊曉帥 ,付玫;神經(jīng)網(wǎng)絡(luò)技術(shù)讓管理更輕松[J];軟件世界;2000年11期

2 云中客;新的神經(jīng)網(wǎng)絡(luò)來(lái)自于仿生學(xué)[J];物理;2001年10期

3 唐春明,高協(xié)平;進(jìn)化神經(jīng)網(wǎng)絡(luò)的研究進(jìn)展[J];系統(tǒng)工程與電子技術(shù);2001年10期

4 李智;一種基于神經(jīng)網(wǎng)絡(luò)的煤炭調(diào)運(yùn)優(yōu)化方法[J];長(zhǎng)沙鐵道學(xué)院學(xué)報(bào);2003年02期

5 程科,王士同,楊靜宇;新型模糊形態(tài)神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年21期

6 王凡,孟立凡;關(guān)于使用神經(jīng)網(wǎng)絡(luò)推定操作者疲勞的研究[J];人類(lèi)工效學(xué);2004年03期

7 周麗暉;從統(tǒng)計(jì)角度看神經(jīng)網(wǎng)絡(luò)[J];統(tǒng)計(jì)教育;2005年06期

8 趙奇 ,劉開(kāi)第 ,龐彥軍;灰色補(bǔ)償神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];微計(jì)算機(jī)信息;2005年14期

9 袁婷;;神經(jīng)網(wǎng)絡(luò)在股票市場(chǎng)預(yù)測(cè)中的應(yīng)用[J];軟件導(dǎo)刊;2006年05期

10 尚晉;楊有;;從神經(jīng)網(wǎng)絡(luò)的過(guò)去談科學(xué)發(fā)展觀[J];重慶三峽學(xué)院學(xué)報(bào);2006年03期

相關(guān)會(huì)議論文 前10條

1 徐春玉;;基于泛集的神經(jīng)網(wǎng)絡(luò)的混沌性[A];1996中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];1996年

2 周樹(shù)德;王巖;孫增圻;孫富春;;量子神經(jīng)網(wǎng)絡(luò)[A];2003年中國(guó)智能自動(dòng)化會(huì)議論文集(上冊(cè))[C];2003年

3 羅山;張琳;范文新;;基于神經(jīng)網(wǎng)絡(luò)和簡(jiǎn)單規(guī)劃的識(shí)別融合算法[A];2009系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2009年

4 郭愛(ài)克;馬盡文;丁康;;序言(二)[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年

5 鐘義信;;知識(shí)論:神經(jīng)網(wǎng)絡(luò)的新機(jī)遇——紀(jì)念中國(guó)神經(jīng)網(wǎng)絡(luò)10周年[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年

6 許進(jìn);保錚;;神經(jīng)網(wǎng)絡(luò)與圖論[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年

7 金龍;朱詩(shī)武;趙成志;陳寧;;數(shù)值預(yù)報(bào)產(chǎn)品的神經(jīng)網(wǎng)絡(luò)釋用預(yù)報(bào)應(yīng)用[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年

8 田金亭;;神經(jīng)網(wǎng)絡(luò)在中學(xué)生創(chuàng)造力評(píng)估中的應(yīng)用[A];第十二屆全國(guó)心理學(xué)學(xué)術(shù)大會(huì)論文摘要集[C];2009年

9 唐墨;王科俊;;自發(fā)展神經(jīng)網(wǎng)絡(luò)的混沌特性研究[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第七分冊(cè))[南京理工大學(xué)學(xué)報(bào)(增刊)][C];2009年

10 張廣遠(yuǎn);萬(wàn)強(qiáng);曹海源;田方濤;;基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的故障診斷方法研究[A];第十二屆全國(guó)設(shè)備故障診斷學(xué)術(shù)會(huì)議論文集[C];2010年

相關(guān)重要報(bào)紙文章 前10條

1 美國(guó)明尼蘇達(dá)大學(xué)社會(huì)學(xué)博士 密西西比州立大學(xué)國(guó)家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護(hù)好創(chuàng)新的“神經(jīng)網(wǎng)絡(luò)硬件”[N];中國(guó)教師報(bào);2014年

2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計(jì)算機(jī)世界;2001年

3 葛一鳴 路邊文;人工神經(jīng)網(wǎng)絡(luò)將大顯身手[N];中國(guó)紡織報(bào);2003年

4 中國(guó)科技大學(xué)計(jì)算機(jī)系 邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類(lèi)大腦[N];計(jì)算機(jī)世界;2003年

5 記者 孫剛;“神經(jīng)網(wǎng)絡(luò)”:打開(kāi)復(fù)雜工藝“黑箱”[N];解放日?qǐng)?bào);2007年

6 本報(bào)記者 劉霞;美用DNA制造出首個(gè)人造神經(jīng)網(wǎng)絡(luò)[N];科技日?qǐng)?bào);2011年

7 健康時(shí)報(bào)特約記者  張獻(xiàn)懷;干細(xì)胞移植:修復(fù)受損的神經(jīng)網(wǎng)絡(luò)[N];健康時(shí)報(bào);2006年

8 劉力;我半導(dǎo)體神經(jīng)網(wǎng)絡(luò)技術(shù)及應(yīng)用研究達(dá)國(guó)際先進(jìn)水平[N];中國(guó)電子報(bào);2001年

9 ;神經(jīng)網(wǎng)絡(luò)和模糊邏輯[N];世界金屬導(dǎo)報(bào);2002年

10 鄒麗梅 陳耀群;江蘇科大神經(jīng)網(wǎng)絡(luò)應(yīng)用研究通過(guò)鑒定[N];中國(guó)船舶報(bào);2006年

相關(guān)博士學(xué)位論文 前10條

1 楊旭華;神經(jīng)網(wǎng)絡(luò)及其在控制中的應(yīng)用研究[D];浙江大學(xué);2004年

2 李素芳;基于神經(jīng)網(wǎng)絡(luò)的無(wú)線通信算法研究[D];山東大學(xué);2015年

3 石艷超;憶阻神經(jīng)網(wǎng)絡(luò)的混沌性及幾類(lèi)時(shí)滯神經(jīng)網(wǎng)絡(luò)的同步研究[D];電子科技大學(xué);2014年

4 王新迎;基于隨機(jī)映射神經(jīng)網(wǎng)絡(luò)的多元時(shí)間序列預(yù)測(cè)方法研究[D];大連理工大學(xué);2015年

5 付愛(ài)民;極速學(xué)習(xí)機(jī)的訓(xùn)練殘差、穩(wěn)定性及泛化能力研究[D];中國(guó)農(nóng)業(yè)大學(xué);2015年

6 李輝;基于粒計(jì)算的神經(jīng)網(wǎng)絡(luò)及集成方法研究[D];中國(guó)礦業(yè)大學(xué);2015年

7 王衛(wèi)蘋(píng);復(fù)雜網(wǎng)絡(luò)幾類(lèi)同步控制策略研究及穩(wěn)定性分析[D];北京郵電大學(xué);2015年

8 張海軍;基于云計(jì)算的神經(jīng)網(wǎng)絡(luò)并行實(shí)現(xiàn)及其學(xué)習(xí)方法研究[D];華南理工大學(xué);2015年

9 李艷晴;風(fēng)速時(shí)間序列預(yù)測(cè)算法研究[D];北京科技大學(xué);2016年

10 陳輝;多維超精密定位系統(tǒng)建模與控制關(guān)鍵技術(shù)研究[D];東南大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 章穎;混合不確定性模塊化神經(jīng)網(wǎng)絡(luò)與高校效益預(yù)測(cè)的研究[D];華南理工大學(xué);2015年

2 賈文靜;基于改進(jìn)型神經(jīng)網(wǎng)絡(luò)的風(fēng)力發(fā)電系統(tǒng)預(yù)測(cè)及控制研究[D];燕山大學(xué);2015年

3 李慧芳;基于憶阻器的渦卷混沌系統(tǒng)及其電路仿真[D];西南大學(xué);2015年

4 陳彥至;神經(jīng)網(wǎng)絡(luò)降維算法研究與應(yīng)用[D];華南理工大學(xué);2015年

5 董哲康;基于憶阻器的組合電路及神經(jīng)網(wǎng)絡(luò)研究[D];西南大學(xué);2015年

6 武創(chuàng)舉;基于神經(jīng)網(wǎng)絡(luò)的遙感圖像分類(lèi)研究[D];昆明理工大學(xué);2015年

7 李志杰;基于神經(jīng)網(wǎng)絡(luò)的上證指數(shù)預(yù)測(cè)研究[D];華南理工大學(xué);2015年

8 陳少吉;基于神經(jīng)網(wǎng)絡(luò)血壓預(yù)測(cè)研究與系統(tǒng)實(shí)現(xiàn)[D];華南理工大學(xué);2015年

9 張韜;幾類(lèi)時(shí)滯神經(jīng)網(wǎng)絡(luò)穩(wěn)定性分析[D];渤海大學(xué);2015年

10 邵雪瑩;幾類(lèi)時(shí)滯不確定神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性分析[D];渤海大學(xué);2015年

,

本文編號(hào):1707230

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1707230.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)03128***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美精品二区中文乱码字幕高清 | 亚洲日本中文字幕视频在线观看| 国产一区二区三区口爆在线| 男女激情视频在线免费观看| 日本人妻精品有码字幕| 久久永久免费一区二区| 国产在线一区二区免费| 国产欧美日韩视频91| 国内精品伊人久久久av高清| 污污黄黄的成年亚洲毛片| 日韩中文字幕有码午夜美女| 少妇高潮呻吟浪语91| 人妻少妇系列中文字幕| 深夜福利亚洲高清性感| 久久国产人妻一区二区免费| 男女一进一出午夜视频| 久久久精品日韩欧美丰满 | 亚洲av熟女一区二区三区蜜桃 | 国产日韩久久精品一区| 中国美女草逼一级黄片视频| 欧美一区二区三区视频区| 日韩欧美三级视频在线| 激情少妇一区二区三区| 九九九热在线免费视频| 亚洲天堂精品在线视频| 99久久国产精品成人观看| 一区二区日韩欧美精品| 久久国内午夜福利直播| 夜色福利久久精品福利| 精品欧美日韩一二三区| 老司机精品一区二区三区| 亚洲精品中文字幕无限乱码| 成年午夜在线免费视频| 成人欧美精品一区二区三区| 国产精欧美一区二区三区久久| 国产欧美日韩精品一区二区| 国产精品国产亚洲区久久| 两性色午夜天堂免费视频| 激情丁香激情五月婷婷| 91精品欧美综合在ⅹ| 自拍偷女厕所拍偷区亚洲综合|