天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于弱監(jiān)督與表示學(xué)習(xí)的關(guān)系抽取算法研究

發(fā)布時間:2018-09-04 18:56
【摘要】:我們生活在信息時代,但是從中獲取有用和結(jié)構(gòu)化的知識并非易事。近期的研究估計,人類已經(jīng)存儲了超過295艾字節(jié)(295*1018字節(jié))的數(shù)據(jù)。大部分的文本數(shù)據(jù)以非結(jié)構(gòu)化形式存在,如新聞文章、論壇與留言板、電子郵件、社交網(wǎng)絡(luò)狀態(tài)更新,和近十億計的網(wǎng)頁。如何有效的利用人類所產(chǎn)生的數(shù)據(jù),進(jìn)行深度數(shù)據(jù)挖掘與文本理解有重要意義,這些數(shù)據(jù)可以用于強(qiáng)化搜索結(jié)果、知識圖譜補(bǔ)全,自動問答系統(tǒng)等。為了在信息中提煉出知識,本文研究了從海量非結(jié)構(gòu)化文本進(jìn)行關(guān)系抽取的方法,并提出了基于弱監(jiān)督與表示學(xué)習(xí)的實體關(guān)系抽取方法,主要完成了以下幾方面的工作:1.針對弱監(jiān)督學(xué)習(xí)會引入噪聲的問題,本文提出了基于模糊分類的多實例多標(biāo)簽學(xué)習(xí)算法。針對某個特定實體對,將多種關(guān)系和多個樣本整合起來一同學(xué)習(xí),并通過模糊分類的方法聚合句子級特征。相比其他弱監(jiān)督學(xué)習(xí)方法,本文提出的方法能夠提升2%以上的fl值。2.提出了基于詞向量和循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行自動特征抽取的方法。傳統(tǒng)的特征抽取方法依賴人工經(jīng)驗與知識,并且是針對特定問題的設(shè)計,擴(kuò)展性不強(qiáng)。神經(jīng)網(wǎng)絡(luò)能夠自動進(jìn)行特征抽取,分層對原始文本進(jìn)行處理,并且不需要進(jìn)行預(yù)處理。實驗證明利用不同神經(jīng)網(wǎng)絡(luò)產(chǎn)生的特征,都對系統(tǒng)性能有一定提升。3.設(shè)計并實現(xiàn)了基于弱監(jiān)督和神經(jīng)網(wǎng)絡(luò)特征提起的實體關(guān)系抽取平臺。該實驗平臺整合了多項工具,包括文本檢索、文本分析等,能夠利用知識庫對文本進(jìn)行自動標(biāo)注,學(xué)習(xí)關(guān)系抽取模型,最后輸出關(guān)系抽取結(jié)果。在LDC與New York Times數(shù)據(jù)集上,本文提出的方法較傳統(tǒng)方法,均有一定的效果提升。綜上所述,本文提出的方法能夠有效提升實體關(guān)系抽取系統(tǒng)性能,利用弱監(jiān)督擴(kuò)展了學(xué)習(xí)語料,通過表示學(xué)習(xí)增強(qiáng)了系統(tǒng)在不同領(lǐng)域的擴(kuò)展性,同時能夠減少預(yù)處理工作。這些內(nèi)容對于關(guān)系抽取研究有一定的貢獻(xiàn)與參考價值。
[Abstract]:We live in the information age, but it is not easy to gain useful and structured knowledge from it. Recent research has estimated that humans have stored more than 295 exabytes (295,1018 bytes) of data. Most text data exists in unstructured formats, such as news articles, forums and message boards, email, social network status updates, and nearly a billion pages. How to effectively utilize the data produced by human beings, and how to mine the deep data and understand the text is of great significance. These data can be used to strengthen the search results, complement the knowledge map, automatic question and answer system and so on. In order to extract knowledge from information, this paper studies the method of relational extraction from massive unstructured text, and proposes an entity relation extraction method based on weak supervision and representation learning. In this paper, a multi-instance and multi-label learning algorithm based on fuzzy classification is proposed to solve the problem of introducing noise into weakly supervised learning. For a particular entity pair, a variety of relationships and multiple samples are integrated together, and sentence level features are aggregated by fuzzy classification. Compared with other weakly supervised learning methods, the proposed method can increase the fl value by more than 2%. An automatic feature extraction method based on word vector and cyclic neural network is proposed. The traditional feature extraction method relies on artificial experience and knowledge, and is not extensible for specific problems. The neural network can automatically extract features and process the original text in layers without the need of preprocessing. Experiments show that using the characteristics of different neural networks, the system performance has a certain improvement. 3. 3. The entity relation extraction platform based on weak supervision and neural network feature is designed and implemented. The experimental platform integrates many tools, including text retrieval, text analysis and so on. It can use knowledge base to automatically annotate text, learn relational extraction model, and finally output the result of relational extraction. On the data sets of LDC and New York Times, the methods proposed in this paper are more effective than the traditional methods. To sum up, the proposed method can effectively improve the performance of entity relation extraction system, extend the learning corpus by using weak supervision, enhance the extensibility of the system in different fields by representation learning, and reduce the preprocessing work at the same time. These contents have certain contribution and reference value to the research of relation extraction.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊曉帥 ,付玫;神經(jīng)網(wǎng)絡(luò)技術(shù)讓管理更輕松[J];軟件世界;2000年11期

2 云中客;新的神經(jīng)網(wǎng)絡(luò)來自于仿生學(xué)[J];物理;2001年10期

3 唐春明,高協(xié)平;進(jìn)化神經(jīng)網(wǎng)絡(luò)的研究進(jìn)展[J];系統(tǒng)工程與電子技術(shù);2001年10期

4 李智;一種基于神經(jīng)網(wǎng)絡(luò)的煤炭調(diào)運(yùn)優(yōu)化方法[J];長沙鐵道學(xué)院學(xué)報;2003年02期

5 程科,王士同,楊靜宇;新型模糊形態(tài)神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];計算機(jī)工程與應(yīng)用;2004年21期

6 王凡,孟立凡;關(guān)于使用神經(jīng)網(wǎng)絡(luò)推定操作者疲勞的研究[J];人類工效學(xué);2004年03期

7 周麗暉;從統(tǒng)計角度看神經(jīng)網(wǎng)絡(luò)[J];統(tǒng)計教育;2005年06期

8 趙奇 ,劉開第 ,龐彥軍;灰色補(bǔ)償神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];微計算機(jī)信息;2005年14期

9 袁婷;;神經(jīng)網(wǎng)絡(luò)在股票市場預(yù)測中的應(yīng)用[J];軟件導(dǎo)刊;2006年05期

10 尚晉;楊有;;從神經(jīng)網(wǎng)絡(luò)的過去談科學(xué)發(fā)展觀[J];重慶三峽學(xué)院學(xué)報;2006年03期

相關(guān)會議論文 前10條

1 徐春玉;;基于泛集的神經(jīng)網(wǎng)絡(luò)的混沌性[A];1996中國控制與決策學(xué)術(shù)年會論文集[C];1996年

2 周樹德;王巖;孫增圻;孫富春;;量子神經(jīng)網(wǎng)絡(luò)[A];2003年中國智能自動化會議論文集(上冊)[C];2003年

3 羅山;張琳;范文新;;基于神經(jīng)網(wǎng)絡(luò)和簡單規(guī)劃的識別融合算法[A];2009系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會議論文集[C];2009年

4 郭愛克;馬盡文;丁康;;序言(二)[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年

5 鐘義信;;知識論:神經(jīng)網(wǎng)絡(luò)的新機(jī)遇——紀(jì)念中國神經(jīng)網(wǎng)絡(luò)10周年[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年

6 許進(jìn);保錚;;神經(jīng)網(wǎng)絡(luò)與圖論[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年

7 金龍;朱詩武;趙成志;陳寧;;數(shù)值預(yù)報產(chǎn)品的神經(jīng)網(wǎng)絡(luò)釋用預(yù)報應(yīng)用[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會議論文集[C];1999年

8 田金亭;;神經(jīng)網(wǎng)絡(luò)在中學(xué)生創(chuàng)造力評估中的應(yīng)用[A];第十二屆全國心理學(xué)學(xué)術(shù)大會論文摘要集[C];2009年

9 唐墨;王科俊;;自發(fā)展神經(jīng)網(wǎng)絡(luò)的混沌特性研究[A];2009年中國智能自動化會議論文集(第七分冊)[南京理工大學(xué)學(xué)報(增刊)][C];2009年

10 張廣遠(yuǎn);萬強(qiáng);曹海源;田方濤;;基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的故障診斷方法研究[A];第十二屆全國設(shè)備故障診斷學(xué)術(shù)會議論文集[C];2010年

相關(guān)重要報紙文章 前10條

1 美國明尼蘇達(dá)大學(xué)社會學(xué)博士 密西西比州立大學(xué)國家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護(hù)好創(chuàng)新的“神經(jīng)網(wǎng)絡(luò)硬件”[N];中國教師報;2014年

2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計算機(jī)世界;2001年

3 葛一鳴 路邊文;人工神經(jīng)網(wǎng)絡(luò)將大顯身手[N];中國紡織報;2003年

4 中國科技大學(xué)計算機(jī)系 邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類大腦[N];計算機(jī)世界;2003年

5 記者 孫剛;“神經(jīng)網(wǎng)絡(luò)”:打開復(fù)雜工藝“黑箱”[N];解放日報;2007年

6 本報記者 劉霞;美用DNA制造出首個人造神經(jīng)網(wǎng)絡(luò)[N];科技日報;2011年

7 農(nóng)行浙江東陽支行 吳新國 周龍飛;銀行如何創(chuàng)建學(xué)習(xí)型組織[N];上海金融報;2003年

8 健康時報特約記者  張獻(xiàn)懷;干細(xì)胞移植:修復(fù)受損的神經(jīng)網(wǎng)絡(luò)[N];健康時報;2006年

9 西北師范大學(xué) 李瑾瑜;校長:如何引領(lǐng)和促進(jìn)教師學(xué)習(xí)[N];中國教育報;2008年

10 永壽縣店頭中學(xué) 劉俊鋒;大力提倡合作學(xué)習(xí) 全面促進(jìn)有效教學(xué)[N];咸陽日報;2009年

相關(guān)博士學(xué)位論文 前10條

1 楊旭華;神經(jīng)網(wǎng)絡(luò)及其在控制中的應(yīng)用研究[D];浙江大學(xué);2004年

2 李素芳;基于神經(jīng)網(wǎng)絡(luò)的無線通信算法研究[D];山東大學(xué);2015年

3 石艷超;憶阻神經(jīng)網(wǎng)絡(luò)的混沌性及幾類時滯神經(jīng)網(wǎng)絡(luò)的同步研究[D];電子科技大學(xué);2014年

4 王新迎;基于隨機(jī)映射神經(jīng)網(wǎng)絡(luò)的多元時間序列預(yù)測方法研究[D];大連理工大學(xué);2015年

5 付愛民;極速學(xué)習(xí)機(jī)的訓(xùn)練殘差、穩(wěn)定性及泛化能力研究[D];中國農(nóng)業(yè)大學(xué);2015年

6 李輝;基于粒計算的神經(jīng)網(wǎng)絡(luò)及集成方法研究[D];中國礦業(yè)大學(xué);2015年

7 王衛(wèi)蘋;復(fù)雜網(wǎng)絡(luò)幾類同步控制策略研究及穩(wěn)定性分析[D];北京郵電大學(xué);2015年

8 張海軍;基于云計算的神經(jīng)網(wǎng)絡(luò)并行實現(xiàn)及其學(xué)習(xí)方法研究[D];華南理工大學(xué);2015年

9 李艷晴;風(fēng)速時間序列預(yù)測算法研究[D];北京科技大學(xué);2016年

10 陳輝;多維超精密定位系統(tǒng)建模與控制關(guān)鍵技術(shù)研究[D];東南大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 劉玉明;基于弱監(jiān)督與表示學(xué)習(xí)的關(guān)系抽取算法研究[D];北京郵電大學(xué);2016年

2 王征韜;深度神經(jīng)網(wǎng)絡(luò)壓縮與優(yōu)化研究[D];電子科技大學(xué);2017年

3 章穎;混合不確定性模塊化神經(jīng)網(wǎng)絡(luò)與高校效益預(yù)測的研究[D];華南理工大學(xué);2015年

4 賈文靜;基于改進(jìn)型神經(jīng)網(wǎng)絡(luò)的風(fēng)力發(fā)電系統(tǒng)預(yù)測及控制研究[D];燕山大學(xué);2015年

5 李慧芳;基于憶阻器的渦卷混沌系統(tǒng)及其電路仿真[D];西南大學(xué);2015年

6 陳彥至;神經(jīng)網(wǎng)絡(luò)降維算法研究與應(yīng)用[D];華南理工大學(xué);2015年

7 董哲康;基于憶阻器的組合電路及神經(jīng)網(wǎng)絡(luò)研究[D];西南大學(xué);2015年

8 武創(chuàng)舉;基于神經(jīng)網(wǎng)絡(luò)的遙感圖像分類研究[D];昆明理工大學(xué);2015年

9 李志杰;基于神經(jīng)網(wǎng)絡(luò)的上證指數(shù)預(yù)測研究[D];華南理工大學(xué);2015年

10 陳少吉;基于神經(jīng)網(wǎng)絡(luò)血壓預(yù)測研究與系統(tǒng)實現(xiàn)[D];華南理工大學(xué);2015年

,

本文編號:2223056

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2223056.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ae9b9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com