天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向產(chǎn)業(yè)合作的半監(jiān)督關系抽取

發(fā)布時間:2021-04-16 00:34
  在產(chǎn)業(yè)互聯(lián)網(wǎng)蓬勃發(fā)展的今天,對產(chǎn)業(yè)合作場景進行分析,實現(xiàn)全球精準合作,已經(jīng)成為產(chǎn)業(yè)發(fā)展的必然趨勢,這不僅對政府決策人員具有重要參考意義,也為企業(yè)決策者提供了指導意義。產(chǎn)業(yè)合作相關信息廣泛存在于互聯(lián)網(wǎng)的產(chǎn)業(yè)新聞資訊中,利用大數(shù)據(jù)和人工智能技術,從非結(jié)構(gòu)化的新聞資訊中抽取出結(jié)構(gòu)化的產(chǎn)業(yè)合作信息,并進而組織成為知識,具有十分重要的應用價值和現(xiàn)實意義。對于產(chǎn)業(yè)合作這一細分領域,沒有合適的標注數(shù)據(jù)集用來構(gòu)建信息抽取模型,因此數(shù)據(jù)集的構(gòu)建也成為產(chǎn)業(yè)合作信息抽取任務中的難點與關鍵點。本文關注產(chǎn)業(yè)合作場景中產(chǎn)業(yè)合作關系的抽取,設計并實現(xiàn)了針對產(chǎn)業(yè)合作領域的關系抽取框架,能夠從產(chǎn)業(yè)新聞資訊中抽取企業(yè)實體和企業(yè)間的合作關系?蚣苤泻w了從數(shù)據(jù)清洗到抽取結(jié)果整合的完整流程,包含基于模式匹配的規(guī)則抽取和基于機器學習的模型抽取兩條數(shù)據(jù)通路,能夠自動化完成產(chǎn)業(yè)合作領域的關系抽取。此外,本文針對框架中的相關企業(yè)抽取模型和產(chǎn)業(yè)合作關系抽取模型進行了優(yōu)化。針對實體抽取模型,通過詞向量和詞性信息獲得組合特征,并在網(wǎng)絡結(jié)構(gòu)上使用多層CNN+雙向LSTM的方案,能夠結(jié)合局部特征和全局特征,帶來更好的模型效果。針對關系抽取模型... 

【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:86 頁

【學位級別】:碩士

【部分圖文】:

面向產(chǎn)業(yè)合作的半監(jiān)督關系抽取


主動學習、直推式學習、純半監(jiān)督學習[44]

神經(jīng)元,數(shù)學模型,句子


浙江大學碩士學位論文第2章相關技術綜述15不完全、不確切和不準確監(jiān)督分別關注不同的角度,擁有各自不同的特點,但在實際應用中,他們經(jīng)常同時出現(xiàn)。在關系抽取任務中,經(jīng)常使用遠程監(jiān)督的方式構(gòu)建訓練集,方法是使用實體關系對知識庫進行語料對齊,知識庫包含了關系和符合該關系的兩個實體,通過在無標注的文本中反向標注,找到同時含有兩個實體的句子,將這個句子標注為對應的關系,最終將這些句子和標簽作為訓練集訓練模型;谶h程監(jiān)督的關系抽取假設反向標注獲得的所有句子中總有一個是正樣本,也就是說其中存在不表示該關系的句子被打上了錯誤的標簽,相當于不準確監(jiān)督,各種去噪降噪方法也都逐漸應用到這一任務中。2.3神經(jīng)網(wǎng)絡技術人工神經(jīng)網(wǎng)絡(ArtificialNeuralNetwork,ANN),簡稱神經(jīng)網(wǎng)絡,是一種模擬人的神經(jīng)元而構(gòu)建的計算模型,McCulloch[47]等人提出了神經(jīng)元的數(shù)學模型,如圖2-2所示:圖2-2神經(jīng)元數(shù)學模型[47]神經(jīng)元包含多個輸入和一個輸出,每個輸入被賦予不同的權重進行加權求和,再通過一個激活函數(shù)進行非線性變換,產(chǎn)生最終的輸出。單個神經(jīng)元的數(shù)學公式如(2-1)所示:niiixwfy1(2-1)

面向產(chǎn)業(yè)合作的半監(jiān)督關系抽取


TextCNN結(jié)構(gòu)[49]

【參考文獻】:
期刊論文
[1]關系抽取綜述[J]. 謝德鵬,常青.  計算機應用研究. 2020(07)
[2]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou.  National Science Review. 2018(01)
[3]基于句法語義特征的中文實體關系抽取[J]. 郭喜躍,何婷婷,胡小華,陳前軍.  中文信息學報. 2014(06)
[4]基于圖的半監(jiān)督關系抽取[J]. 陳錦秀,姬東鴻.  軟件學報. 2008(11)



本文編號:3140391

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3140391.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶d59b5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com