基于深度學(xué)習(xí)的跨領(lǐng)域跨語言知識獲取
發(fā)布時間:2021-03-29 19:12
隨著互聯(lián)網(wǎng)上信息的生產(chǎn)與積累,如何從大量純文本中獲取高質(zhì)量的結(jié)構(gòu)化知識,是目前自然語言處理的研究熱點(diǎn)。通用領(lǐng)域的知識注重廣度,在搜索引擎的查詢理解、智能問答的推理等領(lǐng)域已經(jīng)有廣泛應(yīng)用。然而,由于長尾效應(yīng)的影響,通用知識在特定領(lǐng)域的覆蓋度往往嚴(yán)重不足,因此近年來學(xué)術(shù)界和工業(yè)界的研究興趣逐漸轉(zhuǎn)向垂直領(lǐng)域。領(lǐng)域知識獲取有諸多挑戰(zhàn),一方面領(lǐng)域知識上下文的稀疏性導(dǎo)致傳統(tǒng)基于模式的抽取方法準(zhǔn)確率較低,另一方面不同領(lǐng)域之間的差異性導(dǎo)致在某個領(lǐng)域?qū)W到的知識無法有效遷移到其他領(lǐng)域上。此外,領(lǐng)域知識的跨語言遷移也是目前的研究熱點(diǎn)。本文利用深度學(xué)習(xí)的技術(shù),針對跨領(lǐng)域和跨語言的知識獲取,做了如下三方面的工作:·單一領(lǐng)域的探索式關(guān)系分類 我們提出了探索式神經(jīng)網(wǎng)絡(luò)關(guān)系分類的模型,用于解決領(lǐng)域知識抽取中長尾關(guān)系無法被完整定義的問題。該模型一方面學(xué)習(xí)在預(yù)定義關(guān)系上的神經(jīng)網(wǎng)絡(luò)分類器,另一方面通過相似度敏感的中餐館過程算法,在未標(biāo)注數(shù)據(jù)中發(fā)現(xiàn)新的關(guān)系種類,持續(xù)擴(kuò)充預(yù)定義的關(guān)系集。該算法在維基百科的領(lǐng)域知識圖譜上有較高的分類準(zhǔn)確率,同時能夠發(fā)現(xiàn)高質(zhì)量的新關(guān)系。·跨領(lǐng)域的知識體系抽取 針對不同領(lǐng)域之間的知識遷移,我們分別提出...
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:100 頁
【學(xué)位級別】:碩士
【部分圖文】:
“支持向量機(jī)”在維基百科中的主頁分信息對于判斷兩者之間的依賴關(guān)系有很的幫助
【參考文獻(xiàn)】:
期刊論文
[1]基于非平行語料的雙語詞典構(gòu)建[J]. 張檬,劉洋,孫茂松. 中國科學(xué):信息科學(xué). 2018(05)
[2]基于詞向量與可比語料庫的雙語詞典提取研究[J]. 柳路芳,李波,陳鵬,周凌寒,王兵. 計(jì)算機(jī)工程與科學(xué). 2018(02)
[3]基于點(diǎn)關(guān)聯(lián)測度矩陣分解的中英跨語言詞嵌入方法[J]. 于東,趙艷,韋林煊,荀恩東. 中文信息學(xué)報(bào). 2017(01)
[4]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[5]遷移學(xué)習(xí)研究進(jìn)展[J]. 莊福振,羅平,何清,史忠植. 軟件學(xué)報(bào). 2015(01)
[6]基于核函數(shù)中文關(guān)系自動抽取系統(tǒng)的實(shí)現(xiàn)[J]. 劉克彬,李芳,劉磊,韓穎. 計(jì)算機(jī)研究與發(fā)展. 2007(08)
[7]中文實(shí)體關(guān)系抽取中的特征選擇研究[J]. 董靜,孫樂,馮元勇,黃瑞紅. 中文信息學(xué)報(bào). 2007(04)
[8]實(shí)體關(guān)系自動抽取[J]. 車萬翔,劉挺,李生. 中文信息學(xué)報(bào). 2005(02)
本文編號:3108045
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:100 頁
【學(xué)位級別】:碩士
【部分圖文】:
“支持向量機(jī)”在維基百科中的主頁分信息對于判斷兩者之間的依賴關(guān)系有很的幫助
【參考文獻(xiàn)】:
期刊論文
[1]基于非平行語料的雙語詞典構(gòu)建[J]. 張檬,劉洋,孫茂松. 中國科學(xué):信息科學(xué). 2018(05)
[2]基于詞向量與可比語料庫的雙語詞典提取研究[J]. 柳路芳,李波,陳鵬,周凌寒,王兵. 計(jì)算機(jī)工程與科學(xué). 2018(02)
[3]基于點(diǎn)關(guān)聯(lián)測度矩陣分解的中英跨語言詞嵌入方法[J]. 于東,趙艷,韋林煊,荀恩東. 中文信息學(xué)報(bào). 2017(01)
[4]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[5]遷移學(xué)習(xí)研究進(jìn)展[J]. 莊福振,羅平,何清,史忠植. 軟件學(xué)報(bào). 2015(01)
[6]基于核函數(shù)中文關(guān)系自動抽取系統(tǒng)的實(shí)現(xiàn)[J]. 劉克彬,李芳,劉磊,韓穎. 計(jì)算機(jī)研究與發(fā)展. 2007(08)
[7]中文實(shí)體關(guān)系抽取中的特征選擇研究[J]. 董靜,孫樂,馮元勇,黃瑞紅. 中文信息學(xué)報(bào). 2007(04)
[8]實(shí)體關(guān)系自動抽取[J]. 車萬翔,劉挺,李生. 中文信息學(xué)報(bào). 2005(02)
本文編號:3108045
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3108045.html
最近更新
教材專著