天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)和詞典定義的義原預(yù)測(cè)研究

發(fā)布時(shí)間:2020-04-17 07:32
【摘要】:義原是人類語(yǔ)言中不可再分的最小語(yǔ)義單元,在自然語(yǔ)言處理領(lǐng)域的多種任務(wù)中起到重要作用。知網(wǎng)HowNet是一個(gè)典型的義原知識(shí)庫(kù),是由語(yǔ)言學(xué)家歷時(shí)多年經(jīng)過(guò)手工標(biāo)注構(gòu)建起來(lái)的,已得到廣泛應(yīng)用。隨著社會(huì)發(fā)展,語(yǔ)言中的詞匯和語(yǔ)義不斷發(fā)生變化,靠人工標(biāo)注更新義原知識(shí)庫(kù)的的方法費(fèi)時(shí)費(fèi)力,且存在標(biāo)注一致性的問題。義原的自動(dòng)預(yù)測(cè)成為知識(shí)庫(kù)建設(shè)的一項(xiàng)重要任務(wù),而當(dāng)前的義原預(yù)測(cè)技術(shù)仍然存在很多問題。影響義原預(yù)測(cè)效果的因素包括所使用的模型是否合適,是否引入更多的信息或知識(shí),若引入知識(shí)則能否充分提取特征,由特征到義原的映射過(guò)程是否合理,以及能否解決多義詞和低頻詞等疑難問題。現(xiàn)有研究方法對(duì)上述問題沒能很好的解決。針對(duì)義原自動(dòng)預(yù)測(cè)面臨的挑戰(zhàn),本文提出了兩種基于深度學(xué)習(xí)技術(shù)的利用詞典定義進(jìn)行義原預(yù)測(cè)的解決方案。一是利用基于注意力機(jī)制的編碼器實(shí)現(xiàn)義原預(yù)測(cè),二是提出基于局部語(yǔ)義相關(guān)性的義原預(yù)測(cè)方法,實(shí)驗(yàn)證明本文提出的方法在義原預(yù)測(cè)任務(wù)中能夠取得目前最好的效果。同時(shí),本文還通過(guò)反向詞典這樣一個(gè)義原預(yù)測(cè)的下游任務(wù)來(lái)進(jìn)一步驗(yàn)證所提出的方法的實(shí)用性和有效性。主要工作和貢獻(xiàn)如下:(1)利用基于注意力機(jī)制的編碼器實(shí)現(xiàn)義原預(yù)測(cè),F(xiàn)有的義原預(yù)測(cè)方法大都未結(jié)合豐富的知識(shí)信息,或者對(duì)知識(shí)的利用很不充分。詞典定義是一種標(biāo)準(zhǔn)的語(yǔ)義描述,而現(xiàn)有利用定義進(jìn)行義原預(yù)測(cè)的方法存在很多不足,為了解決定義信息挖掘的充分性問題,本文結(jié)合注意力機(jī)制改進(jìn)了編碼器,并通過(guò)融合多種信息進(jìn)一步優(yōu)化義原預(yù)測(cè)模型,有效提升了義原預(yù)測(cè)效果。(2)基于局部語(yǔ)義相關(guān)性的義原預(yù)測(cè)方法研究。利用編碼器的方法挖掘定義信息,提取的語(yǔ)義特征是一個(gè)有限維度的向量,所包含的信息量十分有限。通過(guò)研究定義中的詞與目標(biāo)詞和義原之間的關(guān)系,發(fā)現(xiàn)具有局部語(yǔ)義相關(guān)的性質(zhì),基于該性質(zhì)提出了一種新的義原預(yù)測(cè)方法。該方法不但有效提升義原預(yù)測(cè)效果,對(duì)于低頻詞和多義詞等預(yù)測(cè)難點(diǎn)也能很好的解決。(3)利用義原預(yù)測(cè)方法實(shí)現(xiàn)并改進(jìn)反向詞典系統(tǒng)。本文提出的兩種義原預(yù)測(cè)方法可有效應(yīng)用于反向詞典任務(wù),并通過(guò)引入義原等知識(shí)進(jìn)一步改善效果。作為首個(gè)漢語(yǔ)界的反向詞典系統(tǒng)也具有一定的社會(huì)意義。通過(guò)實(shí)驗(yàn)證明了本文提出的方法在義原預(yù)測(cè)任務(wù)中具有明顯的提升效果和良好的魯棒性,并通過(guò)反向詞典任務(wù)進(jìn)一步體現(xiàn)了本研究的實(shí)用價(jià)值,同時(shí)也證明了義原知識(shí)的重要作用。開展義原自動(dòng)預(yù)測(cè)研究在人工智能領(lǐng)域具有廣泛的應(yīng)用價(jià)值和較深遠(yuǎn)的現(xiàn)實(shí)意義。
【圖文】:

樹形結(jié)構(gòu),知識(shí)庫(kù),學(xué)習(xí)技術(shù),知網(wǎng)


入越來(lái)越多的語(yǔ)言知識(shí)和世界知識(shí)。因此,深度學(xué)習(xí)技術(shù)的發(fā)知識(shí)庫(kù),而知識(shí)庫(kù)的完善又必將為深度學(xué)習(xí)技術(shù)發(fā)展帶來(lái)更深知識(shí)庫(kù)擴(kuò)展方法的研究具有重要意義。HowNet 中義原知識(shí)的相關(guān)研究董強(qiáng)等人在 1988 年開始研究知識(shí)庫(kù),到 1999 年生成第一版提供了義原注釋,其中每個(gè)詞都被表示為一個(gè)層次化的樹狀義知網(wǎng)是一個(gè)網(wǎng)狀的知識(shí)網(wǎng)絡(luò)體系。義原是語(yǔ)言學(xué)家定義的人類單元。概念的語(yǔ)義含義可以由有限數(shù)量的義原組成。,知網(wǎng)中的一個(gè)詞可能具有多個(gè)義項(xiàng),,分別代表這個(gè)詞在現(xiàn)實(shí)定義為一系列義原的層次結(jié)構(gòu)。以詞語(yǔ)“蘋果”為例,蘋果主,蘋果水果。這兩個(gè)含義分別具有多個(gè)義原來(lái)表示最基本的語(yǔ)具有 5 個(gè)義原,結(jié)構(gòu)如圖 1.1 左側(cè)虛線框內(nèi);“蘋果水果”,只

處理流程圖,詞典,處理流程,上下文


圖 2. 1 詞典定義處理流程詞后的定義數(shù)據(jù),以“詞-定義”對(duì)的形式存儲(chǔ)入只能接受數(shù)值,而字符類型的單詞必須表示值表示方法是獨(dú)熱(one-hot)編碼,在詞匯表他位置 0。但是隨著詞匯量增大,每個(gè)詞的總介紹了典型的表示學(xué)習(xí)方法,本文采用 Word2v表示,即詞向量,也稱詞嵌入。的是 Word2vec 方法中的 Skip-gram 模型[10]訓(xùn)練是在大規(guī)模語(yǔ)料庫(kù)中遍歷全部的詞匯,利用詞的上下文詞的過(guò)程進(jìn)行訓(xùn)練。如圖 2.2,當(dāng)前輸即上下文距離中心詞的最大距離),其上下文。模型訓(xùn)練時(shí)正是利用中心詞與上下文詞之間
【學(xué)位授予單位】:戰(zhàn)略支援部隊(duì)信息工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.1;TP18

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊爾弘,張國(guó)清,張永奎;基于義原同現(xiàn)頻率的漢語(yǔ)詞義排歧方法[J];計(jì)算機(jī)研究與發(fā)展;2001年07期

2 李國(guó)佳;;一種基于義原信息量的詞語(yǔ)相似度計(jì)算方法[J];電腦與信息技術(shù);2015年03期

3 星竹;;收手[J];東西南北;2010年08期

4 高璐;趙小兵;;一種實(shí)例庫(kù)與義原關(guān)系相結(jié)合的概念消歧算法[J];首都師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2016年03期

5 肖志軍;馮廣麗;;基于《知網(wǎng)》義原空間的文本相似度計(jì)算[J];科學(xué)技術(shù)與工程;2013年29期

6 廖劍;冷靜;李艷燕;黃榮懷;;知網(wǎng)的形式概念分析及概念相似度研究[J];計(jì)算機(jī)應(yīng)用研究;2007年11期

7 許云,樊孝忠,張鋒;基于知網(wǎng)的語(yǔ)義相關(guān)度計(jì)算[J];北京理工大學(xué)學(xué)報(bào);2005年05期

8 劉影;陳立;宋自林;董慶超;陳興華;朱衛(wèi)星;何繼賢;;一種改進(jìn)的基于本體概念相似度計(jì)算方法研究[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年06期

9 唐共波;于東;荀恩東;;基于知網(wǎng)義原詞向量表示的無(wú)監(jiān)督詞義消歧方法[J];中文信息學(xué)報(bào);2015年06期

10 黃洪;屠肖龍;;基于角度—相似度轉(zhuǎn)換模型的義原相似度計(jì)算[J];浙江工業(yè)大學(xué)學(xué)報(bào);2017年06期

相關(guān)會(huì)議論文 前10條

1 蘇偉峰;李紹滋;李堂秋;尤文建;;可分義原向量空間中的跨語(yǔ)種文本過(guò)濾模型[A];自然語(yǔ)言理解與機(jī)器翻譯——全國(guó)第六屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2001年

2 張仰森;黃改娟;蘇文杰;;基于隱最大熵原理的漢語(yǔ)詞義消歧方法[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

3 楊爾弘;米麗萍;郝秀蘭;;基于《知網(wǎng)》的詞義排岐方法[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年

4 周強(qiáng);陳祖舜;梅立軍;;情境描述的構(gòu)建方法研究[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

5 仇偉;黃高輝;姚天f ;;基于HowNet的漢語(yǔ)情感問句二層分類[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

6 楊曉峰;李堂秋;洪青陽(yáng);;漢英機(jī)器翻譯系統(tǒng)中的一種詞義排歧方法[A];自然語(yǔ)言理解與機(jī)器翻譯——全國(guó)第六屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2001年

7 趙晨光;蔡?hào)|風(fēng);;利用語(yǔ)義特征生成搭配[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

8 鄭旭玲;李堂秋;楊曉峰;陳毅東;;基于語(yǔ)義規(guī)則的漢語(yǔ)短語(yǔ)結(jié)構(gòu)分析排歧初探[A];自然語(yǔ)言理解與機(jī)器翻譯——全國(guó)第六屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2001年

9 陳立;宋自林;鄭世明;張英;;基于本體的概念相似度計(jì)算研究[A];江蘇省系統(tǒng)工程學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年

10 孫景廣;蔡?hào)|風(fēng);呂德新;董燕舉;;基于知網(wǎng)的中文問題自動(dòng)分類[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年

相關(guān)重要報(bào)紙文章 前5條

1 記者 高智虹 通訊員 董學(xué)文 李秀國(guó);全市首家生態(tài)豬場(chǎng)落戶青龍[N];秦皇島日?qǐng)?bào);2008年

2 本報(bào)記者 趙丹丹 實(shí)習(xí)生 張夢(mèng)雅 胡晶晶;實(shí)施就業(yè)扶持 營(yíng)造創(chuàng)業(yè)環(huán)境[N];蕪湖日?qǐng)?bào);2010年

3 記者 張璇;寧夏:拓寬選拔渠道 加大激勵(lì)保障[N];中國(guó)組織人事報(bào);2014年

4 本報(bào)記者 段裕祥 通訊員 舒軍忠 劉學(xué)永;回家“就業(yè)”天地寬[N];桂林日?qǐng)?bào);2009年

5 羅志田;詞義變遷的山寨[N];南方周末;2011年

相關(guān)博士學(xué)位論文 前2條

1 謝岳山;數(shù)據(jù)挖掘技術(shù)在聯(lián)網(wǎng)審計(jì)中的應(yīng)用研究[D];中南大學(xué);2013年

2 謝松縣;社交媒體中觀點(diǎn)信息分析與應(yīng)用[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 張磊;基于深度學(xué)習(xí)和詞典定義的義原預(yù)測(cè)研究[D];戰(zhàn)略支援部隊(duì)信息工程大學(xué);2019年

2 米昂;結(jié)合影響力分析的微博輿情溯源研究[D];北京交通大學(xué);2015年

3 司圣濤;領(lǐng)域知識(shí)庫(kù)的構(gòu)建方法及其應(yīng)用研究[D];昆明理工大學(xué);2009年

4 徐晨霞;基于知網(wǎng)的多關(guān)鍵字檢索研究[D];重慶大學(xué);2008年

5 張紅云;基于頁(yè)面分析的主題網(wǎng)絡(luò)爬蟲的研究[D];武漢理工大學(xué);2010年

6 王義;基于語(yǔ)義場(chǎng)的文本檢索技術(shù)的研究與實(shí)現(xiàn)[D];安徽工業(yè)大學(xué);2012年

7 徐瑛;一種綜合加權(quán)的詞語(yǔ)語(yǔ)義相似度計(jì)算研究[D];青島理工大學(xué);2011年

8 王瑩瑩;基于敘詞表的中醫(yī)基礎(chǔ)理論知識(shí)庫(kù)的構(gòu)建[D];沈陽(yáng)航空航天大學(xué);2012年

9 王羊羊;基于HowNet的術(shù)語(yǔ)語(yǔ)義知識(shí)庫(kù)構(gòu)建技術(shù)的研究[D];沈陽(yáng)航空航天大學(xué);2016年

10 張科;基于《知網(wǎng)》義原空間的文本相似度計(jì)算研究與實(shí)現(xiàn)[D];重慶大學(xué);2013年



本文編號(hào):2630623

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2630623.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1b119***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com