天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的細(xì)粒度復(fù)述抽取技術(shù)研究

發(fā)布時(shí)間:2020-03-18 08:38
【摘要】:復(fù)述的相關(guān)技術(shù)研究很早就在國內(nèi)外開展了,它是自然語言處理任務(wù)中的一個(gè)重要領(lǐng)域。復(fù)述任務(wù)如果按文本粒度劃分的話,一般可以分為詞匯級(jí),短語級(jí)以及句子級(jí);按具體任務(wù)劃分,可以分為抽取式,判別式以及生成式。本課題基于深度學(xué)習(xí)的細(xì)粒度中文復(fù)述抽取技術(shù)研究,旨在研究細(xì)粒度(詞匯和短語)的中文復(fù)述抽取,希望能夠獲取優(yōu)質(zhì)的復(fù)述資源。復(fù)述任務(wù)在自然語言處理任務(wù)中是偏底層的任務(wù),復(fù)述資源的好壞能直接影響很多上層任務(wù),例如:信息檢索、問答系統(tǒng)、機(jī)器翻譯等都能夠通過復(fù)述資源進(jìn)行數(shù)據(jù)增強(qiáng),進(jìn)而提升任務(wù)效果。考慮到傳統(tǒng)方法在復(fù)述任務(wù)上已經(jīng)日趨瓶頸,而深度學(xué)習(xí)相關(guān)技術(shù)日趨火熱,在很多任務(wù)上都能夠幫助提升效果。本課題基于深度學(xué)習(xí)的細(xì)粒度中文復(fù)述抽取技術(shù)研究嘗試將深度學(xué)習(xí)的方法引入到中文復(fù)述任務(wù)中來,希望能夠獲取到更加優(yōu)質(zhì)的復(fù)述資源。本課題所要研究的內(nèi)容主要包括以下三個(gè)部分:首先是詞匯級(jí)中文復(fù)述抽取技術(shù)研究;然后是中文短語劃分的技術(shù)研究;最后是短語級(jí)中文復(fù)述抽取技術(shù)研究。在詞匯級(jí)中文復(fù)述抽取任務(wù)中,本文提出了基于“樞軸法”的中文候選復(fù)述抽取方式,利用豐富的在線英文詞典,能夠獲取到大量的候選復(fù)述數(shù)據(jù)。與此同時(shí),本文還提出了帶負(fù)采樣機(jī)制的多模型融合的判別方式用于在候選中文詞匯復(fù)述的基礎(chǔ)上進(jìn)行判別過濾。通過對(duì)最終的中文詞匯的復(fù)述資源進(jìn)行隨機(jī)抽取并人工評(píng)價(jià),結(jié)果顯示:本課題中所提出來的中文詞匯復(fù)述抽取方法,都要優(yōu)于目前其他的中文詞匯復(fù)述抽取方法。在中文短語劃分的任務(wù)中,本文提出了2*BiLSTM+BiLSTM+CRF的序列標(biāo)注模型,基于CTB8.0的語料進(jìn)行模型訓(xùn)練和測試。該模型主要用于在中文單語語料上進(jìn)行短語劃分。通過實(shí)驗(yàn)比對(duì),最終證明的本文提出來的模型在中文短語劃分上的效果要優(yōu)于同類模型。在中文短語復(fù)述抽取任務(wù)中,本文運(yùn)用預(yù)先提出的序列標(biāo)注模型進(jìn)行中文短語劃分,通過規(guī)則過濾獲取到大概103萬條優(yōu)質(zhì)的中文短語。在此基礎(chǔ)上進(jìn)行相關(guān)對(duì)比實(shí)驗(yàn),本文提出了基于二元注意力機(jī)制的遞歸自編碼模型,用以學(xué)習(xí)中文短語的向量表示,通過計(jì)算余弦相似度,以語義距離最相近的40個(gè)短語作為候選短語復(fù)述,同時(shí)按照語義相似度,對(duì)短語復(fù)述進(jìn)行排序。最后基于翻譯數(shù)據(jù)和規(guī)則,過濾錯(cuò)誤或者低質(zhì)量的候選短語復(fù)述。實(shí)驗(yàn)對(duì)比得出結(jié)論,本課題中提出來的中文短語復(fù)述抽取方法,要優(yōu)于目前的其他模型。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.1;TP18

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 許旭陽;韓永峰;宋文政;;事件抽取技術(shù)的回顧與展望[J];信息工程大學(xué)學(xué)報(bào);2011年01期

2 張克菊;韓毅;;關(guān)系抽取技術(shù)的發(fā)展與應(yīng)用——以生物信息學(xué)為例[J];情報(bào)科學(xué);2010年01期

3 黃勛;游宏梁;于洋;;關(guān)系抽取技術(shù)研究綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2013年11期

4 劉振;張智雄;;基于語義標(biāo)注的知識(shí)抽取相關(guān)技術(shù)的國外進(jìn)展研究[J];情報(bào)科學(xué);2015年08期

5 章順瑞;駱陳;;基于語義角色分析的事件抽取技術(shù)[J];太赫茲科學(xué)與電子信息學(xué)報(bào);2017年02期

6 高強(qiáng);游宏梁;;事件抽取技術(shù)研究綜述[J];情報(bào)理論與實(shí)踐;2013年04期

7 陳英;;基于專家系統(tǒng)的注塑模具關(guān)鍵技術(shù)研究[J];柳州職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年02期

8 葉圣濤;張洋;;隱喻抽取技術(shù)視閾下的大學(xué)生創(chuàng)業(yè)動(dòng)機(jī)初探[J];中國市場;2017年18期

9 黃葆華;一種基于內(nèi)插和抽取技術(shù)的樣點(diǎn)序列延遲器[J];軍事通信技術(shù);1998年03期

10 唐筱璐;;利用ZMET隱喻抽取技術(shù)探討好看簿對(duì)于教師的價(jià)值[J];中國遠(yuǎn)程教育;2010年08期

相關(guān)會(huì)議論文 前7條

1 趙妍妍;秦兵;車萬翔;劉挺;;中文事件抽取技術(shù)研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

2 王倩;何婷婷;聞彬;宋樂;張茂元;;基于依存關(guān)系的中文情感要素抽取技術(shù)研究[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

3 楊潔;季鐸;蔡?hào)|風(fēng);白宇;;基于聯(lián)合權(quán)重的多文檔關(guān)鍵詞抽取技術(shù)[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年

4 楊潔;季鐸;蔡?hào)|風(fēng);代翠;;基于TextRank的多文檔關(guān)鍵詞抽取技術(shù)[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

5 陸忠良;蘇厚勤;;基于Oracle/Linux環(huán)境數(shù)據(jù)抽取技術(shù)的研究與實(shí)踐[A];第四屆中國軟件工程大會(huì)論文集[C];2007年

6 岳玉波;馬淵明;馬凱;晏偉;黃麗娟;;OBN數(shù)據(jù)共反射點(diǎn)道集抽取技術(shù)[A];中國石油學(xué)會(huì)2019年物探技術(shù)研討會(huì)論文集[C];2019年

7 穆亞東;周秉鋒;;基于信念傳播的圖像抽取算法[A];中國感光學(xué)會(huì)第七次全國會(huì)員代表大會(huì)暨學(xué)術(shù)年會(huì)和第七屆青年學(xué)術(shù)交流會(huì)論文摘要集[C];2006年

相關(guān)碩士學(xué)位論文 前10條

1 顏欣;基于深度學(xué)習(xí)的細(xì)粒度復(fù)述抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2019年

2 陳天琪;面向游戲評(píng)論的評(píng)價(jià)標(biāo)簽抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2019年

3 趙威;面向用戶評(píng)論的觀點(diǎn)目標(biāo)和觀點(diǎn)詞協(xié)同抽取技術(shù)[D];桂林電子科技大學(xué);2019年

4 羅尚q;基于隱喻抽取技術(shù)的目的地風(fēng)景體驗(yàn)價(jià)值研究[D];重慶師范大學(xué);2016年

5 于俊鋒;面向電子郵件的近似世系關(guān)系抽取技術(shù)[D];東北大學(xué);2011年

6 劉培謙;面向海量數(shù)據(jù)的用戶觀點(diǎn)抽取技術(shù)實(shí)現(xiàn)與應(yīng)用[D];中山大學(xué);2015年

7 劉兆慶;博客社區(qū)發(fā)現(xiàn)及其主題抽取技術(shù)的研究[D];蘇州大學(xué);2013年

8 劉克彬;基于核函數(shù)的命名實(shí)體關(guān)系抽取技術(shù)研究[D];上海交通大學(xué);2007年

9 張慧敏;Deep Web查詢結(jié)果抽取技術(shù)研究與實(shí)現(xiàn)[D];暨南大學(xué);2015年

10 吳剛;基于主題的中文事件抽取技術(shù)研究及應(yīng)用[D];蘇州大學(xué);2009年

,

本文編號(hào):2588508

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2588508.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶66466***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
成人精品一区二区三区在线| 欧美激情一区二区亚洲专区| 中日韩美女黄色一级片| 欧美日韩国产精品黄片| 亚洲午夜福利不卡片在线| 亚洲国产另类久久精品| 日韩精品人妻少妇一区二区| 亚洲高清中文字幕一区二区三区 | 亚洲国产成人精品福利| 精品日韩av一区二区三区| 日韩不卡一区二区在线| 91爽人人爽人人插人人爽| 欧美乱码精品一区二区三| 国产精品熟女乱色一区二区| 欧美尤物在线观看西比尔| 操白丝女孩在线观看免费高清| 国产成人亚洲精品青草天美| 国产精品欧美激情在线播放| 国产又粗又猛又长又大| 国产日韩精品激情在线观看| 91欧美日韩精品在线| 国产女性精品一区二区三区| 日本东京热视频一区二区三区| 亚洲精品伦理熟女国产一区二区| 成人午夜视频精品一区| 欧美精品二区中文乱码字幕高清| 国产又大又硬又粗又黄| 亚洲精品成人综合色在线| 久草热视频这里只有精品| 国产精品偷拍一区二区| 日韩三极片在线免费播放| 亚洲中文在线男人的天堂| 在线日韩中文字幕一区| 后入美臀少妇一区二区| 午夜精品一区二区三区国产| 久久福利视频这里有精品| 亚洲a码一区二区三区| 一区二区免费视频中文乱码国产| 高清欧美大片免费在线观看| 精品一区二区三区乱码中文| 日本理论片午夜在线观看|