天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于詞嵌入模型的內(nèi)容關(guān)聯(lián)方法設(shè)計(jì)與應(yīng)用

發(fā)布時(shí)間:2018-11-15 13:38
【摘要】:現(xiàn)實(shí)生活中,文本內(nèi)容之間的關(guān)聯(lián)十分常見。它既可以是論文文獻(xiàn)系統(tǒng)中,篇章之間的引用;也可以是在線論壇里,讀者評(píng)論與原始文章的對(duì)應(yīng)。這些關(guān)聯(lián)為用戶提供了一個(gè)很好的聯(lián)系通道,并且增加了人們對(duì)文本內(nèi)容理解的客觀性與全面性。還可以為接下來的工作比如信息檢索、摘要和內(nèi)容管理提供有力的幫助。然而,日益增長(zhǎng)的語(yǔ)料數(shù)據(jù)規(guī)模決定了這項(xiàng)任務(wù)無法僅僅依靠于人工。因此,探索一種自動(dòng)化的內(nèi)容關(guān)聯(lián)任務(wù)實(shí)現(xiàn)方法存在必要性。目前為止,內(nèi)容關(guān)聯(lián)的大部分實(shí)現(xiàn)方法都是基于傳統(tǒng)語(yǔ)法或語(yǔ)義特征的相似度計(jì)算,產(chǎn)生的主要問題來自于文本及單詞的表面淺層特征的缺陷。而近些年來,詞嵌入模型在自然語(yǔ)言處理任務(wù)中特別在挖掘深層語(yǔ)義方面呈現(xiàn)出優(yōu)異的表現(xiàn)。在本論文中,我們提出一種引入詞嵌入模型作為特征的內(nèi)容關(guān)聯(lián)方法。先對(duì)模型結(jié)構(gòu)原理進(jìn)行深入學(xué)習(xí),然后詳細(xì)評(píng)估了不同參數(shù)下的訓(xùn)練出的詞向量結(jié)果,最后對(duì)英文生物領(lǐng)域論文文獻(xiàn)和中英文在線論壇(天涯雜談、英國(guó)衛(wèi)報(bào))數(shù)據(jù)三種語(yǔ)料進(jìn)行了實(shí)驗(yàn),并與傳統(tǒng)方法進(jìn)行比較,證實(shí)了我們提出方法的有效性。
[Abstract]:In real life, the correlation between text content is very common. It can be either a reference between chapters in a paper document system or an online forum where the reader comments correspond to the original article. These associations provide users with a good communication channel and enhance the objectivity and comprehensiveness of text content understanding. It can also provide effective assistance for subsequent tasks such as information retrieval, summary and content management. However, the growing size of corpus data makes this task impossible to rely on human resources alone. Therefore, it is necessary to explore an automatic implementation method of content association task. Up to now, most of the implementation methods of content association are based on the similarity calculation of traditional grammar or semantic features, and the main problem arises from the defects of surface shallow features of text and words. In recent years, word embedding model has shown excellent performance in the task of natural language processing, especially in mining deep semantics. In this paper, we propose a content association method which uses word embedding model as a feature. First, we study the structure of the model in depth, then we evaluate the results of the trained word vector under different parameters in detail. Finally, we discuss the literature in English biology field and the online forum in Chinese and English. The three kinds of data are tested and compared with the traditional method, which proves the validity of the proposed method.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊壽勛;《統(tǒng)計(jì)自然語(yǔ)言處理基礎(chǔ)》評(píng)介[J];外語(yǔ)教學(xué)與研究;2001年04期

2 ;《統(tǒng)計(jì)自然語(yǔ)言處理基礎(chǔ)》[J];中文信息學(xué)報(bào);2005年03期

3 徐繼偉;;自然語(yǔ)言處理技術(shù)在生物信息學(xué)中的應(yīng)用(英文)[J];生物信息學(xué);2006年01期

4 王挺;麥范金;劉忠;;自然語(yǔ)言處理及其應(yīng)用前景的研究[J];桂林航天工業(yè)高等?茖W(xué)校學(xué)報(bào);2006年04期

5 ;第二屆全國(guó)少數(shù)民族青年自然語(yǔ)言處理學(xué)術(shù)研討會(huì)召開[J];模式識(shí)別與人工智能;2008年05期

6 高精揓;蕭國(guó)政;姬東鴻;;手持嵌入式系統(tǒng)應(yīng)用中的自然語(yǔ)言處理關(guān)鍵技術(shù)[J];長(zhǎng)江學(xué)術(shù);2009年02期

7 馮志偉;;自然語(yǔ)言處理中的一些宏觀問題之我見[J];中國(guó)外語(yǔ);2009年05期

8 曹佩;;論自然語(yǔ)言處理[J];信息與電腦(理論版);2010年05期

9 邵澤國(guó);;語(yǔ)言科學(xué)發(fā)展的新分支——自然語(yǔ)言處理[J];電子科技;2013年05期

10 李霞;;面向本科階段開設(shè)的“自然語(yǔ)言處理”課程教學(xué)研究[J];福建電腦;2013年07期

相關(guān)會(huì)議論文 前10條

1 馬穎華;蘇貴洋;;基于概念的自然語(yǔ)言處理[A];第一屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2002年

2 李生;;哈工大自然語(yǔ)言處理研究進(jìn)展[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

3 ;哈爾濱工業(yè)大學(xué)智能技術(shù)與自然語(yǔ)言處理研究室簡(jiǎn)介[A];中國(guó)中文信息學(xué)會(huì)第六次全國(guó)會(huì)員代表大會(huì)暨成立二十五周年學(xué)術(shù)會(huì)議中文信息處理重大成果匯報(bào)展資料匯編[C];2006年

4 馮志偉;;自然語(yǔ)言處理中的理性主義和經(jīng)驗(yàn)主義[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

5 宋柔;;自然語(yǔ)言處理中語(yǔ)言知識(shí)的基礎(chǔ)性地位[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

6 李文;程華良;彭耀;溫明杰;肖威清;張陳斌;陳宗海;;自然語(yǔ)言處理云平臺(tái)[A];系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)論文集(第15卷)[C];2014年

7 徐超;畢玉德;;面向自然語(yǔ)言處理的韓國(guó)語(yǔ)隱喻知識(shí)庫(kù)構(gòu)建研究[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

8 周國(guó)棟;孔芳;朱巧明;;指代消解:國(guó)內(nèi)外研究現(xiàn)狀及趨勢(shì)[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

9 ;SWCL-2006組織機(jī)構(gòu)[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年

10 張sソ,

本文編號(hào):2333457


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2333457.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3c803***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com