基于詞嵌入模型的內(nèi)容關(guān)聯(lián)方法設(shè)計(jì)與應(yīng)用
[Abstract]:In real life, the correlation between text content is very common. It can be either a reference between chapters in a paper document system or an online forum where the reader comments correspond to the original article. These associations provide users with a good communication channel and enhance the objectivity and comprehensiveness of text content understanding. It can also provide effective assistance for subsequent tasks such as information retrieval, summary and content management. However, the growing size of corpus data makes this task impossible to rely on human resources alone. Therefore, it is necessary to explore an automatic implementation method of content association task. Up to now, most of the implementation methods of content association are based on the similarity calculation of traditional grammar or semantic features, and the main problem arises from the defects of surface shallow features of text and words. In recent years, word embedding model has shown excellent performance in the task of natural language processing, especially in mining deep semantics. In this paper, we propose a content association method which uses word embedding model as a feature. First, we study the structure of the model in depth, then we evaluate the results of the trained word vector under different parameters in detail. Finally, we discuss the literature in English biology field and the online forum in Chinese and English. The three kinds of data are tested and compared with the traditional method, which proves the validity of the proposed method.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊壽勛;《統(tǒng)計(jì)自然語(yǔ)言處理基礎(chǔ)》評(píng)介[J];外語(yǔ)教學(xué)與研究;2001年04期
2 ;《統(tǒng)計(jì)自然語(yǔ)言處理基礎(chǔ)》[J];中文信息學(xué)報(bào);2005年03期
3 徐繼偉;;自然語(yǔ)言處理技術(shù)在生物信息學(xué)中的應(yīng)用(英文)[J];生物信息學(xué);2006年01期
4 王挺;麥范金;劉忠;;自然語(yǔ)言處理及其應(yīng)用前景的研究[J];桂林航天工業(yè)高等?茖W(xué)校學(xué)報(bào);2006年04期
5 ;第二屆全國(guó)少數(shù)民族青年自然語(yǔ)言處理學(xué)術(shù)研討會(huì)召開[J];模式識(shí)別與人工智能;2008年05期
6 高精揓;蕭國(guó)政;姬東鴻;;手持嵌入式系統(tǒng)應(yīng)用中的自然語(yǔ)言處理關(guān)鍵技術(shù)[J];長(zhǎng)江學(xué)術(shù);2009年02期
7 馮志偉;;自然語(yǔ)言處理中的一些宏觀問題之我見[J];中國(guó)外語(yǔ);2009年05期
8 曹佩;;論自然語(yǔ)言處理[J];信息與電腦(理論版);2010年05期
9 邵澤國(guó);;語(yǔ)言科學(xué)發(fā)展的新分支——自然語(yǔ)言處理[J];電子科技;2013年05期
10 李霞;;面向本科階段開設(shè)的“自然語(yǔ)言處理”課程教學(xué)研究[J];福建電腦;2013年07期
相關(guān)會(huì)議論文 前10條
1 馬穎華;蘇貴洋;;基于概念的自然語(yǔ)言處理[A];第一屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2002年
2 李生;;哈工大自然語(yǔ)言處理研究進(jìn)展[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年
3 ;哈爾濱工業(yè)大學(xué)智能技術(shù)與自然語(yǔ)言處理研究室簡(jiǎn)介[A];中國(guó)中文信息學(xué)會(huì)第六次全國(guó)會(huì)員代表大會(huì)暨成立二十五周年學(xué)術(shù)會(huì)議中文信息處理重大成果匯報(bào)展資料匯編[C];2006年
4 馮志偉;;自然語(yǔ)言處理中的理性主義和經(jīng)驗(yàn)主義[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
5 宋柔;;自然語(yǔ)言處理中語(yǔ)言知識(shí)的基礎(chǔ)性地位[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
6 李文;程華良;彭耀;溫明杰;肖威清;張陳斌;陳宗海;;自然語(yǔ)言處理云平臺(tái)[A];系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)論文集(第15卷)[C];2014年
7 徐超;畢玉德;;面向自然語(yǔ)言處理的韓國(guó)語(yǔ)隱喻知識(shí)庫(kù)構(gòu)建研究[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
8 周國(guó)棟;孔芳;朱巧明;;指代消解:國(guó)內(nèi)外研究現(xiàn)狀及趨勢(shì)[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
9 ;SWCL-2006組織機(jī)構(gòu)[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
10 張sソ,
本文編號(hào):2333457
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2333457.html