基于詞嵌入模型的內(nèi)容關(guān)聯(lián)方法設(shè)計與應(yīng)用
[Abstract]:In real life, the correlation between text content is very common. It can be either a reference between chapters in a paper document system or an online forum where the reader comments correspond to the original article. These associations provide users with a good communication channel and enhance the objectivity and comprehensiveness of text content understanding. It can also provide effective assistance for subsequent tasks such as information retrieval, summary and content management. However, the growing size of corpus data makes this task impossible to rely on human resources alone. Therefore, it is necessary to explore an automatic implementation method of content association task. Up to now, most of the implementation methods of content association are based on the similarity calculation of traditional grammar or semantic features, and the main problem arises from the defects of surface shallow features of text and words. In recent years, word embedding model has shown excellent performance in the task of natural language processing, especially in mining deep semantics. In this paper, we propose a content association method which uses word embedding model as a feature. First, we study the structure of the model in depth, then we evaluate the results of the trained word vector under different parameters in detail. Finally, we discuss the literature in English biology field and the online forum in Chinese and English. The three kinds of data are tested and compared with the traditional method, which proves the validity of the proposed method.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 楊壽勛;《統(tǒng)計自然語言處理基礎(chǔ)》評介[J];外語教學(xué)與研究;2001年04期
2 ;《統(tǒng)計自然語言處理基礎(chǔ)》[J];中文信息學(xué)報;2005年03期
3 徐繼偉;;自然語言處理技術(shù)在生物信息學(xué)中的應(yīng)用(英文)[J];生物信息學(xué);2006年01期
4 王挺;麥范金;劉忠;;自然語言處理及其應(yīng)用前景的研究[J];桂林航天工業(yè)高等專科學(xué)校學(xué)報;2006年04期
5 ;第二屆全國少數(shù)民族青年自然語言處理學(xué)術(shù)研討會召開[J];模式識別與人工智能;2008年05期
6 高精揓;蕭國政;姬東鴻;;手持嵌入式系統(tǒng)應(yīng)用中的自然語言處理關(guān)鍵技術(shù)[J];長江學(xué)術(shù);2009年02期
7 馮志偉;;自然語言處理中的一些宏觀問題之我見[J];中國外語;2009年05期
8 曹佩;;論自然語言處理[J];信息與電腦(理論版);2010年05期
9 邵澤國;;語言科學(xué)發(fā)展的新分支——自然語言處理[J];電子科技;2013年05期
10 李霞;;面向本科階段開設(shè)的“自然語言處理”課程教學(xué)研究[J];福建電腦;2013年07期
相關(guān)會議論文 前10條
1 馬穎華;蘇貴洋;;基于概念的自然語言處理[A];第一屆學(xué)生計算語言學(xué)研討會論文集[C];2002年
2 李生;;哈工大自然語言處理研究進展[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
3 ;哈爾濱工業(yè)大學(xué)智能技術(shù)與自然語言處理研究室簡介[A];中國中文信息學(xué)會第六次全國會員代表大會暨成立二十五周年學(xué)術(shù)會議中文信息處理重大成果匯報展資料匯編[C];2006年
4 馮志偉;;自然語言處理中的理性主義和經(jīng)驗主義[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
5 宋柔;;自然語言處理中語言知識的基礎(chǔ)性地位[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
6 李文;程華良;彭耀;溫明杰;肖威清;張陳斌;陳宗海;;自然語言處理云平臺[A];系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)論文集(第15卷)[C];2014年
7 徐超;畢玉德;;面向自然語言處理的韓國語隱喻知識庫構(gòu)建研究[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年
8 周國棟;孔芳;朱巧明;;指代消解:國內(nèi)外研究現(xiàn)狀及趨勢[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
9 ;SWCL-2006組織機構(gòu)[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
10 張sソ,
本文編號:2333457
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2333457.html