天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于上下文與稀疏約束的短文本表示及分類研究

發(fā)布時(shí)間:2021-03-28 14:14
  隨著Internet的急速普及,短信、微博、論壇等短文本形式的信息急劇增長(zhǎng),短文本的出現(xiàn)對(duì)文本研究帶來了新挑戰(zhàn)。由于短文本數(shù)據(jù)量異常龐大,數(shù)據(jù)中包含人們對(duì)社會(huì)現(xiàn)象的觀點(diǎn)和態(tài)度,話題涉及政治、金融、文娛等眾多領(lǐng)域,通過對(duì)這些類型各異的短文本進(jìn)行研究,能夠?yàn)樵掝}跟蹤與發(fā)現(xiàn)、互聯(lián)網(wǎng)信息監(jiān)管、流行語分析、輿情預(yù)警與輿論引導(dǎo)工作等領(lǐng)域提供相應(yīng)解決方案。通過對(duì)現(xiàn)有短文本表示及分類現(xiàn)狀總結(jié)分析,本文主要在短文本表示和分類兩個(gè)方面展開深入研究,并取得如下研究成果:1.基于語義特征空間上下文的短文本表示學(xué)習(xí)方法針對(duì)傳統(tǒng)短文本表示高維稀疏問題,提出基于語義特征空間上下文的短文本表示學(xué)習(xí)方法。該方法考慮到初始特征空間維度過高,首先從統(tǒng)計(jì)和深度學(xué)習(xí)兩個(gè)角度綜合計(jì)算詞項(xiàng)間初始相似度,依據(jù)初始相似度并對(duì)詞項(xiàng)進(jìn)行聚類,利用聚類中心表示降維后的語義特征空間。然后,在聚類后形成的簇上結(jié)合詞項(xiàng)上下文信息,設(shè)計(jì)三種相似度計(jì)算方法分別計(jì)算待表示文本中詞項(xiàng)與特征空間中特征詞的相似度,以形成文本映射矩陣從而對(duì)短文本進(jìn)行表示學(xué)習(xí)。實(shí)驗(yàn)結(jié)果表明,該方法能較好地反映短文本的語義信息,能合理、有效地表示短文本。2.熵權(quán)約束稀疏表示的短文... 

【文章來源】:西北師范大學(xué)甘肅省

【文章頁數(shù)】:53 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于上下文與稀疏約束的短文本表示及分類研究


圖2-1向量空間模型??2-1

基于上下文與稀疏約束的短文本表示及分類研究


圖2-2最優(yōu)分類超平面示意圖??2-2H顯H1界面,原因是H分界面將兩個(gè)類的數(shù)據(jù)進(jìn)行??

基于上下文與稀疏約束的短文本表示及分類研究


圖3-1短文本表示框架圖??3.1語義特征空間的構(gòu)建??

【參考文獻(xiàn)】:
期刊論文
[1]基于語義特征空間上下文的短文本表示學(xué)習(xí)[J]. 脫婷,馬慧芳,魏家輝,劉海姣.  計(jì)算機(jī)工程與科學(xué). 2019(02)
[2]融合標(biāo)簽平均劃分距離和結(jié)構(gòu)關(guān)系的微博用戶可重疊社區(qū)發(fā)現(xiàn)[J]. 馬慧芳,陳海波,趙衛(wèi)中,邴睿,黃樂樂.  電子學(xué)報(bào). 2018(11)
[3]融合共現(xiàn)距離和區(qū)分度的短文本相似度計(jì)算方法[J]. 劉文,馬慧芳,脫婷,陳海波.  計(jì)算機(jī)工程與科學(xué). 2018(07)
[4]基于加權(quán)超圖隨機(jī)游走的文獻(xiàn)關(guān)鍵詞提取算法[J]. 馬慧芳,劉芳,夏琴,郝占軍.  電子學(xué)報(bào). 2018(06)
[5]基于特征變權(quán)的動(dòng)態(tài)模糊特征選擇算法[J]. 王玲,孟建瑤.  計(jì)算機(jī)研究與發(fā)展. 2018(05)
[6]基于RNN和主題模型的社交網(wǎng)絡(luò)突發(fā)話題發(fā)現(xiàn)[J]. 石磊,杜軍平,梁美玉.  通信學(xué)報(bào). 2018(04)
[7]基于雙詞主題模型的半監(jiān)督實(shí)體消歧方法研究[J]. 張雄,陳福才,黃瑞陽.  電子學(xué)報(bào). 2018(03)
[8]特征驅(qū)動(dòng)的關(guān)鍵詞提取算法綜述[J]. 常耀成,張宇翔,王紅,萬懷宇,肖春景.  軟件學(xué)報(bào). 2018(07)
[9]基于分類的微博新情感詞抽取方法和特征分析[J]. 劉德喜,聶建云,萬常選,劉喜平,廖述梅,廖國(guó)瓊,鐘敏娟,江騰蛟.  計(jì)算機(jī)學(xué)報(bào). 2018(07)
[10]基于詞向量的藏文詞性標(biāo)注方法研究[J]. 鄭亞楠,珠杰.  中文信息學(xué)報(bào). 2017(01)

博士論文
[1]基于深度學(xué)習(xí)的文本表示與分類方法研究[D]. 閆琰.北京科技大學(xué) 2016
[2]漢語句義結(jié)構(gòu)模型分析及其文本表示方法研究[D]. 韓磊.北京理工大學(xué) 2016

碩士論文
[1]基于word2vec詞向量的文本分類研究[D]. 朱磊.西南大學(xué) 2017
[2]基于詞向量的短文本分類方法研究[D]. 江大鵬.浙江大學(xué) 2015



本文編號(hào):3105702

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3105702.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d88ed***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com