天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 外語論文 > 小語種論文 >

基于HDP的主題詞向量構(gòu)造——以柬語為例

發(fā)布時(shí)間:2021-11-09 03:51
  針對(duì)單一詞向量中存在的一詞多義和一義多詞的問題,以柬語為例提出了一種基于HDP主題模型的主題詞向量的構(gòu)造方法。在單一詞向量基礎(chǔ)上融入了主題信息,首先通過HDP主題模型得到單詞主題標(biāo)簽,然后將其視為偽單詞與單詞一起輸入Skip-Gram模型,同時(shí)訓(xùn)練出主題向量和詞向量,最后將文本主題信息的主題向量與單詞訓(xùn)練后得到的詞向量進(jìn)行級(jí)聯(lián),獲得文本中每個(gè)詞的主題詞向量。與未融入主題信息的詞向量模型相比,該方法在單詞相似度和文本分類方面均取得了更好的效果,獲取的主題詞向量具有更多的語義信息。 

【文章來源】:計(jì)算機(jī)工程與科學(xué). 2020,42(06)北大核心CSCD

【文章頁數(shù)】:9 頁

【部分圖文】:

基于HDP的主題詞向量構(gòu)造——以柬語為例


改進(jìn)的主題詞向量模型

柬埔寨,語料,上下文,向量


其中,oz為主題詞向量,通過連接歸一化后的詞向量和主題向量獲得。通過式(17)可知,本文將模型中得到的所有的主題的概率作為權(quán)重,進(jìn)行加權(quán)求和,得到最終的上下文詞向量。由式(17)得到上下文詞向量的目的是用于衡量?jī)蓚(gè)詞之間的相似性,于是,給定2組具有上下文的單詞(wi,ci)和(wj,cj),其上下文單詞相似度的計(jì)算采用AVGSimC公式,如式(18)所示:

數(shù)據(jù)集,單詞,主題詞,等級(jí)


其中,r表示等級(jí)個(gè)數(shù),即測(cè)試集中包含的詞語對(duì)的數(shù)量;g表示2組單詞之間的等級(jí)差數(shù);gi表示第i組單詞的等級(jí)差。在該實(shí)驗(yàn)任務(wù)中進(jìn)行的對(duì)比實(shí)驗(yàn)是將本文所得到的主題詞向量模型和Skip-Gram模型、LDA主題模型、HDP主題模型、LDA-Skip-Gram的主題詞向量模型在上下文單詞相似度任務(wù)上進(jìn)行結(jié)果對(duì)比。


本文編號(hào):3484566

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/waiyulunwen/zhichangyingyu/3484566.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶055ba***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
精品欧美日韩一二三区| 国产又粗又猛又长又黄视频| 欧美一区二区三区99| 一二区不卡不卡在线观看| 日韩精品福利在线观看| 亚洲欧洲精品一区二区三区| 日韩国产亚洲欧美另类| 欧美日韩亚洲巨色人妻| 成人日韩在线播放视频| 亚洲熟妇熟女久久精品 | 日本高清加勒比免费在线| 中文字幕中文字幕一区二区| 91精品蜜臀一区二区三区| 欧美日韩一级黄片免费观看| 精品少妇一区二区三区四区| 五月婷婷六月丁香狠狠| 国产丝袜美女诱惑一区二区| 91久久精品中文内射| 精品国产成人av一区二区三区| 欧美一级黄片免费视频| 久久国产精品亚州精品毛片| 亚洲精品偷拍视频免费观看| 欧美人妻少妇精品久久性色| 日韩视频在线观看成人| 国产成人精品一区在线观看| 麻豆亚州无矿码专区视频| 免费久久一级欧美特大黄孕妇| 日韩高清一区二区三区四区| 精品人妻久久一品二品三品| 午夜视频成人在线观看| 国产韩国日本精品视频| 国产精品久久香蕉国产线| 国内精品伊人久久久av高清| 亚洲中文字幕三区四区| 久热在线视频这里只有精品| 年轻女房东2中文字幕| 精品老司机视频在线观看| 国产盗摄精品一区二区视频| 免费特黄一级一区二区三区| 国产91人妻精品一区二区三区| 精品欧美在线观看国产|