天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

深度學(xué)習(xí)在文章編輯中智能語(yǔ)義檢查算法的研究

發(fā)布時(shí)間:2024-03-14 04:02
  科技的發(fā)展使如今各行各業(yè)的數(shù)據(jù)量不斷變大,印刷行業(yè)也隨之改變。本文針對(duì)印刷工藝的文字類原稿編輯工作中的語(yǔ)句校正問(wèn)題進(jìn)行研究。本文設(shè)計(jì)并實(shí)現(xiàn)了基于長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的語(yǔ)義檢查算法。此算法首先采集、整理并構(gòu)建了標(biāo)準(zhǔn)的語(yǔ)料數(shù)據(jù)集;其次利用詞嵌入算法將經(jīng)過(guò)處理的語(yǔ)料數(shù)據(jù)映射到詞向量空間;最后根據(jù)詞嵌入算法得到的結(jié)果訓(xùn)練用來(lái)識(shí)別語(yǔ)句段并對(duì)語(yǔ)句中的詞預(yù)測(cè)、檢查的語(yǔ)言模型。具體內(nèi)容如下:(1)設(shè)計(jì)了一種新的詞嵌入方法,利用這種方法構(gòu)建了新的詞向量模型。該詞嵌入方法首先根據(jù)收集的相關(guān)文本語(yǔ)料、漢語(yǔ)言語(yǔ)法關(guān)系以及現(xiàn)有詞嵌入算法順序性和全局共線性較差的缺點(diǎn)設(shè)計(jì)的。其次是通過(guò)統(tǒng)計(jì)詞-詞組的頻數(shù)建立一種以詞組為詞的特征列的矩陣,并通過(guò)聚類算法將矩陣降維,將詞映射到一個(gè)低維的詞向量空間中,構(gòu)建了一種新的詞向量模型。最后用現(xiàn)有詞嵌入算法構(gòu)建另一種詞向量模型。將這兩種詞向量模型進(jìn)行對(duì)比分析,雖然根據(jù)相關(guān)文本統(tǒng)計(jì)詞-詞組的頻數(shù)做特征矩陣聚類后生成的詞向量模型在全局共線性略優(yōu)于現(xiàn)有詞嵌入算法,但是聚類使基于詞-詞組的詞嵌入方法整體效果略遜于現(xiàn)有詞嵌入算法構(gòu)建的詞向量模型。(2)采用兩種詞向量模型分別構(gòu)建基于LSTM的語(yǔ)...

【文章頁(yè)數(shù)】:64 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-6jieba分詞功能示意圖

圖2-6jieba分詞功能示意圖

圖2-6jieba分詞功能示意圖Figure2-6Schematicdiagramofjiebawordsegmentation(1)分詞jieba.cut方法里有由三個(gè)參數(shù),分別為:需要分詞的字符串、是否采用全模式和HMM模型。適合用于搜索的分詞的j....


圖2-7jieba分詞效果圖

圖2-7jieba分詞效果圖

圖2-6jieba分詞功能示意圖Figure2-6Schematicdiagramofjiebawordsegmentation分詞cut方法里有由三個(gè)參數(shù),分別為:需要分詞的字符串、是否采用全模型。適合用于搜索的分詞的jieba.cut_for_sea....


圖3-1one-hot編碼示意圖

圖3-1one-hot編碼示意圖

夠使人們的目光匯聚到此處的原因是由于人工化的產(chǎn)品的這種期望導(dǎo)致人們要求計(jì)算機(jī)處理夠直接理解人類的自然語(yǔ)言,那么對(duì)自然語(yǔ)行計(jì)算就是第一步。實(shí)際上詞向量就是自然語(yǔ)t形式的詞嵌入方法。言處理的工作的第一步都是要將語(yǔ)料中的詞轉(zhuǎn)編號(hào)。one-hot方法很簡(jiǎn)單,可以理解這種方,這樣的目的....


圖3-4特征矩陣示意圖

圖3-4特征矩陣示意圖

圖3-4特征矩陣示意圖Figure3-4Schematicdiagramofthefeaturematrix看出,實(shí)際上統(tǒng)計(jì)的詞-詞組特征矩陣除數(shù)據(jù)特征而存儲(chǔ),其中頻次則為影響該詞的詞向量百科中文語(yǔ)料庫(kù)分別構(gòu)建的詞-詞組特征矩陣計(jì)算,所以還需再對(duì)特征矩陣進(jìn)行降維....



本文編號(hào):3928034

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3928034.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2a738***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com