天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Seq2Seq模型的自定義古詩(shī)生成

發(fā)布時(shí)間:2021-08-11 10:54
  當(dāng)前,古詩(shī)句生成任務(wù)大多基于單一的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)結(jié)構(gòu),在生成時(shí)需事先給定一個(gè)起始字,然后以該起始字為基礎(chǔ)進(jìn)行古詩(shī)句生成,生成過(guò)程的可控性較差,往往達(dá)不到預(yù)期效果。針對(duì)以上問(wèn)題,將注意力機(jī)制引入Seq2Seq模型,通過(guò)自建的數(shù)據(jù)集進(jìn)行訓(xùn)練,實(shí)現(xiàn)了基于關(guān)鍵字的自定義古詩(shī)句生成。在生成階段,首先輸入一段描述性內(nèi)容,并從中提取出關(guān)鍵字。當(dāng)關(guān)鍵字不足時(shí),使用word2vec進(jìn)行有效的關(guān)鍵字補(bǔ)全操作。此外,針對(duì)古詩(shī)體裁難以控制問(wèn)題,在Seq2Seq模型中的Encoder端增加格式控制符,有效解決了以往模型在生成古詩(shī)時(shí),體裁選擇的隨機(jī)性問(wèn)題。實(shí)驗(yàn)表明,所提出的模型較好地達(dá)到了預(yù)期的生成效果。 

【文章來(lái)源】:計(jì)算機(jī)科學(xué)與探索. 2020,14(06)北大核心CSCD

【文章頁(yè)數(shù)】:8 頁(yè)

【部分圖文】:

基于Seq2Seq模型的自定義古詩(shī)生成


關(guān)鍵字補(bǔ)全操作

模型結(jié)構(gòu),相似度,隱藏層,余弦


首先計(jì)算在t時(shí)刻輸入Decoder端的隱藏層狀態(tài)st-1對(duì)Encoder每一個(gè)隱含層狀態(tài)hi的權(quán)重wt(i),如式(1)所示。其中,score表示st-1和hi的相似度,使用余弦相似度進(jìn)行度量,如式(2)所示。

關(guān)鍵字,向量,相似度


此外,在進(jìn)行關(guān)鍵字補(bǔ)充時(shí),如果在描述內(nèi)容中僅提取出一個(gè)關(guān)鍵字,則選取與該關(guān)鍵字相關(guān)度最高的三個(gè)作為補(bǔ)充;如果提取出兩個(gè)關(guān)鍵字,則隨機(jī)從與每個(gè)關(guān)鍵字相關(guān)度最高的前三個(gè)中分別選取一個(gè)作為另外兩個(gè)關(guān)鍵字;如果提取三個(gè)關(guān)鍵字,則分別計(jì)算與每個(gè)關(guān)鍵字相似度最高的前三個(gè),取其交集作為第四個(gè)關(guān)鍵字,如果交集為空,則隨機(jī)選取三個(gè)關(guān)鍵字中的一個(gè),再隨機(jī)選取與其相似度最高的前三個(gè)中的一個(gè)作為第四個(gè)關(guān)鍵字,具體過(guò)程如圖3所示,其中括號(hào)里的值表示相似度大小。圖3 關(guān)鍵字補(bǔ)全操作

【參考文獻(xiàn)】:
期刊論文
[1]一種宋詞自動(dòng)生成的遺傳算法及其機(jī)器實(shí)現(xiàn)[J]. 周昌樂(lè),游維,丁曉君.  軟件學(xué)報(bào). 2010(03)



本文編號(hào):3336032

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/gudaiwenxuelunwen/3336032.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0b43b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com