基于深度學(xué)習(xí)的文本自動摘要研究與實(shí)現(xiàn)
發(fā)布時間:2021-03-17 15:45
在網(wǎng)絡(luò)文化的快餐時代,數(shù)據(jù)資源呈現(xiàn)爆炸式增長,給人們帶來信息過載的困擾,且隨著社會節(jié)奏加快,生活壓力變大,人們沒有足夠多的時間精力瀏覽所有文本信息,往往希望利用碎片化的時間去獲取更多的有用信息。通過閱讀文本,人們可以快速掌握文章主旨,判定文章的需要性,且不會被文章標(biāo)題黨所蒙騙,有效緩解信息過載引發(fā)的時間精力問題。文本自動摘要的主旨是將文本或文本集合轉(zhuǎn)化為包含關(guān)鍵信息的簡短摘要,按摘要的類別進(jìn)行劃分,可以分為指示性摘要,信息摘要,關(guān)鍵詞摘要以及標(biāo)題。隨著近些年深度學(xué)習(xí)在自然語言處理領(lǐng)域的發(fā)展,基于Seq2Seq框架的自動摘要研究已成為主流。因此,本文在Seq2Seq框架的基礎(chǔ)上,引入注意力機(jī)制,構(gòu)建關(guān)鍵詞摘要模型和信息摘要模型。主要研究內(nèi)容如下:(1)基于深度學(xué)習(xí)的關(guān)鍵詞摘要研究。研究使用基于word2vec詞向量的文本語義表示以及基于Seq2Seq框架的關(guān)鍵詞摘要方法,并引入注意力機(jī)制作為基線模型進(jìn)行試驗,與傳統(tǒng)的機(jī)器學(xué)習(xí)方法進(jìn)行比較,在此基礎(chǔ)上引入了拷貝機(jī)制(Copying Mechanism),從輸入序列中拷貝合適的片段到輸出序列中。實(shí)驗結(jié)果表明,在基線模型的基礎(chǔ)上引入拷貝機(jī)制,能...
【文章來源】:浙江工業(yè)大學(xué)浙江省
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于統(tǒng)計的自動摘要方法流程圖
矩陣表示示例圖
基于圖排序的自動摘要方法流程圖
本文編號:3087358
【文章來源】:浙江工業(yè)大學(xué)浙江省
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于統(tǒng)計的自動摘要方法流程圖
矩陣表示示例圖
基于圖排序的自動摘要方法流程圖
本文編號:3087358
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3087358.html
最近更新
教材專著