天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于語義重構的文本摘要算法

發(fā)布時間:2017-04-21 15:16

  本文關鍵詞:基于語義重構的文本摘要算法,由筆耕文化傳播整理發(fā)布。


【摘要】:互聯網技術的快速發(fā)展產生了數據爆炸和信息過載的問題,同時現代生活節(jié)奏的加快催生了用戶快速閱讀的需求,使得文本自動摘要技術成為了當今科學界的研究熱點。相比其他自然語言處理任務,自動摘要技術的挑戰(zhàn)在于摘要的評價指標無法精準量化,極具主觀性,而且自動摘要往往深受冗余信息的困擾。目前主流的自動摘要算法是通過預先定義某個指標,對所有句子進行打分,然后對句子排序并抽取top-k作為生成摘要。然而這些抽取排序模型一方面對句子獨立打分,孤立了句子之間的聯系,忽略了文章的結構信息;一方面選取的評分指標通常是詞素級別或者統(tǒng)計特征,缺乏語義信息。針對這些缺點,我們設想一個高質量的摘要能夠很好地還原原文的語義,進而提出了語義重構模型:通過尋找能夠以最小損失重構原文語義的句子集作為最后的生成摘要。本文的工作主要包括兩個方面:(1)針對詞袋模型的高維稀疏、缺乏語義信息的現象,設計了兩種簡單有效的語義向量化方式表示文本,分別是基于神經語言模型的詞嵌入加權方法和基于多層自編碼網絡的深度降維方法。并通過句子分類實驗證明了這兩種向量化方式都能得到緊湊且具有語義的文本表示。(2)分別設計了基于二次規(guī)劃的線性重構策略和更為平滑靈活的非線性重構策略,以得到能最佳還原原文的句子并作為結果摘要。另外通過冗余消減手段在改進了重構策略并提高了摘要質量。最后在DUC標準數據集上的摘要實驗對比,證明了本文的語義重構模型的合理性和有效性。
【關鍵詞】:自動摘要 語義重構 詞嵌入 語義表示
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1
【目錄】:
  • 摘要6-7
  • Abstract7-10
  • 第一章 緒論10-16
  • 1.1 自動摘要的研究背景10-11
  • 1.2 自動摘要的分類11-12
  • 1.3 自動摘要的挑戰(zhàn)12-14
  • 1.4 本文工作和組織結構14-16
  • 第二章 文本摘要的相關研究16-26
  • 2.1 句子排序抽取法16-20
  • 2.1.1 基于統(tǒng)計信皇16-18
  • 2.1.2 句子聚類和圖模型18-19
  • 2.1.3 機器學習19-20
  • 2.2 基于語言學方法20-22
  • 2.2.1 詞匯鏈20-21
  • 2.2.2 LSA21
  • 2.2.3 互參信息和修辭結構21-22
  • 2.3 特殊文體或領域的摘要方法22-26
  • 2.3.1 醫(yī)學摘要22-23
  • 2.3.2 期刊摘要23
  • 2.3.3 郵件摘要23-24
  • 2.3.4 網頁摘要24-26
  • 第三章 文本的語義表示26-37
  • 3.1 引言26-27
  • 3.2 詞嵌入加權27-30
  • 3.3 深度降維30-34
  • 3.4 實驗對比34-36
  • 3.5 本章小結36-37
  • 第四章 原文語義重構策略37-59
  • 4.1 線性重構策略37-43
  • 4.1.1 目標函數38-42
  • 4.1.2 優(yōu)化方法42-43
  • 4.2 非線性重構策略43-50
  • 4.2.1 模型結構及訓練44-49
  • 4.2.2 摘要提取49-50
  • 4.3 冗余消減50-52
  • 4.4 實驗對比52-58
  • 4.4.1 數據集和評測工具52-54
  • 4.4.2 對比實驗介紹54
  • 4.4.3 實驗結果及分析54-58
  • 4.5 本章小結58-59
  • 第五章 總結與展望59-61
  • 5.1 工作總結59-60
  • 5.2 未來展望60-61
  • 參考文獻61-66
  • 致謝66-67
  • 附錄67-68

【相似文獻】

中國期刊全文數據庫 前10條

1 馬漢華;邵志清;過弋;;基于認知心理學模型的自動文本摘要生成技術[J];華東理工大學學報(自然科學版);2009年06期

2 孫春葵,李蕾,楊曉蘭,鐘義信;基于知識的文本摘要系統(tǒng)研究與實現[J];計算機研究與發(fā)展;2000年07期

3 程倩倩;田大鋼;;基于基本要素方法的中文自動文本摘要模型[J];現代圖書情報技術;2010年02期

4 胡俠;林曄;王燦;林立;;自動文本摘要技術綜述[J];情報雜志;2010年08期

5 劉冬平;李振坤;熊建斌;;基于統(tǒng)計的音樂摘要研究[J];現代計算機(專業(yè)版);2010年02期

6 王知津;基于句子選擇的自動文本摘要方法及其評價[J];現代圖書情報技術;1998年01期

7 鄒劍章;周經野;陳益強;胡明清;;基于事件框架的移動摘要方法研究[J];微計算機信息;2010年12期

8 廖濤;劉宗田;王利;;多主題文本摘要抽取的研究與實現[J];計算機工程;2011年06期

9 龍瓏;鄧偉;;綠網摘要提取系統(tǒng)算法研究[J];微型機與應用;2013年12期

10 張龍凱;王厚峰;;文本摘要問題中的句子抽取方法研究[J];中文信息學報;2012年02期

中國重要會議論文全文數據庫 前3條

1 王慧芳;張勇;邢春曉;張文珂;楊吉江;;文本摘要算法集成與實現[A];第二十五屆中國數據庫學術會議論文集(二)[C];2008年

2 伊力亞爾·加爾木哈買提;尼亞子別克·阿不都加勒力;;哈薩克文自動文本摘要方法淺談[A];少數民族青年自然語言處理技術研究與進展——第三屆全國少數民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯合學術研討會論文集[C];2010年

3 張龍凱;王厚峰;;文本摘要中的句子抽取方法研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

中國碩士學位論文全文數據庫 前10條

1 謝松山;非領域知識依賴的文本摘要方法的研究[D];西南大學;2015年

2 王斌;面向微博的觀點摘要關鍵技術研究[D];山西大學;2015年

3 Ahmad Najibullah;印尼文文本摘要的句子提取和還原[D];南昌大學;2015年

4 王曉陽;一種基于概念格的中文文本摘要方法研究[D];北京理工大學;2015年

5 吳振東;基于圖模型聚類的文本摘要方法研究[D];浙江工商大學;2015年

6 許盛伍;在線熱點新聞推薦系統(tǒng)研究和實現[D];南京航空航天大學;2015年

7 孫秀勝;基于概念對象模型的文本摘要技術研究[D];山東財經大學;2016年

8 張弛;基于語義重構的文本摘要算法[D];南京大學;2016年

9 叢艷;自動文本摘要方法的研究及應用[D];華北電力大學(北京);2004年

10 閆英杰;偏重摘要技術及其應用研究[D];大連理工大學;2007年


  本文關鍵詞:基于語義重構的文本摘要算法,,由筆耕文化傳播整理發(fā)布。



本文編號:320637

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/320637.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶a2acc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com