天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

會議摘要提取技術與評估方法的研究

發(fā)布時間:2017-08-29 16:21

  本文關鍵詞:會議摘要提取技術與評估方法的研究


  更多相關文章: 有監(jiān)督學習 無監(jiān)督學習 支持向量機 最大邊際相關 ROUGE值


【摘要】:信息技術的發(fā)展日新月異,人們獲得信息的渠道也是多種多樣,用戶如何從海量的信息中獲得所需要的摘要信息已經成為當今信息領域研究的一個熱門話題。現如今,每天的會議數不勝數,且由于會議的本身自發(fā)性的特征,從而很容易出現一些與會議內容無關的話題,人們若是花費時間去參加這些會議或者瀏覽會議全部內容必定浪費大量的時間,若是人們能夠通過瀏覽會議摘要就可以獲得會議有效信息的話,不僅能夠節(jié)約冗長的參會時間,而且也提高了信息訪問的工作效率。自動會議摘要提取系統(tǒng)使得用戶僅僅通過瀏覽會議摘要就可以知道會議的內容,從而避免了用戶訪問冗余信息,該系統(tǒng)目前引起了研究者的廣泛關注。提取技術主要包括有監(jiān)督學習方法和無監(jiān)督學習方法,在使用有監(jiān)督學習方法進行會議摘要提取時,摘要提取的任務被視為一個二元分類問題旨在決定一個句子是否為摘要句。有監(jiān)督學習方法重點描述了支持向量機SVM方法,SVM二元分類方法是近幾年廣泛使用的分類方法,SVM在很多二元分類任務中具有較好的性能,然而那些接近分類面的樣本本身不具備劃分摘要句與非摘要句的明顯特征,雖然這些樣本的置信值有大小區(qū)分,但是仍然是處于分類上的一個模糊地帶,相互之間不存在明顯的優(yōu)先級。針對SVM存在的一些缺陷,后又使用MMR方法對SVM進行了后處理,并通過實驗表明MMR方法不僅可以去除摘要中的冗余信息,而且相比單純使用SVM方法進行摘要提取時性能更高。本文以會議文本為處理對象,以SVM和MMR摘要提取算法為基礎,針對當前會議是圍繞某個特定的主題進行討論和交流的特點,提出了一種基于主題的MMR與SVM相融合的會議摘要提取方法。這種方法以主題關鍵詞為依據進行打分,并對MMR打分方法進行了改進的同時也兼顧句子位置特征等信息進行評分及重要性排序,使用ROUGE值評估方法進行摘要提取性能的評估。前人的研究中針對會議摘要提取算法已經給出了大量的改進算法和不同的評估方法。結果表明,將基于主題的MMR與SVM相融合的摘要系統(tǒng)分別與SVM摘要系統(tǒng)、MMR摘要系統(tǒng)以及SVM與MMR相結合摘要系統(tǒng)進行對比時,前者提取的摘要效果更好。大部分的研究是針對會議摘要提取算法的改進和使用,有的研究使用有監(jiān)督摘要提取方法進行摘要句與非摘要句分類來提取會議摘要,有的研究者認為,會議語料庫是龐大的,人為的標注也是費時費力的,因此他們使用無監(jiān)督摘要提取方法進行會議摘要,也有的結合了有監(jiān)督學習方法和無監(jiān)督學習方法優(yōu)點,提出了一種半監(jiān)督學習方法來提取會議摘要,也有的研究者將多種算法進行結合進行摘要的提取等等。根據會議所具有的自發(fā)語音的特征進行研究的少之又少。本研究根據會議所特有的特征,提出一種基于主題的會議摘要提取方法,該方法主要是沿著一個會議中某一個或者若干個特定話題進行摘要句的提取,實驗結果表明,基于主題的摘要提取方法在會議文本中表現出了較高的性能與優(yōu)點,更便于用戶的閱讀與理解。
【關鍵詞】:有監(jiān)督學習 無監(jiān)督學習 支持向量機 最大邊際相關 ROUGE值
【學位授予單位】:太原理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1;TP18
【目錄】:
  • 摘要3-5
  • Abstract5-10
  • 第一章 緒論10-20
  • 1.1 課題來源和意義10-15
  • 1.1.1 摘要與語音摘要10-11
  • 1.1.2 會議摘要的一般定義11-13
  • 1.1.3 會議摘要當前研究現狀13-15
  • 1.2 會議摘要的應用及價值15-17
  • 1.3 本文主要研究內容和組織結構17-18
  • 1.4 本章小結18-20
  • 第二章 會議摘要提取方法與評估20-28
  • 2.1 會議語料庫簡介20-21
  • 2.2 會議摘要提取方法21-26
  • 2.2.1 無監(jiān)督學習方法提取摘要21-23
  • 2.2.2 有監(jiān)督學習方法提取摘要23-25
  • 2.2.3 其他方法25-26
  • 2.3 會議摘要提取評估方法26-27
  • 2.3.1 ROUGE值評估方法26-27
  • 2.3.2 金字塔評估方法27
  • 2.4 本章小結27-28
  • 第三章 SVM與MMR融合的會議摘要技術28-40
  • 3.1 會議文本特征選擇及預處理28-32
  • 3.1.1 會議文本預處理28-29
  • 3.1.2 詞匯特征29-30
  • 3.1.3 結構和話語特征30-31
  • 3.1.4 主題相關特征31-32
  • 3.2 會議摘要提取技術描述32-33
  • 3.3 會議摘要提取SVM二元分類算法33-37
  • 3.3.1 支持向量機分類34-37
  • 3.4 SVM與MMR相融合算法37-39
  • 3.5 本章小結39-40
  • 第四章 基于主題的SVM與MMR融合的會議摘要技術40-50
  • 4.1 基于主題的會議摘要提出40-42
  • 4.2 基于主題的會議摘要提取技術42-45
  • 4.2.1 提取主題相關信息42-43
  • 4.2.2 句子重要性排序43
  • 4.2.3 句子置信值打分43-44
  • 4.2.4 摘要句順序調整44-45
  • 4.3 實驗仿真及結果分析45-48
  • 4.3.1 ICSI語料庫以及對其預處理45
  • 4.3.2 評估方法45
  • 4.3.3 實驗結果及分析45-48
  • 4.4 本章小結48-50
  • 第五章 總結與展望50-52
  • 參考文獻52-58
  • 致謝58-60
  • 攻讀學位期間發(fā)表的學術論文目錄60

【相似文獻】

中國期刊全文數據庫 前1條

1 錢壽初;;第5屆國際生物醫(yī)學審稿和出版大會將于2005年召開[J];中國科技期刊研究;2003年03期

中國重要報紙全文數據庫 前5條

1 本報記者 周龍 整理;市委七屆十二次全委擴大會暨全市經濟工作會議摘要[N];白銀日報;2014年

2 ;全省經濟工作和城鎮(zhèn)化工作會議摘要[N];甘肅日報;2013年

3 本報記者 朱小兵;沃野綻放報春花[N];臺州日報;2012年

4 方舟子;腳踏兩只船的院士候選人[N];北京科技報;2005年

5 唐先武;渠氏技術:一朝花開里外香[N];科技日報;2004年

中國碩士學位論文全文數據庫 前1條

1 孟令閣;會議摘要提取技術與評估方法的研究[D];太原理工大學;2016年

,

本文編號:754267

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/754267.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶02971***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com