教學資源自動文摘系統(tǒng)的研究與設計
本文關鍵詞:教學資源自動文摘系統(tǒng)的研究與設計
【摘要】:隨著教育信息化的迅速發(fā)展,網絡成為獲取教學資源越來越重要的途徑,電子格式學習資源的數量也越來越龐大。然而,龐大的資料數目為學習者提供寬廣選擇范圍的同時也降低了篩選效率。從海量信息中快速選擇出所需資源變得越來越重要。自動文摘技術能夠對文檔內容進行壓縮和篩選,提煉出原始文檔的核心內容,幫助用戶快速了解文章主要內容,進而對文章進行篩選。 本文在現有自動文摘技術基本概念和方法的基礎上,通過對國內外研究成果的分析梳理,對漢語特征詞提取算法以及文章主題句抽取多種方法進行了分析研究。在關鍵詞抽取和文摘句提取的算法選擇方面,本文主要采用了基于詞頻的計算方法對文章進行關鍵詞提取,并使用綜合詞權、位置、句型等多種特征的方法計算文章中每個句子的權重。最后,本文以思源網絡教學平臺為依托實現了一個實驗性質的自動文摘系統(tǒng),該系統(tǒng)能夠生成效果較好的自動文摘。 系統(tǒng)首先對獲取的教學資源文檔進行文本格式轉換,提取出其中的純文本內容以備后續(xù)分析使用。對于符合條件且需要生成自動文摘的文檔資源,系統(tǒng)會對其篇章結構進行淺層分析。分詞是自動文摘技術的重要前提,本文選用分詞效果較好的中科院漢語分詞系統(tǒng),并使用人工語料庫進行文章關鍵詞和候選文摘句的提取。然后通過基于語義詞典的語義相似度計算方法降低同義句造成的冗余,并根據預定義的簡單關聯詞規(guī)則對所生成自動文摘進行連貫性處理,提高其可讀性。系統(tǒng)最后能夠實現關鍵詞和自動文摘的雙重呈現。
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:G434
【參考文獻】
中國期刊全文數據庫 前10條
1 梅家駒;竺一鳴;高蘊琦;殷鴻翔;;編纂漢語類義詞典的嘗試——《同義詞詞林》簡介[J];辭書研究;1983年01期
2 于林林;魏琦;宋麗芳;;基于多種方法相融合的詞義消歧的研究[J];電腦知識與技術;2010年33期
3 劉利東;基于組合度的漢語分詞決策算法研究[J];德州學院學報(自然科學版);2003年02期
4 吳應良,韋崗,李海洲;一種基于N-gram模型和機器學習的漢語分詞算法[J];電子與信息學報;2001年11期
5 李蕾,鐘義信,郭祥昊;面向特定領域的理解型中文自動文摘系統(tǒng)[J];計算機研究與發(fā)展;2000年04期
6 馬穎華,王永成,蘇貴洋,張宇萌;一種基于字同現頻率的漢語文本主題抽取方法[J];計算機研究與發(fā)展;2003年06期
7 劉挺,王開鑄;基于篇章多級依存結構的自動文摘研究[J];計算機研究與發(fā)展;1999年04期
8 費洪曉,康松林,朱小娟,謝文彪;基于詞頻統(tǒng)計的中文分詞的研究[J];計算機工程與應用;2005年07期
9 夏天;;漢語詞語語義相似度計算研究[J];計算機工程;2007年06期
10 陳耀東,王挺;基于有向圖的雙向匹配分詞算法及實現[J];計算機應用;2005年06期
中國博士學位論文全文數據庫 前1條
1 朱林;基于特征加權與特征選擇的數據挖掘算法研究[D];上海交通大學;2013年
,本文編號:1286047
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyujiaoxuefangfalunwen/1286047.html