教學(xué)資源自動文摘系統(tǒng)的研究與設(shè)計
本文關(guān)鍵詞:教學(xué)資源自動文摘系統(tǒng)的研究與設(shè)計
更多相關(guān)文章: 自動文摘 教學(xué)資源 中文分詞 關(guān)鍵詞提取
【摘要】:隨著教育信息化的迅速發(fā)展,網(wǎng)絡(luò)成為獲取教學(xué)資源越來越重要的途徑,電子格式學(xué)習(xí)資源的數(shù)量也越來越龐大。然而,龐大的資料數(shù)目為學(xué)習(xí)者提供寬廣選擇范圍的同時也降低了篩選效率。從海量信息中快速選擇出所需資源變得越來越重要。自動文摘技術(shù)能夠?qū)ξ臋n內(nèi)容進(jìn)行壓縮和篩選,提煉出原始文檔的核心內(nèi)容,幫助用戶快速了解文章主要內(nèi)容,進(jìn)而對文章進(jìn)行篩選。 本文在現(xiàn)有自動文摘技術(shù)基本概念和方法的基礎(chǔ)上,通過對國內(nèi)外研究成果的分析梳理,對漢語特征詞提取算法以及文章主題句抽取多種方法進(jìn)行了分析研究。在關(guān)鍵詞抽取和文摘句提取的算法選擇方面,本文主要采用了基于詞頻的計算方法對文章進(jìn)行關(guān)鍵詞提取,并使用綜合詞權(quán)、位置、句型等多種特征的方法計算文章中每個句子的權(quán)重。最后,本文以思源網(wǎng)絡(luò)教學(xué)平臺為依托實現(xiàn)了一個實驗性質(zhì)的自動文摘系統(tǒng),該系統(tǒng)能夠生成效果較好的自動文摘。 系統(tǒng)首先對獲取的教學(xué)資源文檔進(jìn)行文本格式轉(zhuǎn)換,提取出其中的純文本內(nèi)容以備后續(xù)分析使用。對于符合條件且需要生成自動文摘的文檔資源,系統(tǒng)會對其篇章結(jié)構(gòu)進(jìn)行淺層分析。分詞是自動文摘技術(shù)的重要前提,本文選用分詞效果較好的中科院漢語分詞系統(tǒng),并使用人工語料庫進(jìn)行文章關(guān)鍵詞和候選文摘句的提取。然后通過基于語義詞典的語義相似度計算方法降低同義句造成的冗余,并根據(jù)預(yù)定義的簡單關(guān)聯(lián)詞規(guī)則對所生成自動文摘進(jìn)行連貫性處理,提高其可讀性。系統(tǒng)最后能夠?qū)崿F(xiàn)關(guān)鍵詞和自動文摘的雙重呈現(xiàn)。
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:G434
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 梅家駒;竺一鳴;高蘊琦;殷鴻翔;;編纂漢語類義詞典的嘗試——《同義詞詞林》簡介[J];辭書研究;1983年01期
2 于林林;魏琦;宋麗芳;;基于多種方法相融合的詞義消歧的研究[J];電腦知識與技術(shù);2010年33期
3 劉利東;基于組合度的漢語分詞決策算法研究[J];德州學(xué)院學(xué)報(自然科學(xué)版);2003年02期
4 吳應(yīng)良,韋崗,李海洲;一種基于N-gram模型和機器學(xué)習(xí)的漢語分詞算法[J];電子與信息學(xué)報;2001年11期
5 李蕾,鐘義信,郭祥昊;面向特定領(lǐng)域的理解型中文自動文摘系統(tǒng)[J];計算機研究與發(fā)展;2000年04期
6 馬穎華,王永成,蘇貴洋,張宇萌;一種基于字同現(xiàn)頻率的漢語文本主題抽取方法[J];計算機研究與發(fā)展;2003年06期
7 劉挺,王開鑄;基于篇章多級依存結(jié)構(gòu)的自動文摘研究[J];計算機研究與發(fā)展;1999年04期
8 費洪曉,康松林,朱小娟,謝文彪;基于詞頻統(tǒng)計的中文分詞的研究[J];計算機工程與應(yīng)用;2005年07期
9 夏天;;漢語詞語語義相似度計算研究[J];計算機工程;2007年06期
10 陳耀東,王挺;基于有向圖的雙向匹配分詞算法及實現(xiàn)[J];計算機應(yīng)用;2005年06期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 朱林;基于特征加權(quán)與特征選擇的數(shù)據(jù)挖掘算法研究[D];上海交通大學(xué);2013年
,本文編號:1286047
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyujiaoxuefangfalunwen/1286047.html