基于語義場模型的學(xué)科資源聚類及應(yīng)用研究
本文關(guān)鍵詞:基于語義場模型的學(xué)科資源聚類及應(yīng)用研究
更多相關(guān)文章: 資源聚類 語義場 學(xué)科概念 特征選擇與降維 語義引力 語義標簽
【摘要】:教育資源是教學(xué)過程的重要組成部分,優(yōu)質(zhì)的教育資源能夠幫助學(xué)習者獲得更好的學(xué)習效果。隨著信息技術(shù)的發(fā)展,教育資源的數(shù)量也在不斷累積。而如何高效、清晰地組織這些資源,方便學(xué)習者使用,是數(shù)字化學(xué)習中必須解決的重要問題。資源聚類由于其不需要監(jiān)督的特點成為資源組織中最常用的方式之一。資源聚類是指按照資源所包含的語義內(nèi)容,將內(nèi)容相似度較高、屬于同一主題的資源劃分為一個類別,并為每一個類別指定一個語義標簽的過程。其研究的重點和難點在于,資源語義內(nèi)容的表征方法、聚類特征的選擇與降維以及類別標簽的生成。本文圍繞上述關(guān)鍵內(nèi)容,針對通用的向量空間模型沒有考慮詞匯之間的聯(lián)系的缺點,研究了基于語義場模型的資源聚類技術(shù),具體的研究內(nèi)容包括五個部分:(1)基于語義場模型的資源聚類框架;(2)面向?qū)W科的語義場構(gòu)建方法;(3)基于語義場的特征選擇與降維方法;(4)基于語義場的資源聚類算法;(5)資源聚類算法的應(yīng)用研究。本文得到了國家863項目“知識濃縮與融合關(guān)鍵技術(shù)研究”(No.2008AA01Z127)和國家科技支撐計劃項目“村鎮(zhèn)教育資源配置及遠程服務(wù)關(guān)鍵技術(shù)研究”(No.200603110400)的資助。 本文取得的研究成果包括以下幾個方面: (1)針對向量空間模型沒有考慮詞匯之間聯(lián)系的不足,論文提出了基于語義場模型的資源聚類框架。通過將場模型的基本思想引入語義研究中形成語義場模型,用于描述詞匯之間的語義聯(lián)系;通過研究語義場的數(shù)學(xué)模型,實現(xiàn)詞匯語義的可表征和可計算;在語義場模型的基礎(chǔ)上提出了基于語義場的資源聚類框架,該框架定義了資源的語義場強與資源之間語義引力的計算方法,從而將資源聚類問題轉(zhuǎn)化為資源在語義引力作用下的凝聚問題,通過在聚類過程中融入資源特征之間的語義關(guān)系,提高資源之間相似度計算的準確率。 (2)針對手動構(gòu)建學(xué)科語義場費時費力的問題,論文研究了面向教育技術(shù)學(xué)科的語義場自動構(gòu)建方法。提出了基于原子詞匯構(gòu)詞算法的學(xué)科專業(yè)術(shù)語抽取方法,通過以原子詞匯作為構(gòu)詞的基本單位,提高了候選專業(yè)術(shù)語的準確率;通過學(xué)科概念的過濾與精煉,過濾候選專業(yè)術(shù)語中的非學(xué)科概念類字符串,提高概念識別的效率;通過學(xué)科概念直接關(guān)系的標注和基于解釋結(jié)構(gòu)模型法的間接關(guān)系推理算法,構(gòu)建了學(xué)科概念之間的層次關(guān)系結(jié)構(gòu)圖;對學(xué)科語義場模型的相關(guān)參數(shù)如語義概念的質(zhì)量、語義勢能的調(diào)節(jié)參數(shù)進行了估算,構(gòu)建出了面向教育技術(shù)學(xué)科領(lǐng)域的語義場。 (3)針對聚類算法中特征選擇沒有訓(xùn)練語料的問題,采用學(xué)科語義場作為學(xué)科先驗知識來指導(dǎo)語義特征的選擇。分析了將學(xué)科概念作為語義特征在特征選擇中的重要意義,并在預(yù)處理過程中加入學(xué)科概念作為語義特征,提高資源語義表征的準確率;提出了語義特征向?qū)W科概念的映射方法,提高語義特征的規(guī)范性和聚類結(jié)果的準確率;提出了基于語義場模型的語義特征約簡方法,實現(xiàn)語義特征的約簡,降低資源語義特征的維度,提高學(xué)科資源聚類的效率。 (4)針對資源聚類時未考慮詞匯之間語義聯(lián)系的不足,研究了基于語義場模型的資源聚類算法。引入語義引力的概念來模擬資源之間的相互吸引,從而將資源凝聚為多個類簇,緩解了資源聚類過程中未考慮詞匯之間語義聯(lián)系的不足,提高了資源聚類的準確率;提出了基于語義場的類別標簽抽取方法,從而保證了類別標簽的可理解性、準確性和區(qū)分度。 綜合上述研究成果,實現(xiàn)了一個面向?qū)W科的資源檢索系統(tǒng)。該系統(tǒng)的主要功能包括學(xué)科資源檢索、資源語義聚類和聚類結(jié)果的可視化呈現(xiàn)等。該系統(tǒng)可以為用戶提供細粒度的資源檢索與聚類服務(wù),滿足教育資源應(yīng)用的需求。
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2013
【分類號】:TP391.1;G40-057
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 黃獻;;語義場的邏輯解讀[J];廣西社會科學(xué);2010年10期
2 周穎;楊炳儒;;基于語言場理論的連續(xù)屬性離散化方法及實現(xiàn)[J];計算機科學(xué);2003年05期
3 印鑒,陳憶群,張鋼;搜索引擎技術(shù)研究與發(fā)展[J];計算機工程;2005年14期
4 楊炳儒;錢榕;張偉;;語言場理論及其在知識發(fā)現(xiàn)中的應(yīng)用[J];計算機工程;2005年24期
5 周強,馮松巖;構(gòu)建知網(wǎng)關(guān)系的網(wǎng)狀表示[J];中文信息學(xué)報;2000年06期
6 涂新輝;張紅春;周琨峰;何婷婷;;中文維基百科的結(jié)構(gòu)化信息抽取及詞語相關(guān)度計算方法[J];中文信息學(xué)報;2012年03期
7 李曉建,陳磊,陳世鴻;教育資源語義模型研究[J];武漢大學(xué)學(xué)報(理學(xué)版);2005年03期
8 梅家駒 ,竺一鳴 ,高蘊琦 ,殷鴻翔;語義場和語義體系[J];外國語(上海外國語學(xué)院學(xué)報);1987年03期
9 李敦之;;語義場分析矩陣[J];西安工業(yè)學(xué)院學(xué)報;2005年06期
10 陳浩;何婷婷;姬東鴻;;基于MDL聚類的無導(dǎo)詞義消歧[J];小型微型計算機系統(tǒng);2005年10期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 李景;本體理論及在農(nóng)業(yè)文獻檢索系統(tǒng)中的應(yīng)用研究——以花卉學(xué)本體建模為例[D];中國科學(xué)院研究生院(文獻情報中心);2004年
2 顧芳;多學(xué)科領(lǐng)域本體設(shè)計方法的研究[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2004年
3 熊云波;文本信息處理的若干關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2006年
4 何琳;古農(nóng)學(xué)本體的半自動構(gòu)建及檢索研究[D];南京農(nóng)業(yè)大學(xué);2007年
,本文編號:1265346
本文鏈接:http://sikaile.net/shoufeilunwen/sklbs/1265346.html