融合多特征的TextRank藏文文本關(guān)鍵詞抽取方法研究
發(fā)布時(shí)間:2021-02-11 21:38
[目的/意義]旨在為提升藏文文本關(guān)鍵詞的抽取效果提供參考。[方法/過程]分析中英文文本關(guān)鍵詞抽取方法的特點(diǎn)和存在問題,針對藏文文本特點(diǎn),提出一種融合多特征的TextRank關(guān)鍵詞抽取方法,通過實(shí)驗(yàn)獲取不同特征的相對最優(yōu)權(quán)重系數(shù),并將權(quán)值計(jì)算公式應(yīng)用于TextRank的初始權(quán)值與轉(zhuǎn)移概率的計(jì)算中。[結(jié)果/結(jié)論]該方法通過融合藏文文本的結(jié)構(gòu)特征以及詞語之間語法關(guān)系等關(guān)鍵詞提取影響因素,實(shí)現(xiàn)了候選關(guān)鍵詞的量化權(quán)值,相比于傳統(tǒng)方法關(guān)鍵詞抽取效果有明顯提升,同時(shí)證明融合結(jié)構(gòu)特征與語法特征能有效改善TextRank算法的性能。
【文章來源】:情報(bào)探索. 2020,(07)
【文章頁數(shù)】:6 頁
【文章目錄】:
0 引言
1 相關(guān)研究
2 研究方法
2.1 詞圖構(gòu)建
2.2 特征構(gòu)建
2.2.1 位置特性
2.2.2 詞性特征
2.2.3 分布特征
2.2.4 語義特征
2.3 轉(zhuǎn)移矩陣計(jì)算與關(guān)鍵詞抽取
3 實(shí)驗(yàn)結(jié)果與分析
3.1 實(shí)驗(yàn)數(shù)據(jù)
3.2 參數(shù)確定
3.3 實(shí)驗(yàn)結(jié)果分析
4 結(jié)語
【參考文獻(xiàn)】:
期刊論文
[1]融合多特征的TextRank關(guān)鍵詞抽取方法[J]. 李航,唐超蘭,楊賢,沈婉婷. 情報(bào)雜志. 2017(08)
[2]學(xué)術(shù)文本的結(jié)構(gòu)功能識別——在關(guān)鍵詞自動抽取中的應(yīng)用[J]. 方龍,李信,黃永,陸偉. 情報(bào)學(xué)報(bào). 2017(06)
[3]詞向量聚類加權(quán)TextRank的關(guān)鍵詞抽取[J]. 夏天. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(02)
[4]詞向量與LDA相融合的短文本分類方法[J]. 張群,王紅軍,王倫文. 現(xiàn)代圖書情報(bào)技術(shù). 2016(12)
[5]中文事件抽取研究文獻(xiàn)之算法效果分析[J]. 吉久明,陳錦輝,李楠,孫濟(jì)慶. 現(xiàn)代情報(bào). 2015(12)
[6]面向Web的藏文文本分詞策略研究[J]. 艾金勇,陳小瑩,華侃. 圖書館學(xué)研究. 2014(21)
[7]基于多特征融合的中文文本關(guān)鍵詞提取方法[J]. 張建娥. 情報(bào)理論與實(shí)踐. 2013(10)
[8]基于主題特征的關(guān)鍵詞抽取[J]. 劉俊,鄒東升,邢欣來,李英豪. 計(jì)算機(jī)應(yīng)用研究. 2012(11)
[9]基于信息增益與信息熵的TFIDF算法[J]. 李學(xué)明,李海瑞,薛亮,何光軍. 計(jì)算機(jī)工程. 2012(08)
[10]基于詞匯鏈的關(guān)鍵詞自動標(biāo)引方法[J]. 李綱,戴強(qiáng)斌. 圖書情報(bào)知識. 2011(03)
碩士論文
[1]基于信息融合的Web信息可信度研究[D]. 羅慶平.中南大學(xué) 2014
本文編號:3029747
【文章來源】:情報(bào)探索. 2020,(07)
【文章頁數(shù)】:6 頁
【文章目錄】:
0 引言
1 相關(guān)研究
2 研究方法
2.1 詞圖構(gòu)建
2.2 特征構(gòu)建
2.2.1 位置特性
2.2.2 詞性特征
2.2.3 分布特征
2.2.4 語義特征
2.3 轉(zhuǎn)移矩陣計(jì)算與關(guān)鍵詞抽取
3 實(shí)驗(yàn)結(jié)果與分析
3.1 實(shí)驗(yàn)數(shù)據(jù)
3.2 參數(shù)確定
3.3 實(shí)驗(yàn)結(jié)果分析
4 結(jié)語
【參考文獻(xiàn)】:
期刊論文
[1]融合多特征的TextRank關(guān)鍵詞抽取方法[J]. 李航,唐超蘭,楊賢,沈婉婷. 情報(bào)雜志. 2017(08)
[2]學(xué)術(shù)文本的結(jié)構(gòu)功能識別——在關(guān)鍵詞自動抽取中的應(yīng)用[J]. 方龍,李信,黃永,陸偉. 情報(bào)學(xué)報(bào). 2017(06)
[3]詞向量聚類加權(quán)TextRank的關(guān)鍵詞抽取[J]. 夏天. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(02)
[4]詞向量與LDA相融合的短文本分類方法[J]. 張群,王紅軍,王倫文. 現(xiàn)代圖書情報(bào)技術(shù). 2016(12)
[5]中文事件抽取研究文獻(xiàn)之算法效果分析[J]. 吉久明,陳錦輝,李楠,孫濟(jì)慶. 現(xiàn)代情報(bào). 2015(12)
[6]面向Web的藏文文本分詞策略研究[J]. 艾金勇,陳小瑩,華侃. 圖書館學(xué)研究. 2014(21)
[7]基于多特征融合的中文文本關(guān)鍵詞提取方法[J]. 張建娥. 情報(bào)理論與實(shí)踐. 2013(10)
[8]基于主題特征的關(guān)鍵詞抽取[J]. 劉俊,鄒東升,邢欣來,李英豪. 計(jì)算機(jī)應(yīng)用研究. 2012(11)
[9]基于信息增益與信息熵的TFIDF算法[J]. 李學(xué)明,李海瑞,薛亮,何光軍. 計(jì)算機(jī)工程. 2012(08)
[10]基于詞匯鏈的關(guān)鍵詞自動標(biāo)引方法[J]. 李綱,戴強(qiáng)斌. 圖書情報(bào)知識. 2011(03)
碩士論文
[1]基于信息融合的Web信息可信度研究[D]. 羅慶平.中南大學(xué) 2014
本文編號:3029747
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/3029747.html
最近更新
教材專著