結合語義知識的藏文網(wǎng)頁主題句抽取算法研究
發(fā)布時間:2020-03-19 03:00
【摘要】:通過分析總結藏文網(wǎng)頁的結構特征,在借鑒漢語主題句抽取方法的基礎上,提出了結合語義信息的藏文網(wǎng)頁主題句抽取算法。該方法根據(jù)藏文文本特征實現(xiàn)了網(wǎng)頁內(nèi)容的智能識別,同時,在對識別的文本塊進行自動分詞后,利用改進TF-IDF方法結合主題詞的語義相關性確定了網(wǎng)頁文本的主題詞,并據(jù)此構建了候選主題句集,再通過候選主題句的重要度和分布度計算得到了候選主題句的權值。最后對所有候選主題句按權值大小排序并確定了文本的主題句。
本文編號:2589601
【相似文獻】
相關期刊論文 前6條
1 張云濤;龔玲;王永成;;基于綜合方法的文本主題句的自動抽取[J];上海交通大學學報;2006年05期
2 王偉;趙東巖;趙偉;;中文新聞關鍵事件的主題句識別[J];北京大學學報(自然科學版);2011年05期
3 葛斌;李芳芳;李阜;肖衛(wèi)東;;基于無向圖構建策略的主題句抽取[J];計算機科學;2011年05期
4 王力;李培峰;朱巧明;;一種基于LDA模型的主題句抽取方法[J];計算機工程與應用;2013年02期
5 薛扣英;原盛;張心嚴;;基于WFC和MI的主題句提取方法[J];計算機工程;2009年20期
6 何維;王宇;;基于句子關系圖的網(wǎng)頁文本主題句抽取[J];現(xiàn)代圖書情報技術;2009年03期
相關碩士學位論文 前2條
1 潘云仙;基于JST模型的新聞文本情感分類研究[D];河北大學;2015年
2 劉子平;基于主題句語義融合的多文檔摘要算法研究[D];重慶大學;2016年
,本文編號:2589601
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2589601.html
最近更新
教材專著