結(jié)合語(yǔ)義知識(shí)的藏文網(wǎng)頁(yè)主題句抽取算法研究
發(fā)布時(shí)間:2020-03-19 03:00
【摘要】:通過分析總結(jié)藏文網(wǎng)頁(yè)的結(jié)構(gòu)特征,在借鑒漢語(yǔ)主題句抽取方法的基礎(chǔ)上,提出了結(jié)合語(yǔ)義信息的藏文網(wǎng)頁(yè)主題句抽取算法。該方法根據(jù)藏文文本特征實(shí)現(xiàn)了網(wǎng)頁(yè)內(nèi)容的智能識(shí)別,同時(shí),在對(duì)識(shí)別的文本塊進(jìn)行自動(dòng)分詞后,利用改進(jìn)TF-IDF方法結(jié)合主題詞的語(yǔ)義相關(guān)性確定了網(wǎng)頁(yè)文本的主題詞,并據(jù)此構(gòu)建了候選主題句集,再通過候選主題句的重要度和分布度計(jì)算得到了候選主題句的權(quán)值。最后對(duì)所有候選主題句按權(quán)值大小排序并確定了文本的主題句。
本文編號(hào):2589601
【相似文獻(xiàn)】
相關(guān)期刊論文 前6條
1 張?jiān)茲?龔玲;王永成;;基于綜合方法的文本主題句的自動(dòng)抽取[J];上海交通大學(xué)學(xué)報(bào);2006年05期
2 王偉;趙東巖;趙偉;;中文新聞關(guān)鍵事件的主題句識(shí)別[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年05期
3 葛斌;李芳芳;李阜;肖衛(wèi)東;;基于無(wú)向圖構(gòu)建策略的主題句抽取[J];計(jì)算機(jī)科學(xué);2011年05期
4 王力;李培峰;朱巧明;;一種基于LDA模型的主題句抽取方法[J];計(jì)算機(jī)工程與應(yīng)用;2013年02期
5 薛扣英;原盛;張心嚴(yán);;基于WFC和MI的主題句提取方法[J];計(jì)算機(jī)工程;2009年20期
6 何維;王宇;;基于句子關(guān)系圖的網(wǎng)頁(yè)文本主題句抽取[J];現(xiàn)代圖書情報(bào)技術(shù);2009年03期
相關(guān)碩士學(xué)位論文 前2條
1 潘云仙;基于JST模型的新聞文本情感分類研究[D];河北大學(xué);2015年
2 劉子平;基于主題句語(yǔ)義融合的多文檔摘要算法研究[D];重慶大學(xué);2016年
,本文編號(hào):2589601
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2589601.html
最近更新
教材專著