結(jié)合詞性的短文本相似度算法及其在文本分類中的應(yīng)用
本文選題:短文本分類 + 短文本相似度; 參考:《電訊技術(shù)》2017年01期
【摘要】:針對基于語義的短文本相似度計算方法在短文本分類中準確率較低這一問題,提出了結(jié)合詞性的短文本相似度算法(GCSSA)。該方法在基于hownet("知網(wǎng)")語義的短文本相似度計算方法的基礎(chǔ)上,結(jié)合類別特征詞并添加關(guān)鍵詞詞性分析,對類別特征詞和其他關(guān)鍵詞的詞性信息給定不同關(guān)鍵詞以不同的權(quán)值系數(shù),以此區(qū)別各種貢獻度詞項在短文本相似度計算中的重要程度。實驗表明,該算法進行文本相似度計算后應(yīng)用于短文本分類中較基于hownet的短文本分類算法在準確率宏平均和微平均上提升4%左右,有效提高了短文本分類的準確性。
[Abstract]:In order to solve the problem of low accuracy in short text classification based on semantic similarity calculation method, this paper proposes a GCSSAA similarity algorithm combined with part of speech. This method is based on the similarity calculation method of short text based on hownetnet semantics, combining with category feature words and adding keyword part of speech analysis. Different weight coefficients are given to different keywords in order to distinguish the importance of each kind of contribution word item in the calculation of short text similarity. The experimental results show that the proposed algorithm can improve the accuracy of short text classification by about 4% compared with hownet based text classification algorithm, and improve the accuracy of short text classification effectively.
【作者單位】: 重慶理工大學計算機科學與工程學院;
【基金】:國家自然科學基金資助項目(11547148) 重慶市教委科技計劃項目(16SKGH133) 重慶市社會科學規(guī)劃博士項目(2015BS059)
【分類號】:TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 鄭煒冬;;試卷相似度自動評估技術(shù)的研究[J];智能計算機與應(yīng)用;2011年06期
2 趙濤;肖建;;二型模糊相似度及其應(yīng)用[J];計算機工程與應(yīng)用;2013年08期
3 徐志明;李棟;劉挺;李生;王剛;袁樹侖;;微博用戶的相似性度量及其應(yīng)用[J];計算機學報;2014年01期
4 李桂林,陳曉云;關(guān)于聚類分析中相似度的討論[J];計算機工程與應(yīng)用;2004年31期
5 秦玉平;楊興凱;;基于案例推理的區(qū)間屬性相似度研究[J];遼寧師范大學學報(自然科學版);2006年04期
6 蔣鵬;;基于本體的應(yīng)急案例相似度算法研究[J];南昌高專學報;2009年03期
7 何亞;;詞語相似度算法的分析與改進[J];硅谷;2011年24期
8 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期
9 焦鵬;唐見兵;查亞兵;;仿真可信度評估中相似度方法的改進及其應(yīng)用[J];系統(tǒng)仿真學報;2007年12期
10 姜毅;樂慶玲;;一種基于興趣相似度的學習社區(qū)算法[J];電腦知識與技術(shù)(學術(shù)交流);2007年16期
相關(guān)會議論文 前10條
1 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
2 陸勁挺;路強;劉曉平;;對比相似度計算方法及其在功能樹擴展中的應(yīng)用[A];計算機技術(shù)與應(yīng)用進展·2007——全國第18屆計算機技術(shù)與應(yīng)用(CACIS)學術(shù)會議論文集[C];2007年
3 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
4 劉曉平;陸勁挺;;任意功能樹的物元相似度求解方法[A];全國第21屆計算機技術(shù)與應(yīng)用學術(shù)會議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應(yīng)用學術(shù)會議論文集[C];2010年
5 王茜;張衛(wèi)星;;基于分類樹相似度加權(quán)的協(xié)同過濾算法[A];2008年計算機應(yīng)用技術(shù)交流會論文集[C];2008年
6 洪文學;王金甲;常鳳香;宋佳霖;劉文遠;王立強;;基于圖形特征增強的相似度分類器的研究[A];中國生物醫(yī)學工程進展——2007中國生物醫(yī)學工程聯(lián)合學術(shù)年會論文集(上冊)[C];2007年
7 雷慶;吳揚揚;;一種基于語義信息計算XML文檔相似度的新方法[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2004年
8 葉正;林鴻飛;楊志豪;;基于問句相似度的中文FAQ問答系統(tǒng)研究[A];第三屆學生計算語言學研討會論文集[C];2006年
9 羅辛;歐陽元新;熊璋;袁滿;;通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學術(shù)會議論文集A輯一[C];2010年
10 王健;劉衍珩;焦玉;;VANETs信任傳播建模[A];中國通信學會通信軟件技術(shù)委員會2009年學術(shù)會議論文集[C];2009年
相關(guān)重要報紙文章 前1條
1 王伽 衛(wèi)江;出入境證件照片應(yīng)及時更換[N];中國國門時報;2008年
相關(guān)博士學位論文 前10條
1 操震洲;矢量數(shù)據(jù)動態(tài)多尺度網(wǎng)絡(luò)傳輸研究[D];南京大學;2015年
2 程亮;基于本體的疾病數(shù)據(jù)整合與挖掘方法研究[D];哈爾濱工業(yè)大學;2014年
3 劉振宇;基于區(qū)域相似度和特征降維的極化SAR影像分類[D];武漢大學;2013年
4 張明西;信息網(wǎng)絡(luò)中的相似度搜索問題研究[D];復(fù)旦大學;2013年
5 武威;異質(zhì)數(shù)據(jù)相似度學習及其在網(wǎng)絡(luò)搜索中的應(yīng)用[D];北京大學;2012年
6 朱娜斐;基于RTT相似度的網(wǎng)絡(luò)延遲估測理論和方法[D];北京工業(yè)大學;2012年
7 錢鵬飛;基于模糊相似度的異構(gòu)本體映射、合并及校驗方法的研究[D];上海交通大學;2008年
8 馬海平;基于概率生成模型的相似度建模技術(shù)研究及應(yīng)用[D];中國科學技術(shù)大學;2013年
9 劉守群;海量網(wǎng)絡(luò)視頻快速檢索關(guān)鍵技術(shù)研究[D];中國科學技術(shù)大學;2010年
10 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類比翻譯處理機制(HATM)的設(shè)計與實現(xiàn)[D];中國科學院研究生院(計算技術(shù)研究所);2001年
相關(guān)碩士學位論文 前10條
1 楊巧;基于改進相似度的社會網(wǎng)絡(luò)鏈接預(yù)測研究[D];華南理工大學;2015年
2 張寧;某于《知網(wǎng)》的詞語相似度優(yōu)化算法[D];昆明理工大學;2015年
3 沈迤淳;歌曲中相似片段的檢測及其應(yīng)用[D];復(fù)旦大學;2014年
4 梁霄;社交網(wǎng)絡(luò)中的社區(qū)聚集研究[D];上海交通大學;2015年
5 王魁;在線社交中基于微博的好友推薦系統(tǒng)設(shè)計與實現(xiàn)[D];電子科技大學;2015年
6 洪耀停;基于共同作者圖的合作者推薦系統(tǒng)[D];浙江大學;2015年
7 褚立超;基于相似度評分模型的人員識別方法研究[D];廣西大學;2015年
8 蒲進興;基于動態(tài)相似度的錯誤定位優(yōu)先排序[D];北京化工大學;2015年
9 余超;基于Google Map的地理位置查詢系統(tǒng)[D];電子科技大學;2014年
10 烏蘭;基于動力學行為的復(fù)雜網(wǎng)絡(luò)社區(qū)檢測研究[D];內(nèi)蒙古工業(yè)大學;2015年
,本文編號:2021136
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2021136.html