基于詞袋模型的關(guān)聯(lián)數(shù)據(jù)融合算法改進(jìn)研究
[Abstract]:The word bag model is one of the most original and universally applicable algorithms for association data fusion. However, in this algorithm, the keyword matching has not utilized its own semantics and the corpus is insufficient, which leads to the low accuracy of entity links. In this paper, using knowledge base as background, semantic extension and cyclic iteration are used to enhance the speed and accuracy of entity disambiguation. The algorithm is divided into two processes. Firstly, the semantic fusion of the associated data set is carried out. Then, the semantic cyclic iterative word bag (s-i-Bo W) algorithm proposed in this paper is used to disambiguate and link entities. Experimental results show that the semantic cyclic iterative word bag algorithm proposed in this paper has a better correlation data fusion effect by comparing it with the associated data fusion algorithm based on the traditional word bag algorithm.
【作者單位】: 上海財經(jīng)大學(xué);上海外國語大學(xué)圖書館;
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊憲澤;談文蓉;劉莉;;句型轉(zhuǎn)換的消歧與譯文生成處理研究[J];計算機(jī)工程與科學(xué);2007年04期
2 馮素琴;陳惠明;;一種基于搭配信息的漢語組合型消歧方法[J];山西大學(xué)學(xué)報(自然科學(xué)版);2008年02期
3 劉鵬遠(yuǎn);趙鐵軍;楊沐昀;李壯;;基于等價偽譯詞模型的無指導(dǎo)譯文消歧研究[J];電子與信息學(xué)報;2008年07期
4 何文壘;劉功申;;基于語義密度的名詞消歧算法[J];計算機(jī)科學(xué);2012年06期
5 肖晶;梁冰;張曉丹;呂世炅;;一種面向篇級數(shù)據(jù)的作者名消歧規(guī)則和算法[J];現(xiàn)代圖書情報技術(shù);2012年05期
6 郭舒;;文獻(xiàn)數(shù)據(jù)庫中作者名消歧算法研究[J];現(xiàn)代圖書情報技術(shù);2013年Z1期
7 郭舒;;文獻(xiàn)數(shù)據(jù)庫中作者名自動化消歧方法應(yīng)用研究[J];情報雜志;2013年09期
8 朱靖波,姚天順;詞義自動消歧概率模型[J];東北大學(xué)學(xué)報;2000年05期
9 馮素琴,劉麗萍;組合歧義消歧方法的深入研究[J];忻州師范學(xué)院學(xué)報;2003年05期
10 范明;胡國平;王仁華;;漢語字音轉(zhuǎn)換中的多層面多音字讀音消歧[J];計算機(jī)工程與應(yīng)用;2006年02期
相關(guān)會議論文 前9條
1 周曉;李超;胡明涵;王會珍;;基于人物互斥屬性的中文人名消歧[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
2 方向紅;宋春陽;;介連兼類詞“以”的句法語義區(qū)別特征及消歧策略[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
3 陳建美;林鴻飛;楊志豪;;基于貝葉斯模型的詞匯情感消歧[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
4 周云;王挺;易綿竹;王之元;;全詞消歧的序列標(biāo)注方法[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
5 李麗;孫甲申;王小捷;李江;宋占江;;基于屬性信息的中文人名消歧[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
6 丁海波;肖桐;朱靖波;;基于多階段的中文人名消歧聚類技術(shù)的研究[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
7 時迎超;王會珍;肖桐;胡明涵;;面向人名消歧任務(wù)的人名識別系統(tǒng)[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
8 俞蘇寧;;“同位詞”體系能促進(jìn)漢語消歧和豐富詞匯[A];第六屆漢語詞匯語義學(xué)研討會論文集[C];2005年
9 李斌;陳小荷;方芳;徐艷華;;高頻最大交集型歧義字段問題研究[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
相關(guān)重要報紙文章 前1條
1 本報記者 王春霞;性別平等有助實(shí)現(xiàn)全面建設(shè)和諧社會[N];中國婦女報;2007年
相關(guān)博士學(xué)位論文 前3條
1 劉鵬遠(yuǎn);基于知識自動獲取的無指導(dǎo)譯文消歧方法研究[D];哈爾濱工業(yè)大學(xué);2008年
2 郭宇航;基于上下文的實(shí)體鏈指技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年
3 馮敏萱;論漢英平行語料的平行處理[D];南京師范大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 江瑾;融合社會關(guān)系的屬性圖聚類專家消歧方法[D];昆明理工大學(xué);2015年
2 姜新民;基于漢藏平行語料的藏文詞義自動消歧方法研究[D];中央民族大學(xué);2015年
3 楊光;基于圖方法的命名實(shí)體消歧研究[D];哈爾濱工業(yè)大學(xué);2015年
4 林翠萍;中文人名消歧算法研究[D];華僑大學(xué);2015年
5 吳艷艷;統(tǒng)計和語義結(jié)合的中文介詞消歧研究及其在機(jī)械產(chǎn)品設(shè)計中的應(yīng)用[D];西安電子科技大學(xué);2014年
6 雷晨曦;基于方式信息的自然語言篇章消歧方法及其在智能儀器設(shè)計中的應(yīng)用[D];西安電子科技大學(xué);2014年
7 相曉敏;中文組織機(jī)構(gòu)名識別和消歧技術(shù)研究與應(yīng)用[D];華東師范大學(xué);2016年
8 楊華;生物醫(yī)學(xué)縮略語消歧[D];蘇州大學(xué);2011年
9 李超;面向新聞領(lǐng)域的人名消歧方法研究[D];東北大學(xué);2010年
10 田維;基于半監(jiān)督圖聚類的專家消歧方法研究[D];昆明理工大學(xué);2013年
,本文編號:2454423
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2454423.html