基于詞向量聚類的中文微博產(chǎn)品命名實體識別
本文選題:中文微博 + 命名實體 ; 參考:《蘭州理工大學(xué)學(xué)報》2017年01期
【摘要】:隨著微博等社交平臺的興起,如何針對微博數(shù)據(jù)進(jìn)行產(chǎn)品命名實體識別成為了自然語言處理領(lǐng)域研究的熱點之一,也是實現(xiàn)輿情監(jiān)督和商業(yè)智能的基礎(chǔ).傳統(tǒng)的命名實體識別技術(shù)沒有考慮中文微博口語化、不規(guī)范等特點,且忽略了深層語義對命名實體識別的重要作用.因此,考慮中文微博的特殊性,提出一種融合全局上下文信息的詞向量特征選擇方法,分別采用主題模型和神經(jīng)網(wǎng)絡(luò)詞向量聚類兩種方法獲取深層語義信息,并結(jié)合層疊條件隨機(jī)場進(jìn)行中文微博的命名實體識別.實驗結(jié)果表明,基于詞向量聚類的中文微博產(chǎn)品命名實體識別方法取得了較好的效果.
[Abstract]:With the rise of social platforms such as micro-blog, how to identify product named entity recognition against micro-blog data has become one of the hotspots in the field of research in the field of Natural Language Processing. It is also the basis for the realization of public opinion supervision and business intelligence. The traditional named entity recognition technology does not take into account the characteristics of the colloquial and nonstandard Chinese micro-blog, and neglects the deep level. Semantics is important for naming entity recognition. Therefore, considering the particularity of Chinese micro-blog, a word vector feature selection method is proposed, which combines the two methods of topic model and neural network word vector clustering to obtain the deep semantic information, and the name of the Chinese micro-blog is named after the cascading condition. Experimental results show that the Chinese micro-blog product named entity recognition method based on word vector clustering has achieved good results.
【作者單位】: 石家莊職業(yè)技術(shù)學(xué)院;
【基金】:國家自然科學(xué)基金(61100009) 河北省科學(xué)研究計劃項目(Z2014181) 河北省科技支撐計劃(13210345)
【分類號】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前8條
1 燕楊;文敦偉;王云吉;王珂;;基于層疊條件隨機(jī)場的中文病歷命名實體識別[J];吉林大學(xué)學(xué)報(工學(xué)版);2014年06期
2 張朝勝;郭劍毅;線巖團(tuán);余正濤;雷春雅;王海雄;;基于條件隨機(jī)場的英文產(chǎn)品命名實體識別[J];計算機(jī)工程與科學(xué);2010年06期
3 梅豐;孫承杰;孫珂;程明波;林磊;;面向網(wǎng)絡(luò)文本的中文產(chǎn)品命名實體識別[J];鄭州大學(xué)學(xué)報(理學(xué)版);2010年01期
4 郭劍毅;薛征山;余正濤;張志坤;張宜浩;姚賢明;;基于層疊條件隨機(jī)場的旅游領(lǐng)域命名實體識別[J];中文信息學(xué)報;2009年05期
5 馮元勇;孫樂;李文波;張大鯤;;基于單字提示特征的中文命名實體識別快速算法[J];中文信息學(xué)報;2008年01期
6 張永;陳思睿;楊志勇;賈桂霞;;特征選擇方法的研究和改進(jìn)[J];蘭州理工大學(xué)學(xué)報;2006年05期
7 周俊生;戴新宇;尹存燕;陳家駿;;基于層疊條件隨機(jī)場模型的中文機(jī)構(gòu)名自動識別[J];電子學(xué)報;2006年05期
8 劉非凡;趙軍;呂碧波;徐波;于浩;夏迎炬;;面向商務(wù)信息抽取的產(chǎn)品命名實體識別研究[J];中文信息學(xué)報;2006年01期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 朱丹浩;楊蕾;王東波;;基于深度學(xué)習(xí)的中文機(jī)構(gòu)名識別研究——一種漢字級別的循環(huán)神經(jīng)網(wǎng)絡(luò)方法[J];現(xiàn)代圖書情報技術(shù);2016年12期
2 韓戟;何成浩;蘇星;施成云;劉東映;;一種基于SVM的電力行業(yè)物資需求預(yù)測方法[J];電氣技術(shù);2016年12期
3 萬業(yè)號;劉利軍;黃青松;;基于層疊條件隨機(jī)場的中文醫(yī)療機(jī)構(gòu)名識別[J];濟(jì)南大學(xué)學(xué)報(自然科學(xué)版);2017年01期
4 孫麗霞;;基于查詢?nèi)罩镜南M意圖挖掘分析[J];電子制作;2016年20期
5 王藝帆;王希杰;;基于雙層條件隨機(jī)場的漢語詞性標(biāo)注方法研究[J];安陽師范學(xué)院學(xué)報;2016年05期
6 丁晟春;吳婧嬋媛;李霄;;基于CRFs和領(lǐng)域本體的中文微博評價對象抽取研究[J];中文信息學(xué)報;2016年04期
7 包亮;張莉;許鑫;;蘇州園林網(wǎng)絡(luò)評論意見挖掘研究[J];微型機(jī)與應(yīng)用;2016年13期
8 張曉勇;章成志;周清清;;基于電商產(chǎn)品評論的產(chǎn)品概念層次體系自動構(gòu)建研究[J];情報理論與實踐;2016年06期
9 鄭秋生;劉守喜;;基于CRF的互聯(lián)網(wǎng)文本命名實體識別研究[J];中原工學(xué)院學(xué)報;2016年01期
10 程露紅;黃浩;馬平;;基于條件隨機(jī)場的穩(wěn)健口語理解研究[J];新疆大學(xué)學(xué)報(自然科學(xué)版);2016年01期
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 鄭強(qiáng);劉齊軍;王正華;朱云平;;生物醫(yī)學(xué)命名實體識別的研究與進(jìn)展[J];計算機(jī)應(yīng)用研究;2010年03期
2 趙軍;;命名實體識別、排歧和跨語言關(guān)聯(lián)[J];中文信息學(xué)報;2009年02期
3 宗萍;施水才;王濤;呂學(xué)強(qiáng);;基于條件隨機(jī)場的英文地理行政實體識別[J];現(xiàn)代圖書情報技術(shù);2009年02期
4 馮元勇;孫樂;李文波;張大鯤;;基于單字提示特征的中文命名實體識別快速算法[J];中文信息學(xué)報;2008年01期
5 陳錦;常致全;許軍;;基于HMM的生物醫(yī)學(xué)命名實體的識別與分類[J];計算機(jī)時代;2006年10期
6 李中國;劉穎;;邊界模板和局部統(tǒng)計相結(jié)合的中國人名識別[J];中文信息學(xué)報;2006年05期
7 周俊生;戴新宇;尹存燕;陳家駿;;基于層疊條件隨機(jī)場模型的中文機(jī)構(gòu)名自動識別[J];電子學(xué)報;2006年05期
8 俞鴻魁;張華平;劉群;呂學(xué)強(qiáng);施水才;;基于層疊隱馬爾可夫模型的中文命名實體識別[J];通信學(xué)報;2006年02期
9 劉非凡;趙軍;呂碧波;徐波;于浩;夏迎炬;;面向商務(wù)信息抽取的產(chǎn)品命名實體識別研究[J];中文信息學(xué)報;2006年01期
10 盧嬌麗,鄭家恒;基于粗糙集的文本分類方法研究[J];中文信息學(xué)報;2005年02期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張曉艷;王挺;陳火旺;;命名實體識別研究[J];計算機(jī)科學(xué);2005年04期
2 邱莎;;幾種基于機(jī)器學(xué)習(xí)的生物命名實體識別模型比較[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年05期
3 趙軍;;命名實體識別、排歧和跨語言關(guān)聯(lián)[J];中文信息學(xué)報;2009年02期
4 鄭強(qiáng);劉齊軍;王正華;朱云平;;生物醫(yī)學(xué)命名實體識別的研究與進(jìn)展[J];計算機(jī)應(yīng)用研究;2010年03期
5 張向U,
本文編號:1786325
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1786325.html