基于多特征融合的中文情感分類方法研究
本文關(guān)鍵詞:C2C電子商務(wù)服裝產(chǎn)品客戶評論要素及其對滿意度的影響,由筆耕文化傳播整理發(fā)布。
《江西財(cái)經(jīng)大學(xué)》 2012年
基于多特征融合的中文情感分類方法研究
張兆年
【摘要】:近年來,隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展和傳播方式的逐漸完善,網(wǎng)絡(luò)應(yīng)用不斷豐富,網(wǎng)絡(luò)購物、網(wǎng)上預(yù)訂的使用率持續(xù)上升。由此,消費(fèi)者對網(wǎng)購商品作出的評價(jià)越來越多,也使得網(wǎng)頁評論中包含情感信息的不斷增加。一方面,這些信息不僅幫助供應(yīng)商及時地了解客戶對商品的認(rèn)知感,也為產(chǎn)品或服務(wù)的改進(jìn)提供了支持;另一方面,越來越多的消費(fèi)者在購買商品時會事先查閱這些評論,而評論中包含的情感信息在很大程度上決定著顧客的購買意向,了解這些情感信息對于供應(yīng)商和消費(fèi)者都顯得越來越重要。但是,由于網(wǎng)絡(luò)中所包含的信息量巨大,消費(fèi)者或供應(yīng)商要閱讀所有的評論,并進(jìn)行決策將會遇到很大的困難。因此,如何從這些評論中挖掘有用的情感信息,將成為目前一個亟待解決的問題。 情感挖掘可以幫助我們挖掘潛在的觀點(diǎn)和情感信息,目前的情感挖掘研究主要從詞語、句子和文檔、特征級別進(jìn)行挖掘,將挖掘深入到特征級別可以獲得更多評論中關(guān)于商品或服務(wù)的細(xì)節(jié)的情感信息。然而,目前關(guān)于特征級別的情感挖掘研究還比較少,而且缺少情感挖掘的語料資源的支持。本文主要從領(lǐng)域特征集合的構(gòu)建以及基于多特征融合的情感分類方面開展研究。 在領(lǐng)域特征的構(gòu)造方面,本文首先對先前的方法進(jìn)行了改進(jìn),主要通過設(shè)計(jì)二級特征、構(gòu)造模式和詞匯集合、自動抽取幾個步驟從未標(biāo)注的語料中抽取領(lǐng)域特征和極性詞,構(gòu)成句法規(guī)則集合。在情感分類的研究過程中,本文采用了機(jī)器學(xué)習(xí)方法與語義傾向分析方法相融合的技術(shù)手段。首先使用HowNet計(jì)算情感特征,從文本中抽取情感特征,再將情感特征與機(jī)器學(xué)習(xí)方法中的無內(nèi)容特征和領(lǐng)域特征進(jìn)行融合,形成了3個新的特征集合;然后對其中的兩個特征進(jìn)行特征提取,縮減特征規(guī)模;繼而,獲得了2個新的特征集合;最后,將所有特征集合結(jié)合支持向量機(jī)進(jìn)行情感分類實(shí)驗(yàn)。 本文進(jìn)行了兩組實(shí)驗(yàn),首先對酒店領(lǐng)域的評論進(jìn)行了抽取領(lǐng)域特征的實(shí)驗(yàn)分析,結(jié)果顯示,所使用的方法在抽取極性詞較子特征能夠獲得更高的正確率;接著,另一組實(shí)驗(yàn)通過采集關(guān)于多種產(chǎn)品的中文評論,并構(gòu)造不同特征集合,以無內(nèi)容特征作為基準(zhǔn)進(jìn)行情感分類實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示,通過加入情感特征、多種類型特征的融合可以提高分類的效果,而進(jìn)行特征提取能夠進(jìn)一步提高分類效果。
【關(guān)鍵詞】:
【學(xué)位授予單位】:江西財(cái)經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:F713.36
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 李實(shí);葉強(qiáng);李一軍;Rob Law;;中文網(wǎng)絡(luò)客戶評論的產(chǎn)品特征挖掘方法研究[J];管理科學(xué)學(xué)報(bào);2009年02期
2 張紫瓊;葉強(qiáng);李一軍;;互聯(lián)網(wǎng)商品評論情感分析研究綜述[J];管理科學(xué)學(xué)報(bào);2010年06期
3 熊德蘭;程菊明;田勝利;;基于HowNet的句子褒貶傾向性研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年22期
4 李實(shí);葉強(qiáng);李一軍;羅嗣卿;;挖掘中文網(wǎng)絡(luò)客戶評論的產(chǎn)品特征及情感傾向[J];計(jì)算機(jī)應(yīng)用研究;2010年08期
5 姚天昉;程希文;徐飛玉;漢思·烏思克爾特;王睿;;文本意見挖掘綜述[J];中文信息學(xué)報(bào);2008年03期
6 葉強(qiáng);張紫瓊;羅振雄;;面向互聯(lián)網(wǎng)評論情感分析的中文主觀性自動判別方法研究[J];信息系統(tǒng)學(xué)報(bào);2007年01期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 秦艷琴;朱婧婷;;網(wǎng)絡(luò)圖書評論分析與編輯智慧[J];中國編輯;2011年02期
2 韓耀峰;;產(chǎn)品評論在銷售型網(wǎng)站中的價(jià)值及實(shí)現(xiàn)途徑[J];電子商務(wù);2010年02期
3 張昊旻;石博瑩;;基于Java實(shí)現(xiàn)網(wǎng)絡(luò)輿情分析系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年06期
4 張建欣;;基于半監(jiān)督學(xué)習(xí)的在線評論挖掘應(yīng)用[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年20期
5 楊武;宋靜靜;唐繼強(qiáng);;中文微博情感分析中主客觀句分類方法[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué));2013年01期
6 程超;楊力;陳嘉鑫;;融合語義關(guān)聯(lián)挖掘的文本情感分析算法研究[J];硅谷;2013年13期
7 劉青;;產(chǎn)品評論挖掘技術(shù)現(xiàn)狀概述[J];電子制作;2013年15期
8 李杰;張向前;陳維軍;劉璞;;C2C電子商務(wù)服裝產(chǎn)品客戶評論要素及其對滿意度的影響[J];管理學(xué)報(bào);2014年02期
9 羅凌;陳毅東;曹茂元;;微博觀點(diǎn)句識別的話題影響研究[J];電腦知識與技術(shù);2014年01期
10 鄭誠;張吉賡;楊希;;基于共現(xiàn)詞的中文微博觀點(diǎn)句識別[J];電腦知識與技術(shù);2014年11期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 黃威;靳亞輝;;面向評論挖掘的產(chǎn)品屬性集合構(gòu)建[A];第六屆(2011)中國管理學(xué)年會——信息管理分會場論文集[C];2011年
2 宋鴻彥;劉軍;姚天昉;劉全升;黃高輝;;漢語意見型主觀性文本標(biāo)注語料庫的構(gòu)建[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
3 姚天昉;張霄凱;;一種網(wǎng)絡(luò)非規(guī)范漢語詞匯的識別方法[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
4 張冠元;林健;;一種針對餐館評論的文本傾向性分析算法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
5 陳奇哲;劉全升;姚天昉;;漢語意見型語句主題與情感關(guān)系抽取的研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
6 楊江;侯敏;王寧;;基于主題情感句的漢語評論文傾向性分析[A];第五屆全國青年計(jì)算語言學(xué)研討會論文集[C];2010年
7 章彥星;張銘;鄧志鴻;;基于特征的用戶評論自動摘要[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 何建民;面向網(wǎng)絡(luò)社區(qū)聆聽客戶聲音方法研究[D];合肥工業(yè)大學(xué);2010年
2 鄧斌;B2C在線評論中的客戶知識管理研究[D];電子科技大學(xué);2010年
3 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學(xué);2011年
4 羅芳;意見挖掘中若干關(guān)鍵問題研究[D];武漢理工大學(xué);2011年
5 馬玉濤;在線客戶評論的產(chǎn)品族設(shè)計(jì)與加工方法研究[D];華中科技大學(xué);2012年
6 黃永文;中文產(chǎn)品評論挖掘關(guān)鍵技術(shù)研究[D];重慶大學(xué);2009年
7 李實(shí);中文網(wǎng)絡(luò)客戶評論中的產(chǎn)品特征挖掘方法研究[D];哈爾濱工業(yè)大學(xué);2009年
8 褚榮偉;C2C在線反饋機(jī)制的特征及角色研究[D];復(fù)旦大學(xué);2010年
9 寇廣增;基于意見挖掘通用框架的情感極性強(qiáng)度模糊性研究[D];武漢大學(xué);2010年
10 杜偉夫;文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 郭明;基于文本分類技術(shù)的文本情感傾向性研究[D];鄭州大學(xué);2010年
2 楊鼎;基于樸素貝葉斯的中文文本情感傾向分類研究[D];湖南工業(yè)大學(xué);2010年
3 王阿婷;基于概念集合的網(wǎng)頁內(nèi)容過濾方法的研究[D];北京交通大學(xué);2010年
4 鄧忠瑩;中文文本傾向性分類系統(tǒng)研究[D];昆明理工大學(xué);2009年
5 周杰;網(wǎng)絡(luò)輿情話題情感傾向性分析技術(shù)研究[D];解放軍信息工程大學(xué);2010年
6 李海林;網(wǎng)絡(luò)輿情熱點(diǎn)信息發(fā)現(xiàn)及其傾向性研究[D];武漢理工大學(xué);2010年
7 羅亞平;面向網(wǎng)絡(luò)輿情的中文評論文本情感傾向分析研究[D];東北財(cái)經(jīng)大學(xué);2010年
8 戴霖;網(wǎng)絡(luò)輿情信息挖掘關(guān)鍵技術(shù)研究與應(yīng)用[D];浙江工商大學(xué);2011年
9 高振安;網(wǎng)絡(luò)輿論的情感傾向性評價(jià)技術(shù)研究[D];北方工業(yè)大學(xué);2011年
10 吳秀梅;基于潛在語義分析和最大熵的中文情感分析研究[D];北京交通大學(xué);2011年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王永貴;韓順平;邢金剛;于斌;;基于顧客權(quán)益的價(jià)值導(dǎo)向型顧客關(guān)系管理——理論框架與實(shí)證分析[J];管理科學(xué)學(xué)報(bào);2005年06期
2 李實(shí);葉強(qiáng);李一軍;Rob Law;;中文網(wǎng)絡(luò)客戶評論的產(chǎn)品特征挖掘方法研究[J];管理科學(xué)學(xué)報(bào);2009年02期
3 周雅倩,郭以昆,黃萱菁,吳立德;基于最大熵方法的中英文基本名詞短語識別[J];計(jì)算機(jī)研究與發(fā)展;2003年03期
4 朱艷輝;陽愛民;王平;;基于特征情感色彩的文檔流派分類研究[J];計(jì)算機(jī)工程與應(yīng)用;2007年04期
5 婁德成;姚天昉;;漢語句子語義極性分析和觀點(diǎn)抽取方法的研究[J];計(jì)算機(jī)應(yīng)用;2006年11期
6 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計(jì)算[J];中文信息學(xué)報(bào);2006年01期
7 徐琳宏;林鴻飛;楊志豪;;基于語義理解的文本傾向性識別機(jī)制[J];中文信息學(xué)報(bào);2007年01期
8 姚天昉;婁德成;;漢語語句主題語義傾向分析方法的研究[J];中文信息學(xué)報(bào);2007年05期
9 唐慧豐;譚松波;程學(xué)旗;;基于監(jiān)督學(xué)習(xí)的中文情感分類技術(shù)比較研究[J];中文信息學(xué)報(bào);2007年06期
10 姚天昉;程希文;徐飛玉;漢思·烏思克爾特;王睿;;文本意見挖掘綜述[J];中文信息學(xué)報(bào);2008年03期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張恒;吳曉娟;董文會;;基于模糊融合的駕駛員眼睛狀態(tài)識別[J];計(jì)算機(jī)應(yīng)用;2007年02期
2 任彪;樊祥;馬東輝;;基于多特征融合與粒子濾波的紅外弱小目標(biāo)跟蹤方法[J];彈箭與制導(dǎo)學(xué)報(bào);2009年05期
3 韓健;彭玉華;劉微;;電視畫質(zhì)測評專家系統(tǒng)[J];計(jì)算機(jī)工程與應(yīng)用;2010年24期
4 周斌;林喜榮;賈惠波;宋榕;;多特征融合的手背血管識別算法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
5 劉貴喜;范春宇;高恩克;;基于粒子濾波與多特征融合的視頻目標(biāo)跟蹤[J];光電子.激光;2007年09期
6 張進(jìn);魏敏;盧宇;吳欽章;;基于多特征融合的紅外目標(biāo)關(guān)聯(lián)算法[J];紅外與激光工程;2008年03期
7 劉李敦;王星;;基于多特征融合的圖像檢索技術(shù)研究[J];計(jì)算機(jī)時代;2008年08期
8 胡全;邱兆文;王霓虹;;基于多特征融合的圖像語義標(biāo)注[J];東北林業(yè)大學(xué)學(xué)報(bào);2008年10期
9 黃敏;姜靜;;基于多特征自適應(yīng)閾值檢測的關(guān)鍵幀提取[J];鄭州輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年06期
10 杜艷明;龍丹;;多特征融合的人臉檢測[J];武漢理工大學(xué)學(xué)報(bào);2010年23期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 施紹萍;孫興玉;邱建丁;;基于多特征融合預(yù)測蛋白甲基化位點(diǎn)的研究[A];第十一屆全國計(jì)算(機(jī))化學(xué)學(xué)術(shù)會議論文摘要集[C];2011年
2 張冬雨;李乃民;王寬全;賈丹兵;劉珊;李艷來;陳倩;;基于決策層多特征融合的脈象分類研究[A];第四次全國中西醫(yī)結(jié)合診斷學(xué)術(shù)研討會論文集[C];2010年
3 趙妍妍;秦兵;劉挺;張俐;蘇中;;基于多特征融合的句子相似度計(jì)算[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
4 李玉峰;鄭德權(quán);趙鐵軍;;基于SVM和多特征融合的圖像分類[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
5 朱婭妮;杜加友;;基于多特征融合的人臉表情識別[A];浙江省電子學(xué)會2009學(xué)術(shù)年會論文集[C];2009年
6 劉新星;汪增福;;基于連接體搜索和多紋理特征融合的字符提取[A];2005年中國智能自動化會議論文集[C];2005年
7 徐蕊;李國輝;趙福華;來旭;葉澤剛;;一種衛(wèi)星云圖云團(tuán)多特征分類模型[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2006)——第15屆中國多媒體學(xué)術(shù)會議(NCMT'06)論文集[C];2006年
8 邵偉;何婷婷;胡珀;肖華松;;一種面向查詢的多文檔文摘句選擇策略[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
9 鄧金杰;肖詩斌;呂學(xué)強(qiáng);程濤;;基于多特征融合的圖像檢索研究[A];圖像圖形技術(shù)研究與應(yīng)用2009——第四屆圖像圖形技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2009年
10 王軼;金立左;潘泓;袁曉輝;;基于人臉和指紋特征融合的多模態(tài)識別[A];2009年中國智能自動化會議論文集(第三分冊)[C];2009年
中國重要報(bào)紙全文數(shù)據(jù)庫 前3條
1 奇云;[N];大眾科技報(bào);2004年
2 中科院自動化所 尹潘嶸 陶建華;[N];計(jì)算機(jī)世界;2005年
3 胡兵;[N];人民公安報(bào)·消防周刊;2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李先鋒;基于特征優(yōu)化和多特征融合的雜草識別方法研究[D];江蘇大學(xué);2010年
2 徐志剛;基于多特征融合的路面破損圖像自動識別技術(shù)研究[D];長安大學(xué);2012年
3 田綱;基于多特征融合的Mean shift目標(biāo)跟蹤技術(shù)研究[D];武漢大學(xué);2011年
4 郭麗;基于內(nèi)容的商標(biāo)圖像檢索研究[D];南京理工大學(xué);2003年
5 鄭建明;基于HMM的多特征融合鉆頭磨損監(jiān)測技術(shù)的研究[D];西安理工大學(xué);2004年
6 尹宏鵬;基于計(jì)算機(jī)視覺的運(yùn)動目標(biāo)跟蹤算法研究[D];重慶大學(xué);2009年
7 林賢明;復(fù)雜場景下的人體行為識別若干關(guān)鍵技術(shù)研究[D];廈門大學(xué);2014年
8 王歡;運(yùn)動目標(biāo)檢測與跟蹤技術(shù)研究[D];南京理工大學(xué);2009年
9 曾璞;面向語義提取的圖像分類關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2009年
10 陶超;高分辨率遙感影像中的城區(qū)與建筑物檢測方法研究[D];華中科技大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 REFAS BENABDELLAH;使用跟蹤移動對象多特征融合[D];哈爾濱工程大學(xué);2011年
2 陶建峰;基于多特征融合的行人檢測方法研究[D];南京理工大學(xué);2013年
3 曹帥;基于多特征融合的室內(nèi)機(jī)器人視覺環(huán)境理解研究[D];沈陽工業(yè)大學(xué);2011年
4 朱江烽;基于多特征融合的網(wǎng)絡(luò)媒體綜合檢索[D];浙江大學(xué);2013年
5 陳娟;基于多特征融合的雷達(dá)目標(biāo)識別[D];西安電子科技大學(xué);2010年
6 張兆年;基于多特征融合的中文情感分類方法研究[D];江西財(cái)經(jīng)大學(xué);2012年
7 郭運(yùn)艷;視頻序列中目標(biāo)的多特征融合跟蹤技術(shù)研究[D];寧波大學(xué);2013年
8 張聰;基于多特征融合技術(shù)的商標(biāo)檢索系統(tǒng)[D];北京印刷學(xué)院;2011年
9 張國宏;基于多特征融合的外觀設(shè)計(jì)專利圖像檢索算法[D];廣東工業(yè)大學(xué);2011年
10 賀麒文;基于多特征融合的駕駛員疲勞檢測研究[D];中南林業(yè)科技大學(xué);2009年
本文關(guān)鍵詞:C2C電子商務(wù)服裝產(chǎn)品客戶評論要素及其對滿意度的影響,由筆耕文化傳播整理發(fā)布。
,本文編號:116418
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/116418.html