面向社交媒體的文本情感分析關(guān)鍵技術(shù)研究
本文關(guān)鍵詞:面向社交媒體的文本情感分析關(guān)鍵技術(shù)研究 出處:《大連理工大學(xué)》2016年博士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 情感分析 觀點(diǎn)挖掘 屬性抽取 話題發(fā)現(xiàn) 話題摘要
【摘要】:近年來社交媒體蓬勃且迅速的發(fā)展,使其成為了全世界最大規(guī)模的公共數(shù)據(jù)源。文本作為社交媒體中一種重要的信息載體,有著指數(shù)級增長趨勢且蘊(yùn)含著極其豐富的研究與商業(yè)價(jià)值。文本情感分析作為分析文本的主要技術(shù)之一,可作為分析社交媒體文本的必要手段及技術(shù)支持,因此面向社交媒體文本的情感分析技術(shù)應(yīng)運(yùn)而生。面向社交媒體文本的情感分析主要包含情感信息檢索、情感信息抽取、情感分類、情感歸納四大任務(wù),實(shí)現(xiàn)對用戶在各種網(wǎng)絡(luò)平臺中所表達(dá)觀點(diǎn)、傾向等主觀性文本進(jìn)行分析與挖掘,進(jìn)而獲取用戶所生成文本的傾向性和話題等重要信息,以輔助不同用戶、研究者、商業(yè)組織及政府機(jī)構(gòu)的決策需要。本文結(jié)合社交媒體文本情感分析的任務(wù),分別從如下幾個(gè)方面進(jìn)行了創(chuàng)新性研究,具體完成的工作主要包括:1、針對社交媒體文本中的關(guān)鍵信息抽取問題,本文研究了如何從產(chǎn)品評論語料中準(zhǔn)確且高效地抽取產(chǎn)品屬性的信息,提出了將同一句子內(nèi)部的局部信息與不同句子間的全局信息進(jìn)行融合的方法,實(shí)現(xiàn)了對產(chǎn)品評論語料中的產(chǎn)品屬性抽。蝗缓笤谝罁(jù)其重要性對產(chǎn)品屬性加以歸并及排序,從而發(fā)現(xiàn)產(chǎn)品中的重要屬性。實(shí)驗(yàn)結(jié)果表明本文提出的融合全局信息與局部信息的產(chǎn)品屬性抽取方法適用于產(chǎn)品屬性抽取任務(wù),并能在一定程度上提高產(chǎn)品屬性抽取的精度。2、針對社交媒體中文本情感復(fù)雜多樣的特點(diǎn),本文研究了如何將認(rèn)知思維模式引入社交媒體文本情感分析中,并用于指導(dǎo)情感分類任務(wù)。對于不同民族和區(qū)域所存在的思維模式差異現(xiàn)象,及其所引發(fā)的語言與情感表達(dá)的多樣化問題,本文提出了度量思維模式差異的具體模型,并利用思維模式差異模型來指導(dǎo)社交媒體文本情感分類,分別以中英文語料作為實(shí)驗(yàn)對象,實(shí)驗(yàn)結(jié)果表明在中英文語料中考慮各自思維模式特點(diǎn)有助于提高社交媒體文本情感分類的精度。3、針對社交媒體平臺中層出不斷的熱點(diǎn)事件,本文研究了如何從海量微博信息中發(fā)現(xiàn)熱點(diǎn)事件,并以新浪微博作為研究對象。依據(jù)當(dāng)微博平臺中熱點(diǎn)事件出現(xiàn)時(shí),用戶的情感發(fā)生波動(dòng),所發(fā)微博中情感詞數(shù)量增多的現(xiàn)象,提出了情感分布語言模型。通過分析相鄰時(shí)段間情感分布語言模型的差異,實(shí)現(xiàn)了對微博平臺中熱點(diǎn)事件的發(fā)現(xiàn)。實(shí)驗(yàn)結(jié)果表明本文提出的方法可以有效地從微博平臺中發(fā)現(xiàn)熱點(diǎn)事件,并且有助于對微博平臺中熱點(diǎn)事件的管理和監(jiān)控。4、針對社交媒體平臺中的海量信息缺乏歸納的問題,本文以新浪微博作為研究對象,提出了一種基于權(quán)重量化的微博熱點(diǎn)事件摘要生成方法。該方法融合微博信息熵、話題的重要性及微博在話題中的重要性等因素,并以話題中轉(zhuǎn)發(fā)度最高的微博為中心,結(jié)合停用詞比例及與中心微博的編輯距離等統(tǒng)計(jì)特征對候選微博進(jìn)行排序,從而完成熱點(diǎn)事件摘要生成的任務(wù)。在新浪微博數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明本文提出的方法可有效地對微博平臺中的熱點(diǎn)事件進(jìn)行摘要生成,可以用于對新浪微博平臺中的熱點(diǎn)事件摘要生成與監(jiān)管。
[Abstract]:In recent years the development of social media vigorously and rapidly, which has become the world's largest public data source. The text of social media as an important carrier of information, has a research and commercial value of exponential growth trend and contains an extremely rich text sentiment analysis. As one of the main technical analysis of the text, can as a necessary means to analyze the social media text and technical support, so the social media text sentiment analysis technology came into being. For social media text sentiment analysis mainly includes emotion information retrieval, emotional information extraction, sentiment classification, emotion induction four tasks, implementation of the views of users expressed in a variety of network platform, tendency subjective text analysis and mining, and then obtain a user generated text orientation and topic and other important information, for different users, the researchers, Commercial organizations and government agencies. This paper analyzes the decision-making needs of social media text emotional tasks respectively from the following aspects of innovative research, the specific work includes: 1, aiming at the key problem of information extraction of social media in the text, this paper studies how to from the product review corpus accurately and efficiently extract the product attribute information, put forward a fusion method of global information of local information within the same sentence and between sentences, the realization of product attribute extraction of product reviews in the corpus; then on the basis of the importance of product attributes to merge and sort, and found an important attribute in the product. The experimental results show that the product attribute extraction based on fusion of global information and local information is proposed in this paper is applicable to the task of product attribute extraction, and can increase the yield to a certain extent The accuracy of the.2 product attribute extraction, according to the text of social media emotional complex characteristics, this paper studies how the cognitive thinking mode into the analysis of social media sentiment, and used to guide the sentiment classification task. For different modes of thinking in different ethnic and regional phenomenon, language and emotional expression of a variety of problems and causes, this paper puts forward a concrete model to measure the differences of thinking modes, and the modes of thinking model to guide the social media text sentiment classification, respectively in the English corpus as the experimental object, the experimental results show that in the English corpus consider their mode of thinking features helps to improve the accuracy of.3 social media text sentiment classification, according to the social media platform middle out hot events continuously, this paper studies how to find the hot events from the mass of information to Sina and micro-blog. Micro-blog as the research object. Based on the micro-blog platform when hot events occur, users emotional fluctuations, the number of emotional words in micro-blog increased phenomenon, proposed the emotional language distribution model. Through the analysis of differences between adjacent time emotional distribution language model, the hot events found in the micro-blog platform. The experimental results show that the proposed method can effectively detect hot events from the micro-blog platform, and contribute to the hot events in the micro-blog platform of monitoring and management of.4, according to the massive information social media platform under the lack of problems, this paper takes Sina and micro-blog as the research object, put forward a kind of micro-blog hot events abstractionbased the weight of quantization based on information entropy method. The fusion of micro-blog and micro-blog, the importance of topic in the topic of the importance of other factors, and the topic of transmitting the highest degree Micro-blog as the center, with the stop words and micro-blog ratio and the edit distance and other statistical characteristics to rank micro-blog, thus completing the task of generating hot events. In the Sina micro-blog data sets. The experimental results show that the proposed method can be effectively used in the hot events in the micro-blog platform can be used to produce a summary. The generation of hot events and supervision of sina micro-blog platform.
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 許璐蕾;;網(wǎng)絡(luò)評論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期
2 肖健;徐建;朱姝;萬纓;許亮;;基于翻譯和語義方法的情感詞挖掘研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年32期
3 趙鵬;趙志偉;卓景文;;一種情感詞語義加權(quán)的句子傾向性識別方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年35期
4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學(xué)習(xí)的情感分類方法研究[J];計(jì)算機(jī)科學(xué);2012年12期
5 李勇敢;周學(xué)廣;孫艷;張煥國;;結(jié)合依存關(guān)聯(lián)分析和規(guī)則統(tǒng)計(jì)分析的情感詞庫構(gòu)建方法[J];武漢大學(xué)學(xué)報(bào)(理學(xué)版);2013年05期
6 彭慶喜;錢鐵云;;基于量化情感的網(wǎng)店垃圾評論檢測[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2013年11期
7 杜嘉忠;徐健;劉穎;;網(wǎng)絡(luò)商品評論的特征 情感詞本體構(gòu)建與情感分析方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2014年05期
8 張清亮;徐健;;網(wǎng)絡(luò)情感詞自動(dòng)識別方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2011年10期
9 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語情感詞的句子情感分析[J];計(jì)算機(jī)工程;2012年09期
10 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計(jì)算機(jī)工程;2013年12期
相關(guān)會(huì)議論文 前5條
1 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關(guān)系抽取的研究[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
2 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
3 段秀婷;何婷婷;宋樂;;基于PMI-IR算法的Blog情感分類研究[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標(biāo)簽圖像自動(dòng)標(biāo)注算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調(diào)的個(gè)性化信息推薦模型[A];2006年首屆ICT大會(huì)信息、知識、智能及其轉(zhuǎn)換理論第一次高峰論壇會(huì)議論文集[C];2006年
相關(guān)博士學(xué)位論文 前9條
1 劉全超;面向中文微博的觀點(diǎn)挖掘與傾向性分析研究[D];北京理工大學(xué);2015年
2 江騰蛟;基于句法和語義挖掘的Web金融評論情感分析[D];江西財(cái)經(jīng)大學(xué);2015年
3 董喜雙;基于免疫多詞主體自治學(xué)習(xí)的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年
4 寇廣增;基于意見挖掘通用框架的情感極性強(qiáng)度模糊性研究[D];武漢大學(xué);2010年
5 楊玉珍;基于Web評論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2014年
6 黃勝;Web評論文本的細(xì)粒度意見挖掘技術(shù)研究[D];北京理工大學(xué);2014年
7 施寒瀟;細(xì)粒度情感分析研究[D];蘇州大學(xué);2013年
8 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學(xué);2011年
9 李芳;面向中文Web評論的觀點(diǎn)挖掘關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 孫博;關(guān)于情感詞的意義用法[D];遼寧大學(xué);2012年
2 王銀;中文微博情感分析方法研究[D];廣東技術(shù)師范學(xué)院;2015年
3 崔連超;互聯(lián)網(wǎng)評論文本情感分析研究[D];山東大學(xué);2015年
4 杜雪峰;藏文句子傾向性分析研究[D];中央民族大學(xué);2015年
5 孫建超;微博輿情挖掘技術(shù)的研究與應(yīng)用[D];電子科技大學(xué);2015年
6 張圣聲;基于微博平臺的產(chǎn)品評論情感分類研究[D];廣東外語外貿(mào)大學(xué);2015年
7 何天翔;基于情感詞網(wǎng)的短文本情感分類方法研究[D];西南科技大學(xué);2015年
8 丁星;基于文本傾向性分析技術(shù)的微博監(jiān)控系統(tǒng)[D];江蘇科技大學(xué);2015年
9 李茜;博客意見檢索關(guān)鍵問題研究[D];北京理工大學(xué);2015年
10 李瑞靜;漢語情感詞模糊語義的量化分析及應(yīng)用研究[D];北京理工大學(xué);2015年
,本文編號:1378420
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1378420.html