基于Web文本的圖書評(píng)論傾向性分析方法的研究
本文關(guān)鍵詞:基于Web文本的圖書評(píng)論傾向性分析方法的研究 出處:《東北師范大學(xué)》2015年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 聚類 文本主題分類 傾向性分析 規(guī)則與統(tǒng)計(jì)
【摘要】:隨著互聯(lián)網(wǎng)Web2.0的普及,互聯(lián)網(wǎng)已經(jīng)逐漸成為人們表達(dá)情緒、發(fā)表觀點(diǎn)、分享體會(huì)的新輿論空間,越來越多的人們習(xí)慣在網(wǎng)絡(luò)平臺(tái)上留下自己的看法與觀點(diǎn),由此互聯(lián)網(wǎng)也被更多的人視為“百家講壇”。網(wǎng)上書店作為電子商務(wù)平臺(tái)是目前人們購(gòu)買圖書的最重要的途徑,也是與它人分享讀書體會(huì),經(jīng)及對(duì)書籍進(jìn)行評(píng)價(jià)的“自由環(huán)境”,這些眾說紛紜的海量圖書評(píng)論文本,已成為圖書出版、發(fā)行和閱讀人士關(guān)注和研究的輿情資源,成為計(jì)算機(jī)應(yīng)用、圖書情報(bào)、媒體傳播等領(lǐng)域跨學(xué)科的研究問題,成為大數(shù)據(jù)分析、數(shù)據(jù)挖掘數(shù)據(jù)支撐,具有重要的研究?jī)r(jià)值。用戶在購(gòu)買圖書時(shí)會(huì)將商品在線評(píng)論作為自己購(gòu)買商品時(shí)的決策依據(jù)。這些圖書評(píng)價(jià)語料的內(nèi)容代表了評(píng)論者在圖書的購(gòu)買或者使用過程中產(chǎn)生的感想,很多都具有鮮明的主題性和情感傾向性,通過對(duì)這些數(shù)據(jù)進(jìn)行分析,我們可從發(fā)現(xiàn)圖書購(gòu)買者使用圖書的角度,對(duì)圖書給予的客觀評(píng)價(jià)的價(jià)值。文本以海量的真實(shí)圖書評(píng)論語料為分析基礎(chǔ),提出了一種從多層面進(jìn)行文本傾向性分析的解決思路,通過搜集圖書評(píng)價(jià)語料,從中提煉出“內(nèi)容”“質(zhì)量”“物流”三個(gè)不同主題,分析了人們的大量圖書評(píng)論數(shù)據(jù)的情感傾向,從而判斷用戶對(duì)圖書的“內(nèi)容”“質(zhì)量”和“物流”三個(gè)主題的滿意程度。本文的研究方法是,首先,利用爬蟲工具獲取大量“網(wǎng)上書店”上的圖書評(píng)論原始語料,然后,運(yùn)用基于主題詞聚類的方法,構(gòu)建了圖書評(píng)價(jià)的主題詞庫。設(shè)計(jì)了將圖書評(píng)論按照不同主題進(jìn)行語料聚焦算法,最后,針對(duì)三類主題評(píng)論,通過單句級(jí)、用戶級(jí)到圖書級(jí)逐級(jí)分析算法的設(shè)計(jì),給出基于規(guī)則與統(tǒng)計(jì)的圖書評(píng)論傾向性分析算法,對(duì)圖書的不同主題進(jìn)行傾向性分析。本文設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)“基于主題分類的圖書評(píng)論傾向性分析系統(tǒng)”,對(duì)文本的算法進(jìn)行了驗(yàn)證,得出較好的結(jié)論的同時(shí),系統(tǒng)也為今后商業(yè)應(yīng)用提供了可行性思路。
[Abstract]:......
【學(xué)位授予單位】:東北師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 郭雯,葛朝陽,吳曉波;基于客戶認(rèn)知價(jià)值的CRM戰(zhàn)略[J];商業(yè)研究;2003年08期
2 倪靜;嚴(yán)廣樂;仲梁維;張曉莉;;提升電子商務(wù)背景下客戶忠誠(chéng)度的對(duì)策研究[J];工業(yè)技術(shù)經(jīng)濟(jì);2006年04期
3 吳榮榮;;微博:教育信息化的有效工具[J];考試周刊;2010年39期
4 王根;趙軍;;基于多重冗余標(biāo)記CRFs的句子情感分析研究[J];中文信息學(xué)報(bào);2007年05期
5 劉鴻宇;趙妍妍;秦兵;劉挺;;評(píng)價(jià)對(duì)象抽取及其傾向性分析[J];中文信息學(xué)報(bào);2010年01期
6 孫文俊;薛博召;;圖書領(lǐng)域消費(fèi)者在線評(píng)論的有用性影響因素研究[J];江蘇商論;2011年05期
7 郭國(guó)慶;楊學(xué)成;張楊;;口碑傳播對(duì)消費(fèi)者態(tài)度的影響:一個(gè)理論模型[J];管理評(píng)論;2007年03期
相關(guān)碩士學(xué)位論文 前1條
1 陳飛宏;基于向量空間模型的中文文本相似度算法研究[D];電子科技大學(xué);2011年
,本文編號(hào):1350887
本文鏈接:http://sikaile.net/guanlilunwen/wuliuguanlilunwen/1350887.html