基于消費(fèi)者評(píng)論的汽車(chē)品牌輿情分析
發(fā)布時(shí)間:2021-09-05 05:57
隨著現(xiàn)代信息技術(shù)和互聯(lián)網(wǎng)的高速發(fā)展,產(chǎn)生了大量的輿情信息,通過(guò)輿情分析發(fā)掘有用的信息和價(jià)值越來(lái)越受到人們的重視。本文試圖將輿情分析的思想應(yīng)用于汽車(chē)銷(xiāo)售這樣的商業(yè)領(lǐng)域,通過(guò)消費(fèi)者對(duì)汽車(chē)品牌的評(píng)論發(fā)掘消費(fèi)者對(duì)于汽車(chē)品牌的關(guān)注點(diǎn)并進(jìn)一步分析不同汽車(chē)品牌的優(yōu)缺點(diǎn)。本文主要將研究分為兩個(gè)階段來(lái)進(jìn)行,分別為數(shù)據(jù)、獲取整理階段和數(shù)據(jù)分析階段。在數(shù)據(jù)獲取、整理階段,本文首先探討了多種網(wǎng)絡(luò)爬蟲(chóng)技術(shù),然后通過(guò)這些技術(shù)手段將論壇、微博等輿情網(wǎng)站中的與汽車(chē)品牌相關(guān)的評(píng)論爬取下來(lái),并將待分析文本通過(guò)采集詞比對(duì),自動(dòng)將不同類型的評(píng)論歸類到結(jié)構(gòu)化的表格中,通過(guò)基于最大概率法和隱馬爾科夫模型的中文分詞技術(shù)將文本信息分詞,并統(tǒng)計(jì)出詞頻。通過(guò)基于情感詞典的情感分類算法將消費(fèi)者的評(píng)論分為正面評(píng)價(jià)、負(fù)面評(píng)價(jià)和中性評(píng)價(jià),并統(tǒng)計(jì)出各品牌三種評(píng)價(jià)的頻數(shù)。在數(shù)據(jù)分析階段。本文首先通過(guò)主成分分析法,依據(jù)各品牌各汽車(chē)維度正面評(píng)價(jià)比例,將各汽車(chē)品牌旗下的汽車(chē)分為三個(gè)方面來(lái)進(jìn)行評(píng)價(jià),并得出了與現(xiàn)實(shí)較一致的結(jié)論,并對(duì)結(jié)論進(jìn)行了解釋說(shuō)明,對(duì)于要買(mǎi)車(chē)的潛在消費(fèi)者具有一定的參考意義。然后,本文探索了汽車(chē)維度正面評(píng)價(jià)數(shù)與汽車(chē)品牌銷(xiāo)量之間的重要性關(guān)系,...
【文章來(lái)源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
通用爬蟲(chóng)流程圖 通用爬蟲(chóng)有以下的不足:(1)由于在一個(gè)較大范圍內(nèi)抓取目標(biāo),所以可能
圖 2-2 主題網(wǎng)絡(luò)爬蟲(chóng)流程圖 2 種爬蟲(chóng)技術(shù),可以看出:通用網(wǎng)絡(luò)爬蟲(chóng)起始于初始 UR個(gè)網(wǎng)頁(yè)內(nèi)容;主題網(wǎng)絡(luò)爬蟲(chóng)在兼具抓取網(wǎng)頁(yè)內(nèi)容的同時(shí),進(jìn)行分析。用戶可以查詢主題網(wǎng)絡(luò)爬蟲(chóng)提供的數(shù)據(jù)資源,容的目的。的文本數(shù)據(jù)是通過(guò)聯(lián)合以上 2 種網(wǎng)絡(luò)爬蟲(chóng)技術(shù)得來(lái)的。用的分詞技術(shù)介紹 大概率分詞算法的中文分詞方法一串字分割成獨(dú)立的詞的過(guò)程,中文分詞就是將一串中文義的詞的過(guò)程。中文分詞技術(shù)應(yīng)用已經(jīng)在我們生活中隨處有分詞技術(shù),那么檢索時(shí)只會(huì)按照單個(gè)字的意思,很可能
圖 3-1 自變量和因變量關(guān)系示意圖 以第 1 個(gè)自變量為例:從右向左,第 1 個(gè)回歸方程描述原始自變量( )和正交變量( )的關(guān)系,可列方程: = + + 表示 關(guān)于 的回歸系數(shù)。第 2 個(gè)回歸方程描述正交變量( )和因變量( )之間的關(guān)系,可表示為: = + + 表 示關(guān)于 的回歸系數(shù)。因此, 的相對(duì)權(quán)重 可以表示為: = + + 3.2.2 相對(duì)權(quán)重的數(shù)學(xué)原理將 ×1列矩陣設(shè)為因變量 ,將滿秩的 × 階矩陣設(shè)為自變量( , , , ),變量均進(jìn)行了標(biāo)準(zhǔn)化處理,那么自變量矩陣 的正交變換可用 = 來(lái)表示。
本文編號(hào):3384812
【文章來(lái)源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
通用爬蟲(chóng)流程圖 通用爬蟲(chóng)有以下的不足:(1)由于在一個(gè)較大范圍內(nèi)抓取目標(biāo),所以可能
圖 2-2 主題網(wǎng)絡(luò)爬蟲(chóng)流程圖 2 種爬蟲(chóng)技術(shù),可以看出:通用網(wǎng)絡(luò)爬蟲(chóng)起始于初始 UR個(gè)網(wǎng)頁(yè)內(nèi)容;主題網(wǎng)絡(luò)爬蟲(chóng)在兼具抓取網(wǎng)頁(yè)內(nèi)容的同時(shí),進(jìn)行分析。用戶可以查詢主題網(wǎng)絡(luò)爬蟲(chóng)提供的數(shù)據(jù)資源,容的目的。的文本數(shù)據(jù)是通過(guò)聯(lián)合以上 2 種網(wǎng)絡(luò)爬蟲(chóng)技術(shù)得來(lái)的。用的分詞技術(shù)介紹 大概率分詞算法的中文分詞方法一串字分割成獨(dú)立的詞的過(guò)程,中文分詞就是將一串中文義的詞的過(guò)程。中文分詞技術(shù)應(yīng)用已經(jīng)在我們生活中隨處有分詞技術(shù),那么檢索時(shí)只會(huì)按照單個(gè)字的意思,很可能
圖 3-1 自變量和因變量關(guān)系示意圖 以第 1 個(gè)自變量為例:從右向左,第 1 個(gè)回歸方程描述原始自變量( )和正交變量( )的關(guān)系,可列方程: = + + 表示 關(guān)于 的回歸系數(shù)。第 2 個(gè)回歸方程描述正交變量( )和因變量( )之間的關(guān)系,可表示為: = + + 表 示關(guān)于 的回歸系數(shù)。因此, 的相對(duì)權(quán)重 可以表示為: = + + 3.2.2 相對(duì)權(quán)重的數(shù)學(xué)原理將 ×1列矩陣設(shè)為因變量 ,將滿秩的 × 階矩陣設(shè)為自變量( , , , ),變量均進(jìn)行了標(biāo)準(zhǔn)化處理,那么自變量矩陣 的正交變換可用 = 來(lái)表示。
本文編號(hào):3384812
本文鏈接:http://sikaile.net/guanlilunwen/shengchanguanlilunwen/3384812.html
最近更新
教材專著