基于在線(xiàn)評(píng)論數(shù)據(jù)的產(chǎn)品優(yōu)化輔助決策信息獲取方法與技術(shù)研究
發(fā)布時(shí)間:2021-01-30 19:24
在網(wǎng)絡(luò)數(shù)據(jù)化時(shí)代,隨著個(gè)性化、全球化市場(chǎng)競(jìng)爭(zhēng)的加劇,顧客的評(píng)論信息對(duì)企業(yè)的經(jīng)營(yíng)管理具有非常重要的價(jià)值,對(duì)于產(chǎn)品更新升級(jí)具有重要意義。企業(yè)可以根據(jù)顧客的評(píng)論信息更好地了解顧客需求及其變化趨勢(shì),得到產(chǎn)品質(zhì)量、產(chǎn)品不足等反饋信息,從而能夠有針對(duì)性的對(duì)產(chǎn)品進(jìn)行優(yōu)化升級(jí)。但目前的在線(xiàn)評(píng)論數(shù)據(jù)多為非結(jié)構(gòu)化數(shù)據(jù),為了能夠獲取評(píng)論中與產(chǎn)品相關(guān)的重要信息,本論文利用深度學(xué)習(xí)和機(jī)器學(xué)習(xí)相關(guān)技術(shù),對(duì)評(píng)論中產(chǎn)品優(yōu)化信息的獲取進(jìn)行深入研究,提出了基于評(píng)論數(shù)據(jù)的產(chǎn)品優(yōu)化策略,旨在為企業(yè)提供優(yōu)化決策參考。論文的研究工作主要包括以下幾個(gè)方面:提出了一種基于評(píng)論數(shù)據(jù)的顧客需求獲取和評(píng)估的技術(shù)和方法。首先通過(guò)TF+詞向量的方法從在線(xiàn)評(píng)論中提取出產(chǎn)品的特征要素;然后結(jié)合產(chǎn)品特征挖掘和語(yǔ)義分析的方法對(duì)顧客表述的需求進(jìn)行結(jié)構(gòu)化表達(dá);接著通過(guò)定性和定量分析的方法對(duì)顧客需求的重要性進(jìn)行評(píng)估;最后根據(jù)實(shí)例分析結(jié)果發(fā)現(xiàn),該方法具有較好的效果,能夠有效地對(duì)顧客需求獲取和評(píng)估,發(fā)現(xiàn)重要的顧客意見(jiàn)。文章將顧客評(píng)論數(shù)據(jù)用于產(chǎn)品的優(yōu)化中,為產(chǎn)品優(yōu)化提供一種新的數(shù)據(jù)支撐,提高決策的科學(xué)性。提出了一種基于評(píng)論信息的顧客需求的發(fā)展趨勢(shì)分析和應(yīng)用方法,...
【文章來(lái)源】:寧波大學(xué)浙江省
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
大論文研究框架
寧波大學(xué)碩士學(xué)位論文-11-TF-IDF總的算法為IDFTFIDFTF*,優(yōu)點(diǎn)是快速高效,通過(guò)算法模型可以過(guò)濾掉一些通用的詞匯,找到真正代表文檔的專(zhuān)屬詞匯,其分析結(jié)果一般復(fù)合實(shí)際;缺點(diǎn)是它可能高估了一些低頻詞的重要性。2.4詞向量模型數(shù)據(jù)分析的第四步為向量化表示,詞向量是文本數(shù)據(jù)連接機(jī)器學(xué)習(xí)的橋梁,通過(guò)對(duì)文本向量化的表示可以利用機(jī)器學(xué)習(xí)的相關(guān)算法進(jìn)行分析,使得文本的分析更加的多元化。由于稀疏表示法的弊端太明顯,近代提出了低維空間表示法,不僅消除了維數(shù)災(zāi)難,還可以進(jìn)行一步挖掘詞間的關(guān)聯(lián)關(guān)系,且在語(yǔ)義上有較高的準(zhǔn)確性。其中最為流行的為Word2vec和Doc2vec模型,它們都是基于深度學(xué)習(xí)的向量模型,可以對(duì)大規(guī)模數(shù)據(jù)進(jìn)行分析,具有非常優(yōu)秀的向量表示效果。2.4.1Word2vec模型Word2vec可以將詞表示成數(shù)值向量的算法模型,可以把詞投影到n維向量空間,這時(shí)詞的特征通過(guò)n維向量表示,詞在n維空間的距離表現(xiàn)了詞間的語(yǔ)義相似關(guān)系。模型是由三層的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),通過(guò)神經(jīng)網(wǎng)絡(luò)本質(zhì)上是對(duì)語(yǔ)言模型建模,另外也獲得詞在n維向量空間的表示方法,從而實(shí)現(xiàn)了特征選擇[50]。Word2vec的構(gòu)建方式:CBOW和Skip-gram。CBOW是詞袋模型的一種,用來(lái)計(jì)算當(dāng)前詞出現(xiàn)的幾率,通過(guò)詞的前后若干詞來(lái)計(jì)算。而Skip-gram則是依據(jù)當(dāng)前詞計(jì)算其前后詞出現(xiàn)的幾率,如下圖2.1所示[50]。圖2.1Word2vec模型原理圖Fig.2.1Word2vecModelSchematic
寧波大學(xué)碩士學(xué)位論文-15-顧客滿(mǎn)意情況。(4)顧客意見(jiàn)的提齲本章通過(guò)語(yǔ)義分析的方式對(duì)評(píng)論進(jìn)行分析,挖掘顧客對(duì)商品和服務(wù)維度的具體意見(jiàn)。(5)顧客意見(jiàn)的評(píng)估。對(duì)顧客意見(jiàn)提取后需要對(duì)顧客意見(jiàn)進(jìn)行評(píng)估,識(shí)別出真正有用的意見(jiàn),生成產(chǎn)品優(yōu)化信息,輔助優(yōu)化決策。圖3.1基于評(píng)論數(shù)據(jù)的顧客需求提取流程Fig.3.1CustomerRequirementExtractionProcessBasedonCommentData3.2在線(xiàn)評(píng)論中顧客需求獲取的技術(shù)研究3.2.1數(shù)據(jù)的抓取和預(yù)處理本章節(jié)通過(guò)python編寫(xiě)代碼爬取電商網(wǎng)站評(píng)論數(shù)據(jù)(見(jiàn)2.1章節(jié))進(jìn)行分析,爬取的數(shù)據(jù)一般為非結(jié)構(gòu)化的數(shù)據(jù)且含有大量與用戶(hù)觀點(diǎn)態(tài)度無(wú)關(guān)的信息,需要進(jìn)行預(yù)處理變成可用于分析的數(shù)據(jù),通過(guò)去重、分詞、分句(見(jiàn)2.2章節(jié)),轉(zhuǎn)化為本章節(jié)分析的數(shù)據(jù)類(lèi)型。3.2.2在線(xiàn)評(píng)論的產(chǎn)品特征選取和詞庫(kù)構(gòu)建通過(guò)對(duì)評(píng)論中各詞的內(nèi)容特征進(jìn)行分析,發(fā)現(xiàn)評(píng)論中與產(chǎn)品相關(guān)性較強(qiáng)的特征詞可分為產(chǎn)品特征、服務(wù)特征和情感表達(dá)三類(lèi)。產(chǎn)品和服務(wù)特征為顧客較為關(guān)注的產(chǎn)品或服務(wù)屬性,可以分析顧客對(duì)產(chǎn)品的關(guān)注點(diǎn)[59-60]。文章的特征提取方法為T(mén)F+Word2vec,通過(guò)TF(見(jiàn)2.3.3章節(jié))篩選出主要的產(chǎn)品和服務(wù)屬性,并通過(guò)詞云圖
【參考文獻(xiàn)】:
期刊論文
[1]基于猶豫模糊廣義Choquet積分的風(fēng)險(xiǎn)型供應(yīng)商選擇方法[J]. 張永政,葉春明,耿秀麗,王世磊. 工業(yè)工程與管理. 2019(04)
[2]大數(shù)據(jù)視域下的網(wǎng)絡(luò)輿情決策創(chuàng)新[J]. 周偉. 情報(bào)雜志. 2019(05)
[3]基于信息熵-VIKOR模型的4PL供應(yīng)商優(yōu)選決策研究[J]. 李民,姚建明,吳陽(yáng),張恒. 工業(yè)技術(shù)經(jīng)濟(jì). 2019(03)
[4]基于字符型屬性值更新的動(dòng)態(tài)三支決策模型[J]. 張清華,呂功勛,陳玉洪,謝秦. 電子學(xué)報(bào). 2019(02)
[5]結(jié)合詞性、位置和單詞情感的內(nèi)存網(wǎng)絡(luò)的方面情感分析[J]. 王行甫,王磊,苗付友,邵晨曦. 小型微型計(jì)算機(jī)系統(tǒng). 2019(02)
[6]基于有用性排序的在線(xiàn)評(píng)論與銷(xiāo)量的關(guān)系研究[J]. 張夢(mèng)瑩,鄧三鴻,王昊,王麗娟. 現(xiàn)代情報(bào). 2019(02)
[7]互聯(lián)網(wǎng)使用、就業(yè)決策與就業(yè)質(zhì)量——基于CGSS數(shù)據(jù)的經(jīng)驗(yàn)證據(jù)[J]. 毛宇飛,曾湘泉,祝慧琳. 經(jīng)濟(jì)理論與經(jīng)濟(jì)管理. 2019(01)
[8]基于LDA模型的公眾反饋意見(jiàn)采納研究——共享單車(chē)政策修訂與數(shù)據(jù)挖掘的對(duì)比分析[J]. 楊奕,張毅,李梅,鄧雯. 情報(bào)科學(xué). 2019(01)
[9]“數(shù)據(jù)-智慧”決策模型:基于大數(shù)據(jù)的理論構(gòu)建研究[J]. 邱國(guó)棟,王易. 中國(guó)軟科學(xué). 2018(12)
[10]在線(xiàn)評(píng)論對(duì)沖動(dòng)性移動(dòng)購(gòu)物意愿的影響研究[J]. 何軍紅,杜尚蓉,李仲香. 當(dāng)代經(jīng)濟(jì)管理. 2019(05)
博士論文
[1]大數(shù)據(jù)的社會(huì)價(jià)值與戰(zhàn)略選擇[D]. 張?zhí)m廷.中共中央黨校 2014
碩士論文
[1]基于特征細(xì)分的中文情感分析研究[D]. 陳慧.上海師范大學(xué) 2018
[2]基于Scrapy框架的網(wǎng)絡(luò)爬蟲(chóng)實(shí)現(xiàn)與數(shù)據(jù)抓取分析[D]. 安子建.吉林大學(xué) 2017
[3]產(chǎn)品概念設(shè)計(jì)過(guò)程中面向用戶(hù)需求的優(yōu)化分析及評(píng)價(jià)[D]. 嚴(yán)海峰.東華大學(xué) 2016
本文編號(hào):3009454
【文章來(lái)源】:寧波大學(xué)浙江省
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
大論文研究框架
寧波大學(xué)碩士學(xué)位論文-11-TF-IDF總的算法為IDFTFIDFTF*,優(yōu)點(diǎn)是快速高效,通過(guò)算法模型可以過(guò)濾掉一些通用的詞匯,找到真正代表文檔的專(zhuān)屬詞匯,其分析結(jié)果一般復(fù)合實(shí)際;缺點(diǎn)是它可能高估了一些低頻詞的重要性。2.4詞向量模型數(shù)據(jù)分析的第四步為向量化表示,詞向量是文本數(shù)據(jù)連接機(jī)器學(xué)習(xí)的橋梁,通過(guò)對(duì)文本向量化的表示可以利用機(jī)器學(xué)習(xí)的相關(guān)算法進(jìn)行分析,使得文本的分析更加的多元化。由于稀疏表示法的弊端太明顯,近代提出了低維空間表示法,不僅消除了維數(shù)災(zāi)難,還可以進(jìn)行一步挖掘詞間的關(guān)聯(lián)關(guān)系,且在語(yǔ)義上有較高的準(zhǔn)確性。其中最為流行的為Word2vec和Doc2vec模型,它們都是基于深度學(xué)習(xí)的向量模型,可以對(duì)大規(guī)模數(shù)據(jù)進(jìn)行分析,具有非常優(yōu)秀的向量表示效果。2.4.1Word2vec模型Word2vec可以將詞表示成數(shù)值向量的算法模型,可以把詞投影到n維向量空間,這時(shí)詞的特征通過(guò)n維向量表示,詞在n維空間的距離表現(xiàn)了詞間的語(yǔ)義相似關(guān)系。模型是由三層的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),通過(guò)神經(jīng)網(wǎng)絡(luò)本質(zhì)上是對(duì)語(yǔ)言模型建模,另外也獲得詞在n維向量空間的表示方法,從而實(shí)現(xiàn)了特征選擇[50]。Word2vec的構(gòu)建方式:CBOW和Skip-gram。CBOW是詞袋模型的一種,用來(lái)計(jì)算當(dāng)前詞出現(xiàn)的幾率,通過(guò)詞的前后若干詞來(lái)計(jì)算。而Skip-gram則是依據(jù)當(dāng)前詞計(jì)算其前后詞出現(xiàn)的幾率,如下圖2.1所示[50]。圖2.1Word2vec模型原理圖Fig.2.1Word2vecModelSchematic
寧波大學(xué)碩士學(xué)位論文-15-顧客滿(mǎn)意情況。(4)顧客意見(jiàn)的提齲本章通過(guò)語(yǔ)義分析的方式對(duì)評(píng)論進(jìn)行分析,挖掘顧客對(duì)商品和服務(wù)維度的具體意見(jiàn)。(5)顧客意見(jiàn)的評(píng)估。對(duì)顧客意見(jiàn)提取后需要對(duì)顧客意見(jiàn)進(jìn)行評(píng)估,識(shí)別出真正有用的意見(jiàn),生成產(chǎn)品優(yōu)化信息,輔助優(yōu)化決策。圖3.1基于評(píng)論數(shù)據(jù)的顧客需求提取流程Fig.3.1CustomerRequirementExtractionProcessBasedonCommentData3.2在線(xiàn)評(píng)論中顧客需求獲取的技術(shù)研究3.2.1數(shù)據(jù)的抓取和預(yù)處理本章節(jié)通過(guò)python編寫(xiě)代碼爬取電商網(wǎng)站評(píng)論數(shù)據(jù)(見(jiàn)2.1章節(jié))進(jìn)行分析,爬取的數(shù)據(jù)一般為非結(jié)構(gòu)化的數(shù)據(jù)且含有大量與用戶(hù)觀點(diǎn)態(tài)度無(wú)關(guān)的信息,需要進(jìn)行預(yù)處理變成可用于分析的數(shù)據(jù),通過(guò)去重、分詞、分句(見(jiàn)2.2章節(jié)),轉(zhuǎn)化為本章節(jié)分析的數(shù)據(jù)類(lèi)型。3.2.2在線(xiàn)評(píng)論的產(chǎn)品特征選取和詞庫(kù)構(gòu)建通過(guò)對(duì)評(píng)論中各詞的內(nèi)容特征進(jìn)行分析,發(fā)現(xiàn)評(píng)論中與產(chǎn)品相關(guān)性較強(qiáng)的特征詞可分為產(chǎn)品特征、服務(wù)特征和情感表達(dá)三類(lèi)。產(chǎn)品和服務(wù)特征為顧客較為關(guān)注的產(chǎn)品或服務(wù)屬性,可以分析顧客對(duì)產(chǎn)品的關(guān)注點(diǎn)[59-60]。文章的特征提取方法為T(mén)F+Word2vec,通過(guò)TF(見(jiàn)2.3.3章節(jié))篩選出主要的產(chǎn)品和服務(wù)屬性,并通過(guò)詞云圖
【參考文獻(xiàn)】:
期刊論文
[1]基于猶豫模糊廣義Choquet積分的風(fēng)險(xiǎn)型供應(yīng)商選擇方法[J]. 張永政,葉春明,耿秀麗,王世磊. 工業(yè)工程與管理. 2019(04)
[2]大數(shù)據(jù)視域下的網(wǎng)絡(luò)輿情決策創(chuàng)新[J]. 周偉. 情報(bào)雜志. 2019(05)
[3]基于信息熵-VIKOR模型的4PL供應(yīng)商優(yōu)選決策研究[J]. 李民,姚建明,吳陽(yáng),張恒. 工業(yè)技術(shù)經(jīng)濟(jì). 2019(03)
[4]基于字符型屬性值更新的動(dòng)態(tài)三支決策模型[J]. 張清華,呂功勛,陳玉洪,謝秦. 電子學(xué)報(bào). 2019(02)
[5]結(jié)合詞性、位置和單詞情感的內(nèi)存網(wǎng)絡(luò)的方面情感分析[J]. 王行甫,王磊,苗付友,邵晨曦. 小型微型計(jì)算機(jī)系統(tǒng). 2019(02)
[6]基于有用性排序的在線(xiàn)評(píng)論與銷(xiāo)量的關(guān)系研究[J]. 張夢(mèng)瑩,鄧三鴻,王昊,王麗娟. 現(xiàn)代情報(bào). 2019(02)
[7]互聯(lián)網(wǎng)使用、就業(yè)決策與就業(yè)質(zhì)量——基于CGSS數(shù)據(jù)的經(jīng)驗(yàn)證據(jù)[J]. 毛宇飛,曾湘泉,祝慧琳. 經(jīng)濟(jì)理論與經(jīng)濟(jì)管理. 2019(01)
[8]基于LDA模型的公眾反饋意見(jiàn)采納研究——共享單車(chē)政策修訂與數(shù)據(jù)挖掘的對(duì)比分析[J]. 楊奕,張毅,李梅,鄧雯. 情報(bào)科學(xué). 2019(01)
[9]“數(shù)據(jù)-智慧”決策模型:基于大數(shù)據(jù)的理論構(gòu)建研究[J]. 邱國(guó)棟,王易. 中國(guó)軟科學(xué). 2018(12)
[10]在線(xiàn)評(píng)論對(duì)沖動(dòng)性移動(dòng)購(gòu)物意愿的影響研究[J]. 何軍紅,杜尚蓉,李仲香. 當(dāng)代經(jīng)濟(jì)管理. 2019(05)
博士論文
[1]大數(shù)據(jù)的社會(huì)價(jià)值與戰(zhàn)略選擇[D]. 張?zhí)m廷.中共中央黨校 2014
碩士論文
[1]基于特征細(xì)分的中文情感分析研究[D]. 陳慧.上海師范大學(xué) 2018
[2]基于Scrapy框架的網(wǎng)絡(luò)爬蟲(chóng)實(shí)現(xiàn)與數(shù)據(jù)抓取分析[D]. 安子建.吉林大學(xué) 2017
[3]產(chǎn)品概念設(shè)計(jì)過(guò)程中面向用戶(hù)需求的優(yōu)化分析及評(píng)價(jià)[D]. 嚴(yán)海峰.東華大學(xué) 2016
本文編號(hào):3009454
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3009454.html
最近更新
教材專(zhuān)著