數(shù)據(jù)驅(qū)動的產(chǎn)業(yè)集群廣義制造系統(tǒng)的產(chǎn)品綜合評價(jià)方法研究
發(fā)布時(shí)間:2021-02-20 07:13
隨著我國工業(yè)化進(jìn)程的推進(jìn),產(chǎn)業(yè)集群成為了中國經(jīng)濟(jì)發(fā)展的一個(gè)重要特征,集群成員之間建立了長期穩(wěn)定又不乏激烈競爭的協(xié)作關(guān)系,在促進(jìn)區(qū)域經(jīng)濟(jì)發(fā)展中發(fā)揮著越來越重要的作用。本文將產(chǎn)業(yè)集群看成一個(gè)為客戶群提供多樣化產(chǎn)品、滿足客戶個(gè)性化需求、具有動態(tài)靈活以及廣泛協(xié)同的業(yè)務(wù)組織模式。隨著經(jīng)濟(jì)的快速發(fā)展,人們生活水平不斷提高,消費(fèi)者對產(chǎn)品的需求越來越高,從大眾化、批量化逐漸向差異化、個(gè)性化、和多樣化發(fā)展。產(chǎn)品更新?lián)Q代的周期不斷縮短,對市場快速響應(yīng)能力要求越來越高。產(chǎn)品綜合評價(jià)對于制造業(yè)來說非常重要,是進(jìn)行產(chǎn)品優(yōu)化更新的重要依據(jù),然而評價(jià)信息的獲取和科學(xué)的評價(jià)模型是進(jìn)行產(chǎn)品優(yōu)化更新的最大障礙。在集群廣義制造系統(tǒng)中擁有豐富的集群數(shù)據(jù)可以利用,從冗雜的集群產(chǎn)品數(shù)據(jù)中挖掘有用的信息進(jìn)而轉(zhuǎn)化為知識并提供知識服務(wù)成為了重要的研究內(nèi)容。本文針對產(chǎn)品綜合評價(jià)中的信息獲取及評價(jià)方法問題,以文本挖掘技術(shù)為基礎(chǔ),運(yùn)用情感傾向分析技術(shù)和LDA主題模型算法進(jìn)行主題發(fā)現(xiàn)的研究,并將主題發(fā)現(xiàn)的結(jié)果應(yīng)用于產(chǎn)品評價(jià)的知識服務(wù)當(dāng)中,構(gòu)建了數(shù)據(jù)驅(qū)動的產(chǎn)業(yè)集群廣義制造系統(tǒng)的產(chǎn)品綜合評價(jià)模型,豐富原有的產(chǎn)品評價(jià)手段和評價(jià)方法。數(shù)據(jù)驅(qū)動的產(chǎn)品評...
【文章來源】:寧波大學(xué)浙江省
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
產(chǎn)業(yè)集群廣義制造系統(tǒng)概念模型
36不太準(zhǔn)確。比如“雷軍公司上市了”和“小米會不會漲價(jià)”,從字面上理解這兩個(gè)簡單的句子表達(dá)的意思是沒有任何聯(lián)系,所以按傳統(tǒng)方法來計(jì)算其相似度會很低,但是,結(jié)合情境,都知道這兩個(gè)句子是由一定相關(guān)性的。為此,LDA主題模型是較為有效的一種結(jié)合了文檔語義的文本挖掘算法。LDA主題模型由Blei等人于2003年提出,它是一種典型的詞袋模型(BagofWords,BOW),該模型具有三層結(jié)構(gòu),即文檔(D)、主題(Z)、詞項(xiàng)(W),能夠有效地對文本進(jìn)行建模,和傳統(tǒng)的向量空間模型(VSM)相比,增加了概率的信息。一片文檔由若干詞項(xiàng)組成且可以包含多個(gè)主題,每個(gè)主題下都有組成主題詞表的詞,將文本信息轉(zhuǎn)化為易于建模的數(shù)字信息為:D=(W1,W2,…,WN),C={D1,D2,…,DM},z={Z1,Z2,…,Zk}。其中N表示N個(gè)詞項(xiàng);M表示M篇文檔;C表示語料集;k表示主題個(gè)數(shù);z表示潛在的主題詞表。LDA對文本信息的主題建模如圖3.8所示,其中,是語料級別的狄利克雷函數(shù)的先驗(yàn)參數(shù),對任意一個(gè)文檔而言,只采樣一次,一般設(shè)置為經(jīng)驗(yàn)值。其中,變小,是盡可能讓同一個(gè)文檔只有一個(gè)主題,變小,是讓一個(gè)詞盡可能屬于同一個(gè)主題。是文檔級別的變量,每個(gè)文檔對應(yīng)一個(gè),也就是每個(gè)文檔產(chǎn)生各個(gè)主題Z的概率是不同的,因此生成每個(gè)文檔采樣一次。圖3.8LDA對文本信息的主題建模Fig.3.8ThememodelingofLDAfortextinformation
42理的R語言部分代碼如圖4.1所示。經(jīng)過數(shù)據(jù)清理層各個(gè)部分的清理工作后,抽取出有價(jià)值的產(chǎn)品評論語料,共計(jì)有9853條語料。圖4.1數(shù)據(jù)清理R語言部分代碼Fig.4.1Rlanguagecodeofdatacleaning4.3數(shù)據(jù)挖掘分析(1)產(chǎn)品特征提取對全系列的產(chǎn)品評論語料進(jìn)行文本數(shù)據(jù)處理,對詞性進(jìn)行識別,再對產(chǎn)品全系列評論語料庫進(jìn)行LDA主題分析并進(jìn)行詞頻統(tǒng)計(jì),根據(jù)不同主題的情況提取相關(guān)的特征詞,iF={無人機(jī),電池,包裝,信號,飛行,遙控器,質(zhì)量,北京,物流,降價(jià),返航,拍攝,飛行器,炸機(jī),禁飛區(qū),配件,發(fā)貨,續(xù)航,拍照,電量,遙控,云臺,配送,性價(jià)比,快遞,...}。結(jié)合無人機(jī)的用戶手冊說明,抽取自身產(chǎn)品特征jF={GPS,信號,天線,螺旋槳,電機(jī),起落架,電池,遙控器,云臺,相機(jī),視覺定位系統(tǒng),充電器},最終產(chǎn)品特征集合為ijFFF,在求并集的時(shí)候?qū)⒋硪粋(gè)意思的詞匯進(jìn)行合并,比如ijF={電池,續(xù)航,電量}={電池}。最后得到F={GPS,信號,天線,螺旋槳,電機(jī),起落架,電池,遙控器,云臺,相機(jī),視覺定位系統(tǒng),充電器,無人機(jī),包裝,飛行,質(zhì)量,北京,物流,降價(jià),飛行器,炸機(jī),禁飛區(qū),配件,性價(jià)比,...}。此外,編寫R語言程序用以繪制產(chǎn)品評論的詞云,通過繪制的詞云圖可以直觀地看出消費(fèi)者大致關(guān)注的產(chǎn)品的特征有哪些,如圖4.2所示,字體越大
【參考文獻(xiàn)】:
期刊論文
[1]基于Hadoop的醫(yī)療大數(shù)據(jù)智能輔助診療平臺的構(gòu)建[J]. 曾航齊,黃桂新,伍君賢,張武軍. 中國數(shù)字醫(yī)學(xué). 2018(09)
[2]基于大數(shù)據(jù)智能的競爭情報(bào)系統(tǒng)模型研究[J]. 唐曉波,鄭杜,翟夏普. 情報(bào)理論與實(shí)踐. 2018(11)
[3]基于產(chǎn)品形態(tài)美度的評價(jià)模型及應(yīng)用[J]. 蘇建寧,李明,周愛民,張書濤. 蘭州理工大學(xué)學(xué)報(bào). 2018(02)
[4]融合多源數(shù)據(jù)的智能配用電多時(shí)間尺度數(shù)據(jù)分析技術(shù)[J]. 劉廣一,周建其. 供用電. 2018(03)
[5]產(chǎn)業(yè)集群創(chuàng)新網(wǎng)絡(luò)中創(chuàng)新能力傳遞障礙與集群升級研究[J]. 赫連志巍,王嵐. 科技進(jìn)步與對策. 2018(03)
[6]基于產(chǎn)品評論的消費(fèi)者情感波動分析模型構(gòu)建及實(shí)證研究[J]. 林園園,戰(zhàn)洪飛,余軍合,李長江,張凡. 現(xiàn)代圖書情報(bào)技術(shù). 2016(11)
[7]地理鄰近、認(rèn)知鄰近對省際邊界區(qū)域經(jīng)濟(jì)協(xié)同發(fā)展影響機(jī)制研究——基于對中三角、長三角省際邊界區(qū)域的實(shí)證[J]. 李琳,曾巍. 華東經(jīng)濟(jì)管理. 2016(05)
[8]大數(shù)據(jù)在腫瘤預(yù)后預(yù)測中的應(yīng)用現(xiàn)狀和前景[J]. 劉文揚(yáng),金晶. 科學(xué)通報(bào). 2015(30)
[9]基于生態(tài)進(jìn)化理論的產(chǎn)業(yè)集群動態(tài)演化模型構(gòu)建[J]. 周婷. 統(tǒng)計(jì)與決策. 2015(12)
[10]智慧交通中的大數(shù)據(jù)應(yīng)用研究[J]. 王雅瓊,楊云鵬,樊重俊. 物流工程與管理. 2015(05)
博士論文
[1]基于復(fù)雜社會網(wǎng)絡(luò)的資源型企業(yè)綠色行為擴(kuò)散機(jī)制研究[D]. 郝祖濤.中國地質(zhì)大學(xué) 2014
[2]不確定環(huán)境下集群創(chuàng)新網(wǎng)絡(luò)合作度、開放度與集群增長績效的關(guān)系研究[D]. 王松.浙江工商大學(xué) 2013
碩士論文
[1]產(chǎn)品個(gè)性化需求轉(zhuǎn)換與模塊化設(shè)計(jì)評價(jià)研究及應(yīng)用[D]. 王玉豪.浙江大學(xué) 2018
[2]多功能包裝機(jī)設(shè)計(jì)質(zhì)量綜合評價(jià)系統(tǒng)研究[D]. 劉祎.中北大學(xué) 2016
[3]文本情感分析在產(chǎn)品評論中的應(yīng)用研究[D]. 魏慧玲.北京交通大學(xué) 2014
本文編號:3042429
【文章來源】:寧波大學(xué)浙江省
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
產(chǎn)業(yè)集群廣義制造系統(tǒng)概念模型
36不太準(zhǔn)確。比如“雷軍公司上市了”和“小米會不會漲價(jià)”,從字面上理解這兩個(gè)簡單的句子表達(dá)的意思是沒有任何聯(lián)系,所以按傳統(tǒng)方法來計(jì)算其相似度會很低,但是,結(jié)合情境,都知道這兩個(gè)句子是由一定相關(guān)性的。為此,LDA主題模型是較為有效的一種結(jié)合了文檔語義的文本挖掘算法。LDA主題模型由Blei等人于2003年提出,它是一種典型的詞袋模型(BagofWords,BOW),該模型具有三層結(jié)構(gòu),即文檔(D)、主題(Z)、詞項(xiàng)(W),能夠有效地對文本進(jìn)行建模,和傳統(tǒng)的向量空間模型(VSM)相比,增加了概率的信息。一片文檔由若干詞項(xiàng)組成且可以包含多個(gè)主題,每個(gè)主題下都有組成主題詞表的詞,將文本信息轉(zhuǎn)化為易于建模的數(shù)字信息為:D=(W1,W2,…,WN),C={D1,D2,…,DM},z={Z1,Z2,…,Zk}。其中N表示N個(gè)詞項(xiàng);M表示M篇文檔;C表示語料集;k表示主題個(gè)數(shù);z表示潛在的主題詞表。LDA對文本信息的主題建模如圖3.8所示,其中,是語料級別的狄利克雷函數(shù)的先驗(yàn)參數(shù),對任意一個(gè)文檔而言,只采樣一次,一般設(shè)置為經(jīng)驗(yàn)值。其中,變小,是盡可能讓同一個(gè)文檔只有一個(gè)主題,變小,是讓一個(gè)詞盡可能屬于同一個(gè)主題。是文檔級別的變量,每個(gè)文檔對應(yīng)一個(gè),也就是每個(gè)文檔產(chǎn)生各個(gè)主題Z的概率是不同的,因此生成每個(gè)文檔采樣一次。圖3.8LDA對文本信息的主題建模Fig.3.8ThememodelingofLDAfortextinformation
42理的R語言部分代碼如圖4.1所示。經(jīng)過數(shù)據(jù)清理層各個(gè)部分的清理工作后,抽取出有價(jià)值的產(chǎn)品評論語料,共計(jì)有9853條語料。圖4.1數(shù)據(jù)清理R語言部分代碼Fig.4.1Rlanguagecodeofdatacleaning4.3數(shù)據(jù)挖掘分析(1)產(chǎn)品特征提取對全系列的產(chǎn)品評論語料進(jìn)行文本數(shù)據(jù)處理,對詞性進(jìn)行識別,再對產(chǎn)品全系列評論語料庫進(jìn)行LDA主題分析并進(jìn)行詞頻統(tǒng)計(jì),根據(jù)不同主題的情況提取相關(guān)的特征詞,iF={無人機(jī),電池,包裝,信號,飛行,遙控器,質(zhì)量,北京,物流,降價(jià),返航,拍攝,飛行器,炸機(jī),禁飛區(qū),配件,發(fā)貨,續(xù)航,拍照,電量,遙控,云臺,配送,性價(jià)比,快遞,...}。結(jié)合無人機(jī)的用戶手冊說明,抽取自身產(chǎn)品特征jF={GPS,信號,天線,螺旋槳,電機(jī),起落架,電池,遙控器,云臺,相機(jī),視覺定位系統(tǒng),充電器},最終產(chǎn)品特征集合為ijFFF,在求并集的時(shí)候?qū)⒋硪粋(gè)意思的詞匯進(jìn)行合并,比如ijF={電池,續(xù)航,電量}={電池}。最后得到F={GPS,信號,天線,螺旋槳,電機(jī),起落架,電池,遙控器,云臺,相機(jī),視覺定位系統(tǒng),充電器,無人機(jī),包裝,飛行,質(zhì)量,北京,物流,降價(jià),飛行器,炸機(jī),禁飛區(qū),配件,性價(jià)比,...}。此外,編寫R語言程序用以繪制產(chǎn)品評論的詞云,通過繪制的詞云圖可以直觀地看出消費(fèi)者大致關(guān)注的產(chǎn)品的特征有哪些,如圖4.2所示,字體越大
【參考文獻(xiàn)】:
期刊論文
[1]基于Hadoop的醫(yī)療大數(shù)據(jù)智能輔助診療平臺的構(gòu)建[J]. 曾航齊,黃桂新,伍君賢,張武軍. 中國數(shù)字醫(yī)學(xué). 2018(09)
[2]基于大數(shù)據(jù)智能的競爭情報(bào)系統(tǒng)模型研究[J]. 唐曉波,鄭杜,翟夏普. 情報(bào)理論與實(shí)踐. 2018(11)
[3]基于產(chǎn)品形態(tài)美度的評價(jià)模型及應(yīng)用[J]. 蘇建寧,李明,周愛民,張書濤. 蘭州理工大學(xué)學(xué)報(bào). 2018(02)
[4]融合多源數(shù)據(jù)的智能配用電多時(shí)間尺度數(shù)據(jù)分析技術(shù)[J]. 劉廣一,周建其. 供用電. 2018(03)
[5]產(chǎn)業(yè)集群創(chuàng)新網(wǎng)絡(luò)中創(chuàng)新能力傳遞障礙與集群升級研究[J]. 赫連志巍,王嵐. 科技進(jìn)步與對策. 2018(03)
[6]基于產(chǎn)品評論的消費(fèi)者情感波動分析模型構(gòu)建及實(shí)證研究[J]. 林園園,戰(zhàn)洪飛,余軍合,李長江,張凡. 現(xiàn)代圖書情報(bào)技術(shù). 2016(11)
[7]地理鄰近、認(rèn)知鄰近對省際邊界區(qū)域經(jīng)濟(jì)協(xié)同發(fā)展影響機(jī)制研究——基于對中三角、長三角省際邊界區(qū)域的實(shí)證[J]. 李琳,曾巍. 華東經(jīng)濟(jì)管理. 2016(05)
[8]大數(shù)據(jù)在腫瘤預(yù)后預(yù)測中的應(yīng)用現(xiàn)狀和前景[J]. 劉文揚(yáng),金晶. 科學(xué)通報(bào). 2015(30)
[9]基于生態(tài)進(jìn)化理論的產(chǎn)業(yè)集群動態(tài)演化模型構(gòu)建[J]. 周婷. 統(tǒng)計(jì)與決策. 2015(12)
[10]智慧交通中的大數(shù)據(jù)應(yīng)用研究[J]. 王雅瓊,楊云鵬,樊重俊. 物流工程與管理. 2015(05)
博士論文
[1]基于復(fù)雜社會網(wǎng)絡(luò)的資源型企業(yè)綠色行為擴(kuò)散機(jī)制研究[D]. 郝祖濤.中國地質(zhì)大學(xué) 2014
[2]不確定環(huán)境下集群創(chuàng)新網(wǎng)絡(luò)合作度、開放度與集群增長績效的關(guān)系研究[D]. 王松.浙江工商大學(xué) 2013
碩士論文
[1]產(chǎn)品個(gè)性化需求轉(zhuǎn)換與模塊化設(shè)計(jì)評價(jià)研究及應(yīng)用[D]. 王玉豪.浙江大學(xué) 2018
[2]多功能包裝機(jī)設(shè)計(jì)質(zhì)量綜合評價(jià)系統(tǒng)研究[D]. 劉祎.中北大學(xué) 2016
[3]文本情感分析在產(chǎn)品評論中的應(yīng)用研究[D]. 魏慧玲.北京交通大學(xué) 2014
本文編號:3042429
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3042429.html
最近更新
教材專著