基于數(shù)據(jù)挖掘的電子商務(wù)產(chǎn)品質(zhì)量風(fēng)險(xiǎn)輿情監(jiān)測(cè)技術(shù)研究
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的電子商務(wù)產(chǎn)品質(zhì)量風(fēng)險(xiǎn)輿情監(jiān)測(cè)技術(shù)研究
更多相關(guān)文章: 電子商務(wù) 文本分類(lèi) 特征降維 自編碼神經(jīng)網(wǎng)絡(luò) 極限學(xué)習(xí)機(jī)
【摘要】:近幾年來(lái)電子商務(wù)產(chǎn)業(yè)發(fā)展勢(shì)頭迅猛,由之產(chǎn)生的問(wèn)題也日益凸顯,一個(gè)重要的問(wèn)題是電子商務(wù)產(chǎn)品質(zhì)量。一些企業(yè)為了追求短期經(jīng)濟(jì)效益,生產(chǎn)假冒偽劣產(chǎn)品。風(fēng)險(xiǎn)輿情數(shù)據(jù)可以為質(zhì)監(jiān)部門(mén)解決電子商務(wù)產(chǎn)品質(zhì)量問(wèn)題提供風(fēng)向標(biāo),從而實(shí)現(xiàn)電子商務(wù)產(chǎn)品質(zhì)量問(wèn)題“準(zhǔn)確監(jiān)測(cè)、智能預(yù)警”。電子商務(wù)產(chǎn)品信息和評(píng)論作為風(fēng)險(xiǎn)輿情數(shù)據(jù)的一種,能夠集中反映出電子商務(wù)產(chǎn)品質(zhì)量問(wèn)題的趨勢(shì)走向,具有極大的參考價(jià)值。本文從文本分類(lèi)的角度入手,從數(shù)據(jù)挖掘領(lǐng)域出發(fā),結(jié)合文本表示模型、特征降維、分類(lèi)算法的設(shè)計(jì)和選擇等方面展開(kāi)研究,完成了以下工作及研究成果:(1)構(gòu)建電子商務(wù)產(chǎn)品信息和評(píng)論文本表示模型。產(chǎn)品信息和評(píng)論作為一種短文本,結(jié)構(gòu)復(fù)雜,計(jì)算機(jī)無(wú)法理解其語(yǔ)意,所以需要通過(guò)分詞、去停用詞等操作將其轉(zhuǎn)化為結(jié)構(gòu)化模型。為了方便統(tǒng)一地表示產(chǎn)品信息或評(píng)論內(nèi)容,引入VSM空間向量模型。模型中每一列表示一個(gè)樣本,每一行表示一個(gè)特征值,用0或1表示特征值的存在與否,那么所有非0的特征值就組成一條完整的文本信息,以便計(jì)算機(jī)識(shí)別存儲(chǔ)。(2)對(duì)電子商務(wù)產(chǎn)品信息和評(píng)論文本特征集進(jìn)行降維,提高分類(lèi)效率。即使去除標(biāo)點(diǎn)和停用詞,一條文本內(nèi)容包含的特征值依然很多,整個(gè)文本內(nèi)容特征集的規(guī)模會(huì)極大影響分類(lèi)算法的執(zhí)行。IG信息增益算法通過(guò)對(duì)特征值信息熵的排序剔除沒(méi)有貢獻(xiàn)的特征,可以對(duì)特征集進(jìn)行有閾值的選擇。(3)通過(guò)構(gòu)建快速自編碼神經(jīng)網(wǎng)絡(luò),使RELM能夠快速的計(jì)算隱含層節(jié)點(diǎn)權(quán)重,從而實(shí)現(xiàn)特征降維。原始的RELM正則化極限學(xué)習(xí)機(jī)常用于數(shù)據(jù)分類(lèi),將自編碼神經(jīng)網(wǎng)絡(luò)的原理應(yīng)用于RELM,使得改進(jìn)后的RELM實(shí)現(xiàn)特征提取的功能。自編碼神經(jīng)網(wǎng)絡(luò)繼承了RELM計(jì)算快速的優(yōu)點(diǎn),有效提高特征提取速度。(4)選擇分類(lèi)算法對(duì)電子商務(wù)產(chǎn)品質(zhì)量信息和評(píng)論數(shù)據(jù)進(jìn)行分類(lèi)。支持向量機(jī)在處理非線性數(shù)據(jù)方面的優(yōu)勢(shì)使得實(shí)驗(yàn)取得了較好結(jié)果,但是相對(duì)RELM,其分類(lèi)速度相對(duì)較差。實(shí)驗(yàn)結(jié)果表明,RELM在分類(lèi)效率要優(yōu)于SVM算法,分類(lèi)準(zhǔn)確率與SVM相當(dāng)。
【學(xué)位授予單位】:中國(guó)計(jì)量學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:F724.6;TP311.13;TP18
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 香麗蕓;淺談數(shù)據(jù)挖掘及其應(yīng)用[J];昌吉師專(zhuān)學(xué)報(bào);2001年02期
2 鄭雪燕,張杰明,岳洋;數(shù)據(jù)挖掘語(yǔ)言[J];計(jì)算機(jī)時(shí)代;2001年11期
3 劉明晶;數(shù)據(jù)挖掘[J];華南金融電腦;2001年04期
4 張偉;劉勇國(guó);彭軍;廖曉峰;吳中福;;數(shù)據(jù)挖掘發(fā)展研究[J];計(jì)算機(jī)科學(xué);2001年07期
5 鐘曉;馬少平;張鈸;俞瑞釗;;數(shù)據(jù)挖掘綜述[J];模式識(shí)別與人工智能;2001年01期
6 朱建平,張潤(rùn)楚;數(shù)據(jù)挖掘的發(fā)展及其特點(diǎn)[J];統(tǒng)計(jì)與決策;2002年07期
7 傅嵐;在數(shù)據(jù)海洋中打撈信息數(shù)據(jù)挖掘[J];科技廣場(chǎng);2002年11期
8 李峻;數(shù)據(jù)挖掘,企業(yè)洞察先機(jī)的“慧眼”[J];中國(guó)計(jì)算機(jī)用戶(hù);2002年48期
9 羅可,蔡碧野,卜勝賢,謝中科;數(shù)據(jù)挖掘及其發(fā)展研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年14期
10 ;2002數(shù)據(jù)挖掘研討班[J];計(jì)算機(jī)工程;2002年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 史東輝;蔡慶生;張春陽(yáng);;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年
2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國(guó)農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年
3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢(shì)[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年
4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——中國(guó)科協(xié)第五屆青年學(xué)術(shù)年會(huì)論文集[C];2004年
5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報(bào)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2004年
6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年
7 李菊;王軍;;數(shù)據(jù)挖掘在客戶(hù)關(guān)系管理的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
8 肖陽(yáng);李啟賢;;數(shù)據(jù)挖掘在中國(guó)鋼鐵行業(yè)中的應(yīng)用[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2012年會(huì)暨能源計(jì)量與節(jié)能降耗經(jīng)驗(yàn)交流會(huì)論文集[C];2012年
9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第二分冊(cè))[C];2009年
10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 本報(bào)記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日?qǐng)?bào);2002年
2 周蓉蓉;數(shù)據(jù)挖掘需要點(diǎn)想像力[N];計(jì)算機(jī)世界;2004年
3 □中國(guó)電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險(xiǎn)業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年
5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年
6 本報(bào)記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點(diǎn)[N];中國(guó)電子報(bào);2002年
7 本報(bào)記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國(guó)信息化新浪潮[N];中國(guó)電子報(bào);2003年
8 本報(bào)記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國(guó)旅游報(bào);2002年
9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭(zhēng)的基礎(chǔ)工程[N];解放軍報(bào);2005年
10 本報(bào)記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時(shí)報(bào);2002年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問(wèn)題研究[D];山東大學(xué);2015年
2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對(duì)與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 彭計(jì)紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學(xué);2015年
4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年
5 鄔文帥;基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評(píng)估與應(yīng)用[D];電子科技大學(xué);2015年
6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2010年
7 何偉全;云南高校學(xué)生意外傷害因素關(guān)聯(lián)規(guī)則挖掘及風(fēng)險(xiǎn)管控體系研究[D];昆明理工大學(xué);2015年
8 段功豪;基于多結(jié)構(gòu)數(shù)據(jù)挖掘的滑坡災(zāi)害預(yù)測(cè)模型研究[D];中國(guó)地質(zhì)大學(xué);2016年
9 白曉明;基于數(shù)據(jù)挖掘的復(fù)合材料宏—細(xì)觀力學(xué)模型研究[D];哈爾濱工業(yè)大學(xué);2016年
10 藍(lán)永豪(LAM Wing Ho);基于數(shù)據(jù)挖掘技術(shù)分析當(dāng)代中醫(yī)名家痤瘡驗(yàn)方經(jīng)驗(yàn)研究[D];南京中醫(yī)藥大學(xué);2016年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識(shí)別與評(píng)價(jià)研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年
2 張彥俊;游戲運(yùn)營(yíng)中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺(tái)設(shè)計(jì)[D];江南大學(xué);2015年
4 劉學(xué)建;數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];昆明理工大學(xué);2015年
5 戴陽(yáng)陽(yáng);基于數(shù)據(jù)挖掘的金融時(shí)間序列預(yù)測(cè)研究與應(yīng)用[D];江南大學(xué);2015年
6 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年
7 陳丹;移動(dòng)互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營(yíng)銷(xiāo)的設(shè)計(jì)與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年
8 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶(hù)識(shí)別模型的研究[D];昆明理工大學(xué);2015年
9 位長(zhǎng)帥;基于客戶(hù)數(shù)據(jù)挖掘的電信客戶(hù)關(guān)系管理研究[D];西南交通大學(xué);2015年
10 安康;基于數(shù)據(jù)挖掘的商業(yè)銀行客戶(hù)關(guān)系管理研究[D];蘭州交通大學(xué);2014年
,本文編號(hào):1277917
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/1277917.html