天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于服裝網(wǎng)購(gòu)評(píng)論文本挖掘的情報(bào)研究

發(fā)布時(shí)間:2021-07-04 16:45
  隨著服裝行業(yè)與電子商務(wù)的緊密融合,服裝網(wǎng)購(gòu)已成為人們?nèi)粘I钪胁豢煞指畹囊徊糠?與此同時(shí)也產(chǎn)生了大量蘊(yùn)含消費(fèi)者反饋信息、極具情報(bào)研究?jī)r(jià)值的服裝網(wǎng)購(gòu)評(píng)論文本。然而這些評(píng)論數(shù)據(jù)體量龐大且信息繁雜,同時(shí)相比于其它商品,服裝網(wǎng)購(gòu)評(píng)論受消費(fèi)者個(gè)體差異影響較大,更易給出主觀且感性化的表達(dá),因此情報(bào)挖掘難度更大;诖吮疚牧⒆阌诜b網(wǎng)購(gòu)評(píng)論文本,引入文本挖掘技術(shù)從商品屬性情感分析和社會(huì)語(yǔ)義網(wǎng)絡(luò)分析兩個(gè)角度構(gòu)建情報(bào)研究模型并進(jìn)行具體實(shí)證分析。本文將從以下五個(gè)章節(jié)進(jìn)行闡述:第一章緒論主要闡述本文研究背景與意義、國(guó)內(nèi)外情報(bào)研究現(xiàn)狀、文本挖掘技術(shù)及其應(yīng)用現(xiàn)狀分析、研究?jī)?nèi)容和框架以及研究難點(diǎn)和結(jié)構(gòu)安排。第二章服裝網(wǎng)購(gòu)評(píng)論數(shù)據(jù)及文本挖掘技術(shù)概述。從服裝網(wǎng)購(gòu)評(píng)論數(shù)據(jù)研究與采集、預(yù)處理再到中文分詞、文本表示模型以及特征選擇對(duì)相關(guān)理論進(jìn)行具體概述。第三章提出基于商品屬性情感分析的服裝網(wǎng)購(gòu)評(píng)論情報(bào)研究模型,研究通過(guò)網(wǎng)絡(luò)爬蟲(chóng)獲取評(píng)論數(shù)據(jù),經(jīng)預(yù)處理后進(jìn)行word2vec模型訓(xùn)練,選取屬性種子詞進(jìn)行語(yǔ)義相似度計(jì)算擴(kuò)充特征屬性詞典,然后制定規(guī)則利用依存句法抽取屬性觀點(diǎn)詞組并進(jìn)行情感強(qiáng)度值計(jì)算,最終以具體的分值表現(xiàn)出消費(fèi)者對(duì)商品... 

【文章來(lái)源】:浙江理工大學(xué)浙江省

【文章頁(yè)數(shù)】:71 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于服裝網(wǎng)購(gòu)評(píng)論文本挖掘的情報(bào)研究


圖2.?6?CBOW模型結(jié)構(gòu)圖

面料


■mu??圖3.1面料相似詞計(jì)算??3.3屬性觀點(diǎn)詞組抽取??屬性觀點(diǎn)詞抽取一般有四種方法:詞頻共現(xiàn)法、機(jī)器學(xué)習(xí)法、主題模型法以及規(guī)則匹??配法。詞頻共現(xiàn)方法是在對(duì)評(píng)論語(yǔ)料進(jìn)行中文分詞詞性分析和詞頻統(tǒng)計(jì)工序后,設(shè)置適當(dāng)??的閾值大小對(duì)名詞及其相近的形容詞進(jìn)行篩選保留。機(jī)器學(xué)習(xí)算法抽取準(zhǔn)確率最好但其學(xué)??習(xí)訓(xùn)練過(guò)程需要花費(fèi)較多的精力去標(biāo)注語(yǔ)料,然后才能進(jìn)行迭代訓(xùn)練。主題模型則是通過(guò)??上下文于語(yǔ)義關(guān)系械率式生成相關(guān)度較高的主題。而規(guī)則匹配法一般會(huì)根據(jù)某種特性設(shè)置??相關(guān)關(guān)聯(lián)規(guī)則進(jìn)行匹配提取,目前在屬性觀點(diǎn)詞抽取方面較為常用的是利用依存句法對(duì)大??量評(píng)論進(jìn)行結(jié)構(gòu)分析并總結(jié)其主要句法路徑,并據(jù)此制定提取規(guī)則用于匹配提齲??經(jīng)過(guò)進(jìn)一步比較分析,詞頻共現(xiàn)方法在抽取效果上表現(xiàn)較差,不但會(huì)遺漏許多低頻有??效屬性,還會(huì)提取大量高頻無(wú)用屬性。機(jī)器學(xué)習(xí)算法原理較為復(fù)雜、難實(shí)現(xiàn)且需要有大量??的人工標(biāo)記費(fèi)時(shí)費(fèi)力。而主題模型提取個(gè)數(shù)難以確定且無(wú)監(jiān)督的文檔級(jí)概率式主題生成聚??類(lèi)結(jié)果不可保證。而基于依存句法規(guī)則提取在操作難度和準(zhǔn)確度方面均有一定的保障,其??在分析句法結(jié)構(gòu)基礎(chǔ)上制定規(guī)則模板進(jìn)行抽取,原理茼單易操作,抽取效果較之傳統(tǒng)提取??方法有了明顯改善但定義的模板一定程度上過(guò)于泛化,抽取后需要進(jìn)行過(guò)濾,因此本文在??分析句法結(jié)構(gòu)制定規(guī)則自動(dòng)化抽取屬性觀點(diǎn)詞對(duì)后,利用構(gòu)建的特征詞典和情感詞典進(jìn)行??匹配過(guò)濾,進(jìn)一步提高屬性觀點(diǎn)詞組抽取的精準(zhǔn)度。???表3.1屬性觀點(diǎn)詞組抽取方法比較分析???1取方法?優(yōu)缺點(diǎn)對(duì)比分析?^??詞頻共現(xiàn)法?原理簡(jiǎn)單易操作但抽取準(zhǔn)確度較差,不但會(huì)遺漏低頻有效屬性觀點(diǎn),還?? ̄22 ̄??

句法,超文本,語(yǔ)言,弧形


#上?an?2?和.?ts?內(nèi)?1?私多饞.?霉#?參黌?81?句太好????v?n?d?v?wp?f?*?v?r???m?i???t??????(?4?i??e??圖3.?2依存句法關(guān)系弧形表示圖??同時(shí),在LTP語(yǔ)言云平臺(tái)中,用戶(hù)使用超文本傳輸協(xié)議通過(guò)post向服務(wù)器提交請(qǐng)求,??服務(wù)器則會(huì)提供XML格式數(shù)據(jù)至服務(wù)端口。具體地,XML格式數(shù)據(jù)表示如下:??OI.?:?<?x?l?versionzi.0”?encodin丨■”utf-S”??>??C2.?<xml4nlp>??83.?<note?sent?"y”?word**?**?pos?-y"?ne__y"?parsersenp?rser?*n**?lstEis?*p?rser?_y-?srl^”y-*/>??OJ.?<doc>??35.?<p?ra?id?M0">??時(shí)-?<s?nt?i<J=T?c〇nt=■"芽上效果遷可以,S寬t*i格不值羝么多錢(qián),有點(diǎn)小責(zé),質(zhì)重不是太好?->??07.?<wcrd?id*"e-?cont?"^i"?pos-'V?n?-"uracfire<J"?parar.t?**l"?relate-*'ATT*?se?parent?*-l"?s?r.rilate*"Root">??05.?<s?j??id-?"ufKJ?fir>e〇"?pBrent-^S-?relate*"dExp"/>??&9.?i?</warc>??1?.?<?ord?i<S*"l"?cor?t*-5J[^*?pos-Mn"?ne-"undefinsd"?parent^'S-?reiate-"SBV"?scttpzrtnt""Q"?se

【參考文獻(xiàn)】:
期刊論文
[1]電商領(lǐng)域中有關(guān)物流評(píng)價(jià)中文分詞的研究[J]. 鐘靜晨,祁云嵩.  計(jì)算機(jī)與數(shù)字工程. 2019(11)
[2]基于風(fēng)險(xiǎn)生命周期的企業(yè)反競(jìng)爭(zhēng)情報(bào)機(jī)制模型構(gòu)建[J]. 楊波,孫白朋.  現(xiàn)代情報(bào). 2019(11)
[3]基于HMM的算法優(yōu)化在中文分詞中的應(yīng)用[J]. 朱咸軍,洪宇,黃雅琳,張馨予,肖芳雄.  金陵科技學(xué)院學(xué)報(bào). 2019(03)
[4]基于關(guān)鍵詞共現(xiàn)和社會(huì)網(wǎng)絡(luò)分析法的我國(guó)企業(yè)競(jìng)爭(zhēng)情報(bào)熱點(diǎn)主題研究[J]. 賈旭楠.  情報(bào)探索. 2019(08)
[5]基于改進(jìn)遺傳算法-神經(jīng)網(wǎng)絡(luò)的玄武巖構(gòu)造環(huán)境判別及對(duì)比實(shí)驗(yàn)[J]. 任秋兵,李明超,韓帥.  地學(xué)前緣. 2019(04)
[6]基于改進(jìn)的TF-IDF與隱樸素貝葉斯的情感分類(lèi)研究[J]. 李曉東,肖基毅,鄒銀鳳.  南華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[7]基于在線評(píng)論文本挖掘的商業(yè)競(jìng)爭(zhēng)情報(bào)分析模型構(gòu)建及應(yīng)用[J]. 張振華,許柏鳴.  情報(bào)科學(xué). 2019(02)
[8]社會(huì)網(wǎng)絡(luò)分析方法在情報(bào)分析中的應(yīng)用研究[J]. 陳云偉.  情報(bào)學(xué)報(bào). 2019(01)
[9]基于共詞分析的我國(guó)服裝學(xué)科研究熱點(diǎn)可視化分析[J]. 任佩萱.  金融經(jīng)濟(jì). 2018(22)
[10]反恐情報(bào)信息工作能力的體系框架研究[J]. 安璐,吳燕珠,李綱.  圖書(shū)館學(xué)研究. 2018(17)

博士論文
[1]基于在線評(píng)論的網(wǎng)絡(luò)口碑生成機(jī)理及監(jiān)測(cè)預(yù)警研究[D]. 彭麗徽.吉林大學(xué) 2019
[2]面向醫(yī)藥企業(yè)的專(zhuān)利威脅預(yù)警模型構(gòu)建及實(shí)證研究[D]. 張世玉.吉林大學(xué) 2018

碩士論文
[1]基于機(jī)器學(xué)習(xí)的惡意網(wǎng)址識(shí)別方法的研究與發(fā)現(xiàn)[D]. 張慧.北京建筑大學(xué) 2019
[2]系統(tǒng)論視野下的美國(guó)戰(zhàn)爭(zhēng)決策過(guò)程分析[D]. 申楊.延邊大學(xué) 2018
[3]電商空調(diào)產(chǎn)品的評(píng)論數(shù)據(jù)情感分析[D]. 楊瑞欣.山西大學(xué) 2017
[4]基于詞典與統(tǒng)計(jì)結(jié)合的中文分詞方法研究及全文檢索系統(tǒng)設(shè)計(jì)[D]. 周世宇.華中師范大學(xué) 2017
[5]基于文本數(shù)據(jù)挖掘技術(shù)的用戶(hù)需求分析研究[D]. 李玉博.哈爾濱工程大學(xué) 2017
[6]基于用戶(hù)評(píng)價(jià)的企業(yè)競(jìng)爭(zhēng)情報(bào)社會(huì)網(wǎng)絡(luò)分析[D]. 徐萌.山東科技大學(xué) 2017
[7]中文分詞算法的研究與實(shí)現(xiàn)[D]. 秦贊.吉林大學(xué) 2016
[8]正面在線評(píng)論對(duì)服裝消費(fèi)者購(gòu)買(mǎi)意愿影響的實(shí)證研究[D]. 韓立娜.東北大學(xué) 2013



本文編號(hào):3265159

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3265159.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)7ded1***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com