基于機(jī)器學(xué)習(xí)的租房軟件評(píng)論情感分析研究
發(fā)布時(shí)間:2024-03-16 22:52
隨著城鎮(zhèn)化的發(fā)展,房價(jià)水漲船高,越來越多的人選擇租房來解決自己的住房問題;ヂ(lián)網(wǎng)的發(fā)展和智能手機(jī)的普及,越來越多的租房軟件出現(xiàn)在人們的視野中,房屋租賃業(yè)務(wù)也開始由線下轉(zhuǎn)為線上。各大應(yīng)用商店都匯集著大量軟件的用戶評(píng)論,這些評(píng)論文本包含著眾多的情感和信息,對(duì)這些情感和信息進(jìn)行分析,具有豐富的商業(yè)價(jià)值和現(xiàn)實(shí)意義。本文基于租房軟件評(píng)論文本進(jìn)行情感分析,首先對(duì)用戶評(píng)論數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗、文本分詞以及去停用詞,基于情感詞典和人工標(biāo)注結(jié)合的方法對(duì)評(píng)論文本進(jìn)行標(biāo)注,通過word2vec獲取評(píng)論文本的詞向量表示。其次,對(duì)預(yù)處理之后的數(shù)據(jù)構(gòu)建情感傾向分類模型,分別構(gòu)建基于傳統(tǒng)機(jī)器學(xué)習(xí)算法的分類模型以及基于深度學(xué)習(xí)方法的分類模型。先后采用支持向量機(jī)、隨機(jī)森林、卷積神經(jīng)網(wǎng)絡(luò)、雙向長短時(shí)記憶網(wǎng)絡(luò)、BERT模型構(gòu)建情感分類模型并進(jìn)行模型評(píng)價(jià),最終選擇基于BERT的情感分類模型,其準(zhǔn)確率達(dá)到了89.6%,F1-socre為0.9034,AUC值為0.8783,能夠很好地完成對(duì)租房軟件用戶評(píng)論文本情感傾向的識(shí)別。最后,采用LDA主題模型對(duì)租房軟件用戶評(píng)論進(jìn)行文本挖掘,將數(shù)據(jù)集分為正面情感數(shù)據(jù)集和負(fù)面情感數(shù)據(jù)...
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文編號(hào):3930212
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1研究框架
本文的研究框架如圖1-1所示。2.1傳統(tǒng)機(jī)器學(xué)習(xí)相關(guān)算法
圖2-1支持向量機(jī)示意圖
其中w為法向量,b為截距,用(w,b)來表示劃分超平面,劃分超平面將特征空間劃分為兩側(cè),一側(cè)為正例,另一側(cè)為負(fù)例。當(dāng)訓(xùn)練樣本集線性可分時(shí),為了求解,使間隔最大化,則
圖2-2隨機(jī)森林算法流程圖
(4)隨機(jī)森林模型對(duì)測試集上的數(shù)據(jù)進(jìn)行預(yù)測,最后憑借“少數(shù)服從多數(shù)”的投票法得到最終的分類結(jié)果。2.2深度學(xué)習(xí)相關(guān)算法
圖2-3CBOW模型結(jié)構(gòu)示意圖
word2vec的模型訓(xùn)練有兩種方式,分別是連續(xù)詞袋模型(ContinuousBag-of-Words,CBOW)和Skip-Gram模型。CBOW模型的基本思想是向神經(jīng)網(wǎng)絡(luò)傳入上下文詞匯,然后預(yù)測目標(biāo)詞匯。CBOW模型結(jié)構(gòu)示意圖如圖2-3所示。圖中的Inputlayer表示....
本文編號(hào):3930212
本文鏈接:http://sikaile.net/jingjifazhanlunwen/3930212.html
最近更新
教材專著