基于深度學習的情感分類和聯(lián)合實體關系抽取實證研究
發(fā)布時間:2025-02-05 12:21
隨著“互聯(lián)網(wǎng)+旅游”的快速發(fā)展,我國在線預訂酒店規(guī)模迅速擴大。消費者能夠在酒店預訂平臺上發(fā)表自己的體驗和評價,成為用戶做出預訂決策和酒店管理人員做出管理決策、評估自身服務質量以及挖掘消費者需求的重要途徑。在酒店評論中,包含消費者對酒店服務質量評價的情感傾向,以及對具體評價對象的一個評價。對這些文本進行分析、處理、歸納和總結,對用戶分析、市場調查以及探索影響酒店服務質量影響因素有重要參考意義。本文對從攜程上收集的88家酒店,共104740條評論,進行情感分類和實體關系抽取,對文本進行情感分類,并抽取其中的評價對象和評價詞及其對應關系。對情感分類模型的構建,本文通過人工對評論進行情感標注,分為正面情感和負面情感,其中正負樣本比例為9:1,利用Focal Loss代替交叉熵作為情感分類模型的損失函數(shù),該損失函數(shù)能夠降低簡單樣本的權重,關注困難樣本的訓練。本文構建了三個不同網(wǎng)絡結構的模型,TextCNN擴展模型、混合神經網(wǎng)絡模型以及FastText模型進行集成學習,在單個模型中FastText模型表現(xiàn)最好,F值為0.8587,通過集成學習能夠將F值提高至0.9003,AUC...
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4029827
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
圖1-1研究框架圖
11第五章總結與展望。本章節(jié)對本文的研究內容、方法和研究結果進行總結。并闡述未來的工作研究方向。本文的研究框架圖如圖1-1所示:圖1-1研究框架圖1.4研究難點與可能的貢獻1.4.1研究難點(1)標注語料獲取難度大獲取評論語料是展開研究的關鍵。攜程攜程作為一個商業(yè)網(wǎng)站,其網(wǎng)站上的....
圖2-1卷積神經網(wǎng)絡結構
13第2章情感分類及聯(lián)合實體關系抽取理論基礎2.1情感分類模型2.1.1Text<sub>C</sub>NN模型Text<sub>C</sub>NN模型是Kim(2014)提出的模型,首次將卷積神經網(wǎng)絡模型應用在文本分類領域,利用不同size的kernel來識別句子中的信息,能夠....
圖2-2分層Softmax結構
17FastText由輸入層、隱含層、輸出層構成。輸入層是由向量表示的單詞,隱藏層是詞向量的平均,輸出層映射到所有類別中。FastText模型的輸入是多個單詞及其N-gram特征。Fasttext在輸入時使用字符級別的N-gram向量作為附加特征,使得語義特征更加完整,并采用分層....
圖2-3集成學習模型
19),...,,,(321nxxxxX),...,,,(321nyyyyY圖2-3集成學習模型2.2聯(lián)合實體關系抽取2.2.1序列標注實體識別是信息抽取關鍵任務,是指從文本序列中識別出有特定意義或者指代性強的實體,包括人名、地名、組織結構名、名詞等,本文中實體特指評價對象和評價....
本文編號:4029827
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4029827.html
最近更新
教材專著