短文本主題信息挖掘技術(shù)研究
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1詞向量空間示意圖
第2章相關(guān)理論與技術(shù)9的部分詞向量的空間示意圖。圖2.1詞向量空間示意圖Fig.2.1Schematicdiagramofwordvectorspace圖中數(shù)據(jù)是通過(guò)大量文本作為訓(xùn)練數(shù)據(jù),訓(xùn)練得出的結(jié)果[21]。從圖中可以看出,詞語(yǔ)的語(yǔ)義相關(guān)程度大,或者詞語(yǔ)在句子中常用位置相同,....
圖2.2CBOW模型
第2章相關(guān)理論與技術(shù)11泛的應(yīng)用[44]。對(duì)于訓(xùn)練模型中的輸入和輸出有兩種,分為CBOW(ContinuousBag-of-Words)模型和Skip-Gram模型,如圖2.2~圖2.3所示。圖2.2CBOW模型Fig.2.2CBOWmodel其中,w(t-2)、w(t-1)、w....
圖2.3Skip-Gram模型
第2章相關(guān)理論與技術(shù)11泛的應(yīng)用[44]。對(duì)于訓(xùn)練模型中的輸入和輸出有兩種,分為CBOW(ContinuousBag-of-Words)模型和Skip-Gram模型,如圖2.2~圖2.3所示。圖2.2CBOW模型Fig.2.2CBOWmodel其中,w(t-2)、w(t-1)、w....
圖2.4LDA概率圖模型
第2章相關(guān)理論與技術(shù)13圖2.4LDA概率圖模型Fig.2.4LDAprobabilitygraphmodel其中α、β為計(jì)算共軛分布的超參數(shù),Z表示“主題-詞”的分布情況,其維度為K,w表示文檔中的觀察詞語(yǔ),d表示文檔,其維度為D,文檔d的主題分布和主題維度K的詞匯分布分別為θ....
本文編號(hào):3980024
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3980024.html