基于深度學(xué)習(xí)的網(wǎng)絡(luò)熱點(diǎn)話題推薦研究
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1文本空間向量表示圖
沈陽工業(yè)大學(xué)碩士學(xué)位論文82.3文本特征表示文本特征表示就是將自然語言的數(shù)據(jù)信息根據(jù)一定規(guī)則轉(zhuǎn)化為可供計(jì)算機(jī)識(shí)別的數(shù)字化表示。文本特征表示是自然語言處理的核心技術(shù),目前被廣泛應(yīng)用在文本相似度分析、文本分類、文本聚類等眾多領(lǐng)域并取得良好的成績(jī)和發(fā)展。大多數(shù)針對(duì)熱點(diǎn)話題發(fā)現(xiàn)研究中通過....
圖2.2LDA模型向量矩陣圖
沈陽工業(yè)大學(xué)碩士學(xué)位論文10含多個(gè)主題詞,因此主題模型會(huì)自動(dòng)分析每個(gè)文檔,統(tǒng)計(jì)文檔內(nèi)的詞語,根據(jù)統(tǒng)計(jì)的信息來斷定當(dāng)前文檔含有哪些主題,以及每個(gè)主題所占的比例各為多少[18]。主題模型從誕生到現(xiàn)在發(fā)展迅速,至今在各領(lǐng)域被廣泛應(yīng)用。1999年,ThomasHofmann在其之上,發(fā)表....
圖2.3LDA主題模型圖
沈陽工業(yè)大學(xué)碩士學(xué)位論文10含多個(gè)主題詞,因此主題模型會(huì)自動(dòng)分析每個(gè)文檔,統(tǒng)計(jì)文檔內(nèi)的詞語,根據(jù)統(tǒng)計(jì)的信息來斷定當(dāng)前文檔含有哪些主題,以及每個(gè)主題所占的比例各為多少[18]。主題模型從誕生到現(xiàn)在發(fā)展迅速,至今在各領(lǐng)域被廣泛應(yīng)用。1999年,ThomasHofmann在其之上,發(fā)表....
圖2.4信息在神經(jīng)元間傳導(dǎo)過程
共同形成的。在這里,將定義為觀察變量,和z定義為隱藏變量。經(jīng)過反復(fù)迭代,直至結(jié)果收斂。主題模型雖然在大數(shù)據(jù)文本處理上,盡可能減少詞語對(duì)文本的表示,簡(jiǎn)化了計(jì)算并獲取了良好的成績(jī),然而主題模型本質(zhì)上仍屬于“詞袋模型”,無法避免忽略語義間聯(lián)系的問題,而且得到的文本比較稀疏,得到的文本特....
本文編號(hào):3971738
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3971738.html