用于網(wǎng)絡(luò)輿情分析的深度學(xué)習(xí)自然語言處理系統(tǒng)
發(fā)布時(shí)間:2021-11-20 19:49
隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)社交信息爆炸式增長的同時(shí)也帶來了網(wǎng)絡(luò)輿情分析的問題。傳統(tǒng)的網(wǎng)絡(luò)輿情分析模式采用的是詞庫的方式,語料直接與詞庫進(jìn)行比對后進(jìn)行判斷。這種方式由于中文的復(fù)雜性,例如存在近音詞、同義詞、縮略詞、暗語等非規(guī)范中文表達(dá),使得輿情分析的效果不佳。結(jié)合深度學(xué)習(xí)來對語料進(jìn)行處理,可以有效的提高對非規(guī)范中文表達(dá)進(jìn)行分析時(shí)結(jié)果的準(zhǔn)確性。本文根據(jù)這一方法,深入研究基于深度學(xué)習(xí)的自然語言處理,以求在分析自然語言的詞相似性中得到更準(zhǔn)確的結(jié)果,并結(jié)合這一方法開發(fā)用于網(wǎng)絡(luò)輿情分析的深度學(xué)習(xí)自然語言處理系統(tǒng),本文研究內(nèi)容主要包括以下部分;趐ython的Scrapy網(wǎng)絡(luò)爬蟲研究。本系統(tǒng)將使用網(wǎng)絡(luò)爬蟲獲取網(wǎng)絡(luò)實(shí)時(shí)語料數(shù)據(jù)保證數(shù)據(jù)庫的時(shí)效性,通過這種方式可以有效的提高自然語言處理對非規(guī)范性語言的覆蓋程度,提高分析的效果;搭建語料數(shù)據(jù)庫服務(wù)器。本文在處理數(shù)據(jù)的過程中需要不斷地更新現(xiàn)有的語料庫,所以需要搭建語料數(shù)據(jù)庫用于存儲(chǔ)實(shí)時(shí)的語料數(shù)據(jù),并在數(shù)據(jù)庫中完成對語料數(shù)據(jù)的初步處理,通過正則表達(dá)式和分詞得到可以用于深度學(xué)習(xí)的數(shù)據(jù);基于TensorFlow的自然語言處理深度學(xué)習(xí)算法設(shè)計(jì)與實(shí)現(xiàn)。本文采用了一種...
【文章來源】:湖北工業(yè)大學(xué)湖北省
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
MySQL數(shù)據(jù)庫貼吧語料網(wǎng)絡(luò)爬蟲是為貼吧語料數(shù)據(jù)爬取而專門編寫的爬蟲程序,整個(gè)系統(tǒng)
湖北工業(yè)大學(xué)碩士學(xué)位論文33中兩詞相似度如圖4.4所示,其中包括兩個(gè)詞語的輸入框、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。語料分詞如圖4.5所示,其中包括一個(gè)語料輸入框、兩個(gè)選擇鍵、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。語料分詞如圖4.6所示,其中包括一個(gè)語料輸入框、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。軟件的工具欄包括兩個(gè)按鈕,一個(gè)是選項(xiàng)一個(gè)是幫助,這兩個(gè)按鈕點(diǎn)擊后如圖4.7,圖4.8所示顯示下拉菜單。圖4.4兩詞相似度標(biāo)簽頁圖4.5語料分詞標(biāo)簽頁圖4.6相似詞top5標(biāo)簽頁
湖北工業(yè)大學(xué)碩士學(xué)位論文33中兩詞相似度如圖4.4所示,其中包括兩個(gè)詞語的輸入框、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。語料分詞如圖4.5所示,其中包括一個(gè)語料輸入框、兩個(gè)選擇鍵、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。語料分詞如圖4.6所示,其中包括一個(gè)語料輸入框、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。軟件的工具欄包括兩個(gè)按鈕,一個(gè)是選項(xiàng)一個(gè)是幫助,這兩個(gè)按鈕點(diǎn)擊后如圖4.7,圖4.8所示顯示下拉菜單。圖4.4兩詞相似度標(biāo)簽頁圖4.5語料分詞標(biāo)簽頁圖4.6相似詞top5標(biāo)簽頁
【參考文獻(xiàn)】:
期刊論文
[1]基于HowNet的語義表示學(xué)習(xí)[J]. 朱靖雯,楊玉基,許斌,李涓子. 中文信息學(xué)報(bào). 2019(03)
[2]多種算法對不同中文文本分類效果比較研究[J]. 陳慧,田大鋼,馮成剛. 軟件導(dǎo)刊. 2019(05)
[3]基于How-net的詞語語義相似度算法[J]. 馬永起,韓德培,蒙立榮,余杰,程錚. 計(jì)算機(jī)工程. 2018(06)
[4]基于路徑與詞林編碼的詞語相似度計(jì)算方法[J]. 王松松,高偉勛,徐逸凡. 計(jì)算機(jī)工程. 2018(10)
[5]基于信息內(nèi)容的詞林詞語相似度計(jì)算[J]. 彭琦,朱新華,陳意山,孫柳,李飛. 計(jì)算機(jī)應(yīng)用研究. 2018(02)
[6]基于路徑與深度的同義詞詞林詞語相似度計(jì)算[J]. 陳宏朝,李飛,朱新華,馬潤聰. 中文信息學(xué)報(bào). 2016(05)
[7]HowNet與CCD映射方法研究[J]. 向春丞,穗志方,詹衛(wèi)東. 中文信息學(xué)報(bào). 2015(03)
[8]漢語語義選擇限制知識(shí)的自動(dòng)獲取研究[J]. 賈玉祥,王浩石,昝紅英,俞士汶,王治敏. 中文信息學(xué)報(bào). 2014(05)
[9]基于大規(guī)模語料庫的漢語詞義相似度計(jì)算方法[J]. 石靜,吳云芳,邱立坤,呂學(xué)強(qiáng). 中文信息學(xué)報(bào). 2013(01)
[10]基于詞林的詞語相似度的度量[J]. 呂立輝,梁維薇,冉蜀陽. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2013(01)
碩士論文
[1]詞語相似度計(jì)算及其在語義選擇限制知識(shí)獲取中的應(yīng)用研究[D]. 趙倩倩.鄭州大學(xué) 2018
本文編號(hào):3507999
【文章來源】:湖北工業(yè)大學(xué)湖北省
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
MySQL數(shù)據(jù)庫貼吧語料網(wǎng)絡(luò)爬蟲是為貼吧語料數(shù)據(jù)爬取而專門編寫的爬蟲程序,整個(gè)系統(tǒng)
湖北工業(yè)大學(xué)碩士學(xué)位論文33中兩詞相似度如圖4.4所示,其中包括兩個(gè)詞語的輸入框、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。語料分詞如圖4.5所示,其中包括一個(gè)語料輸入框、兩個(gè)選擇鍵、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。語料分詞如圖4.6所示,其中包括一個(gè)語料輸入框、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。軟件的工具欄包括兩個(gè)按鈕,一個(gè)是選項(xiàng)一個(gè)是幫助,這兩個(gè)按鈕點(diǎn)擊后如圖4.7,圖4.8所示顯示下拉菜單。圖4.4兩詞相似度標(biāo)簽頁圖4.5語料分詞標(biāo)簽頁圖4.6相似詞top5標(biāo)簽頁
湖北工業(yè)大學(xué)碩士學(xué)位論文33中兩詞相似度如圖4.4所示,其中包括兩個(gè)詞語的輸入框、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。語料分詞如圖4.5所示,其中包括一個(gè)語料輸入框、兩個(gè)選擇鍵、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。語料分詞如圖4.6所示,其中包括一個(gè)語料輸入框、一個(gè)顯示結(jié)果按鈕和一個(gè)結(jié)果顯示框。軟件的工具欄包括兩個(gè)按鈕,一個(gè)是選項(xiàng)一個(gè)是幫助,這兩個(gè)按鈕點(diǎn)擊后如圖4.7,圖4.8所示顯示下拉菜單。圖4.4兩詞相似度標(biāo)簽頁圖4.5語料分詞標(biāo)簽頁圖4.6相似詞top5標(biāo)簽頁
【參考文獻(xiàn)】:
期刊論文
[1]基于HowNet的語義表示學(xué)習(xí)[J]. 朱靖雯,楊玉基,許斌,李涓子. 中文信息學(xué)報(bào). 2019(03)
[2]多種算法對不同中文文本分類效果比較研究[J]. 陳慧,田大鋼,馮成剛. 軟件導(dǎo)刊. 2019(05)
[3]基于How-net的詞語語義相似度算法[J]. 馬永起,韓德培,蒙立榮,余杰,程錚. 計(jì)算機(jī)工程. 2018(06)
[4]基于路徑與詞林編碼的詞語相似度計(jì)算方法[J]. 王松松,高偉勛,徐逸凡. 計(jì)算機(jī)工程. 2018(10)
[5]基于信息內(nèi)容的詞林詞語相似度計(jì)算[J]. 彭琦,朱新華,陳意山,孫柳,李飛. 計(jì)算機(jī)應(yīng)用研究. 2018(02)
[6]基于路徑與深度的同義詞詞林詞語相似度計(jì)算[J]. 陳宏朝,李飛,朱新華,馬潤聰. 中文信息學(xué)報(bào). 2016(05)
[7]HowNet與CCD映射方法研究[J]. 向春丞,穗志方,詹衛(wèi)東. 中文信息學(xué)報(bào). 2015(03)
[8]漢語語義選擇限制知識(shí)的自動(dòng)獲取研究[J]. 賈玉祥,王浩石,昝紅英,俞士汶,王治敏. 中文信息學(xué)報(bào). 2014(05)
[9]基于大規(guī)模語料庫的漢語詞義相似度計(jì)算方法[J]. 石靜,吳云芳,邱立坤,呂學(xué)強(qiáng). 中文信息學(xué)報(bào). 2013(01)
[10]基于詞林的詞語相似度的度量[J]. 呂立輝,梁維薇,冉蜀陽. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2013(01)
碩士論文
[1]詞語相似度計(jì)算及其在語義選擇限制知識(shí)獲取中的應(yīng)用研究[D]. 趙倩倩.鄭州大學(xué) 2018
本文編號(hào):3507999
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3507999.html
最近更新
教材專著