深度學(xué)習(xí)在社交網(wǎng)絡(luò)文本分類中的應(yīng)用研究
發(fā)布時(shí)間:2020-12-11 11:50
近年來,伴隨著互聯(lián)網(wǎng)產(chǎn)業(yè)的迅猛發(fā)展,計(jì)算機(jī)硬件端的普及,尤其是智能手機(jī)的流行,讓移動(dòng)互聯(lián)網(wǎng)端的產(chǎn)業(yè)井噴式發(fā)展,移動(dòng)流量資費(fèi)的下降,WiFi等硬件設(shè)施的覆蓋,使得網(wǎng)民數(shù)量呈幾何倍數(shù)式上升,網(wǎng)民年齡段基本涵蓋了從小學(xué)生到青年中年老年人的全段式人群。淘寶、京東以及國(guó)外的亞馬遜等電商購(gòu)物平臺(tái)的興起,以微博、微信、以及國(guó)外的Twitter、Facebook等社交網(wǎng)絡(luò)平臺(tái)為代表的互聯(lián)網(wǎng)社交產(chǎn)品也流傳廣泛。隨著越來越多的活躍用戶不斷地更新自己的狀態(tài),每時(shí)每刻都有大量的文本數(shù)據(jù)發(fā)布在這些社交平臺(tái)上,例如發(fā)布自己的狀態(tài),評(píng)價(jià)商品或事件,包括聊天記錄等信息,這些海量的文本數(shù)據(jù)如何準(zhǔn)確高效地提取出有價(jià)值的信息,無論是對(duì)于互聯(lián)網(wǎng)服務(wù)提供商、科研院所還是政府事業(yè)單位來說,文本分類技術(shù)應(yīng)該如何正確而高效地應(yīng)用,從龐大數(shù)量的網(wǎng)絡(luò)文本數(shù)據(jù)中提取并返回更加精準(zhǔn)、簡(jiǎn)潔的信息,是迫切需要解決的問題。深度學(xué)習(xí)的相關(guān)理論在2006年被提出后,經(jīng)過研究人員不斷的完善,其在圖像、語(yǔ)音識(shí)別等領(lǐng)域中,取得了豐碩的研究成果。隨后逐漸有研究人員嘗試在文本分類中應(yīng)用深度學(xué)習(xí),利用可自我學(xué)習(xí)特性,解決了對(duì)文本分類中自然語(yǔ)言理解可行性的問題;利...
【文章來源】:大連交通大學(xué)遼寧省
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【圖文】:
圖2.1深度學(xué)習(xí)核心思想??Fig?2.1?deep?learning?core?idea??
新查詢進(jìn)行檢索時(shí)運(yùn)用普通的向量空間模型。在不關(guān)聯(lián)文檔的向量被減去之后,向??量空間之中的正值分量將被保留。Rocchio中,如果權(quán)重分量為負(fù)值,此分量就沒有了??價(jià)值,將被忽略,即此〇作為分量權(quán)重。Rocchio應(yīng)用于關(guān)聯(lián)反饋的場(chǎng)景如下圖2.4所??7Jn?〇??11??
〇相關(guān)文檔???不相關(guān)文檔??圖2.4查詢示意圖??Fig?2.4?Query?diagram??在實(shí)際中的信息檢索應(yīng)用場(chǎng)景里,如果有一個(gè)有關(guān)于用戶的查詢,而且在開始時(shí)知道部??分關(guān)聯(lián)文檔與不關(guān)聯(lián)文檔的相關(guān)信息,于是查詢向量q經(jīng)過修改之后可以表示為公式??(2.3):??=a^〇?+?^T77|?^?dj ̄y\Pr ̄\Yj?dj?(2.3)??\Ur\?d^C,?|?djeCr??q代表初始的查詢向量,Dnr與Dr二者代表己知的關(guān)聯(lián)文檔集合與不關(guān)聯(lián)文檔集合。??a、P和丫代表q、Dr與Diir的權(quán)承:。a、P和y能通過如下方式調(diào)節(jié)判定結(jié)果與初始??查詢向量二者的平衡:若已判斷的文檔己經(jīng)大部分存在,就可以將較高的權(quán)重賦予P??和Y。新查詢?cè)谛薷暮笥桑ラ_始,往關(guān)聯(lián)文檔的質(zhì)心向量縮短一段距離,于此同時(shí),又??遠(yuǎn)離了不關(guān)聯(lián)文檔的質(zhì)心向量。??新查詢進(jìn)行檢索時(shí)運(yùn)用普通的向量空間模型。在不關(guān)聯(lián)文檔的向量被減去之后,向??量空間之中的正值分量將被保留。Rocchio中
【參考文獻(xiàn)】:
期刊論文
[1]一種面向文本分類的特征向量?jī)?yōu)化方法[J]. 郭正斌,張仰森,蔣玉茹. 計(jì)算機(jī)應(yīng)用研究. 2017(08)
[2]基于SVM的在線商品評(píng)論的情感傾向性分析[J]. 肖江,王曉進(jìn). 信息技術(shù). 2016(07)
[3]基于深度信念網(wǎng)絡(luò)的文本分類算法[J]. 陳翠平. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2015(02)
[4]基于深度學(xué)習(xí)的微博情感分析[J]. 梁軍,柴玉梅,原慧斌,昝紅英,劉銘. 中文信息學(xué)報(bào). 2014(05)
[5]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽(yáng)明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[6]SVM文本分類中一種新的特征提取方法[J]. 姜鶴,陳麗亞. 計(jì)算機(jī)技術(shù)與發(fā)展. 2010(03)
[7]一種基于特征重要度的文本分類特征加權(quán)方法[J]. 劉赫,劉大有,裴志利,高瀅. 計(jì)算機(jī)研究與發(fā)展. 2009(10)
[8]基于向量空間模型中義項(xiàng)詞語(yǔ)的無導(dǎo)詞義消歧[J]. 魯松,白碩,黃雄. 軟件學(xué)報(bào). 2002(06)
碩士論文
[1]基于位置和語(yǔ)義特征的中文命名實(shí)體關(guān)系抽取研究[D]. 李海光.合肥工業(yè)大學(xué) 2011
本文編號(hào):2910474
【文章來源】:大連交通大學(xué)遼寧省
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【圖文】:
圖2.1深度學(xué)習(xí)核心思想??Fig?2.1?deep?learning?core?idea??
新查詢進(jìn)行檢索時(shí)運(yùn)用普通的向量空間模型。在不關(guān)聯(lián)文檔的向量被減去之后,向??量空間之中的正值分量將被保留。Rocchio中,如果權(quán)重分量為負(fù)值,此分量就沒有了??價(jià)值,將被忽略,即此〇作為分量權(quán)重。Rocchio應(yīng)用于關(guān)聯(lián)反饋的場(chǎng)景如下圖2.4所??7Jn?〇??11??
〇相關(guān)文檔???不相關(guān)文檔??圖2.4查詢示意圖??Fig?2.4?Query?diagram??在實(shí)際中的信息檢索應(yīng)用場(chǎng)景里,如果有一個(gè)有關(guān)于用戶的查詢,而且在開始時(shí)知道部??分關(guān)聯(lián)文檔與不關(guān)聯(lián)文檔的相關(guān)信息,于是查詢向量q經(jīng)過修改之后可以表示為公式??(2.3):??=a^〇?+?^T77|?^?dj ̄y\Pr ̄\Yj?dj?(2.3)??\Ur\?d^C,?|?djeCr??q代表初始的查詢向量,Dnr與Dr二者代表己知的關(guān)聯(lián)文檔集合與不關(guān)聯(lián)文檔集合。??a、P和丫代表q、Dr與Diir的權(quán)承:。a、P和y能通過如下方式調(diào)節(jié)判定結(jié)果與初始??查詢向量二者的平衡:若已判斷的文檔己經(jīng)大部分存在,就可以將較高的權(quán)重賦予P??和Y。新查詢?cè)谛薷暮笥桑ラ_始,往關(guān)聯(lián)文檔的質(zhì)心向量縮短一段距離,于此同時(shí),又??遠(yuǎn)離了不關(guān)聯(lián)文檔的質(zhì)心向量。??新查詢進(jìn)行檢索時(shí)運(yùn)用普通的向量空間模型。在不關(guān)聯(lián)文檔的向量被減去之后,向??量空間之中的正值分量將被保留。Rocchio中
【參考文獻(xiàn)】:
期刊論文
[1]一種面向文本分類的特征向量?jī)?yōu)化方法[J]. 郭正斌,張仰森,蔣玉茹. 計(jì)算機(jī)應(yīng)用研究. 2017(08)
[2]基于SVM的在線商品評(píng)論的情感傾向性分析[J]. 肖江,王曉進(jìn). 信息技術(shù). 2016(07)
[3]基于深度信念網(wǎng)絡(luò)的文本分類算法[J]. 陳翠平. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2015(02)
[4]基于深度學(xué)習(xí)的微博情感分析[J]. 梁軍,柴玉梅,原慧斌,昝紅英,劉銘. 中文信息學(xué)報(bào). 2014(05)
[5]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽(yáng)明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[6]SVM文本分類中一種新的特征提取方法[J]. 姜鶴,陳麗亞. 計(jì)算機(jī)技術(shù)與發(fā)展. 2010(03)
[7]一種基于特征重要度的文本分類特征加權(quán)方法[J]. 劉赫,劉大有,裴志利,高瀅. 計(jì)算機(jī)研究與發(fā)展. 2009(10)
[8]基于向量空間模型中義項(xiàng)詞語(yǔ)的無導(dǎo)詞義消歧[J]. 魯松,白碩,黃雄. 軟件學(xué)報(bào). 2002(06)
碩士論文
[1]基于位置和語(yǔ)義特征的中文命名實(shí)體關(guān)系抽取研究[D]. 李海光.合肥工業(yè)大學(xué) 2011
本文編號(hào):2910474
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2910474.html
最近更新
教材專著