多源學(xué)術(shù)新媒體用戶生成內(nèi)容的知識(shí)聚合研究
發(fā)布時(shí)間:2021-08-03 10:13
隨著信息經(jīng)濟(jì)迅猛發(fā)展,學(xué)術(shù)新媒體作為新型的網(wǎng)絡(luò)學(xué)術(shù)知識(shí)平臺(tái)逐漸受到科研工作者的關(guān)注,為知識(shí)信息獲取、知識(shí)交流、知識(shí)傳播等帶來了改變。學(xué)術(shù)新媒體以學(xué)術(shù)微博、學(xué)術(shù)微信公眾號(hào)、學(xué)術(shù)虛擬社區(qū)、學(xué)術(shù)APP等主要形式存在,具有平臺(tái)類型多樣、平臺(tái)內(nèi)容豐富、平臺(tái)知識(shí)專業(yè)化等特點(diǎn)。為科研工作者提供了獲取學(xué)術(shù)信息、分享學(xué)術(shù)成果、開展學(xué)術(shù)交流等活動(dòng)的新途徑。學(xué)術(shù)新媒體不再以文章、期刊論文等長文本形式作為知識(shí)推送的內(nèi)容,學(xué)術(shù)用戶作為學(xué)術(shù)新媒體環(huán)境中知識(shí)接受者與生產(chǎn)者兩種身份并存,新媒體環(huán)境鼓勵(lì)學(xué)術(shù)用戶通過提問、回答與分享來自主產(chǎn)生新知識(shí),創(chuàng)新了學(xué)術(shù)知識(shí)獲取方式。隨著新媒體環(huán)境的擴(kuò)張,互聯(lián)網(wǎng)中的用戶生成內(nèi)容呈現(xiàn)出了爆炸式增長,用戶在搜尋知識(shí)過程中需要消耗大量的時(shí)間和精力去瀏覽與篩選知識(shí)內(nèi)容。知識(shí)內(nèi)容出現(xiàn)“知識(shí)過載”,用戶陷入“知識(shí)迷航”,而學(xué)術(shù)新媒體中的用戶生成知識(shí)內(nèi)容也存在內(nèi)容質(zhì)量參差不齊,知識(shí)點(diǎn)碎片化分散,內(nèi)容冗余等問題。同時(shí)不同學(xué)術(shù)新媒體平臺(tái)間缺乏信息交流,單一平臺(tái)內(nèi)的知識(shí)無法及時(shí)完善與更新,導(dǎo)致用戶須花費(fèi)大量時(shí)間去瀏覽多平臺(tái)內(nèi)的知識(shí),增加了獲取知識(shí)的難度。如何對(duì)學(xué)術(shù)新媒體內(nèi)用戶生成內(nèi)容進(jìn)行知識(shí)的挖掘、組...
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:193 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
標(biāo)準(zhǔn)RNN前向傳播流程
吉林大學(xué)博士學(xué)位論文78和梯度爆炸等問題。為更好地處理信息長期依賴的問題,HochreiterS等人建立了長短期記憶(LongShortTermMemory,LSTM)模型[1]。其獨(dú)特的細(xì)胞狀態(tài)更新過程,讓當(dāng)前信息傳遞具有長時(shí)記憶性,讓多個(gè)時(shí)刻的信息相互影響,從而緩解梯度消失等問題。LSTM模型使用“三門”設(shè)計(jì),讓輸入的信息以細(xì)胞狀態(tài)進(jìn)行更新,進(jìn)而對(duì)當(dāng)前的輸出和下一時(shí)刻的更新產(chǎn)生影響。具體的步驟如圖4.4所示。圖4.4LSTM模型結(jié)構(gòu)圖圖中的“三門”分別為:遺忘門、輸入門、輸出門。通過遺忘門,計(jì)算ft概率,用以決定繼承上一時(shí)刻隱藏層信息的比重。具體表達(dá)式如下所示。其中xt為輸入變量,ht-1為上一時(shí)刻的輸出,Wf為權(quán)重系數(shù),bf為偏置常量,σ為sigmoid函數(shù),取值介于0到1之間。()1,tfttffWhxb=+………..………………(公式4.3)通過輸入門,結(jié)合遺忘門的概率ft,計(jì)算細(xì)胞Ct的變化。具體分為兩步:第一步計(jì)算σ層的概率it,決定候選細(xì)胞tCD¤的更新程度,再利用tanh函數(shù)創(chuàng)建一個(gè)新的候選細(xì)胞tCD¤。第二步結(jié)合遺忘門概率ft,前一時(shí)刻的細(xì)胞狀態(tài)Ct-1以及it和tCD¤獲取本層細(xì)胞狀態(tài)信息Ct。其詳細(xì)的計(jì)算公式如下所示。其中Wi、Wc為相應(yīng)的權(quán)重系數(shù),bi,bc為相應(yīng)的偏置常量。()1,tittiiWhxb=+……….………………(公式4.4)()1tanh,tcttcCWhxb=+……….………………(公式4.5)[1]HochreiterS,Schmidhuber,Jürgen.LongShort-TermMemory[J].NeuralComputation,1997,9(8):1735-1780.
第4章多源學(xué)術(shù)新媒體用戶生成內(nèi)容的質(zhì)量評(píng)測79ttt1ttCfCiC=+……….………………(公式4.6)通過輸出門,計(jì)算輸出ht。首先利用σ層計(jì)算一個(gè)輸出概率ot,再結(jié)合當(dāng)前時(shí)刻的細(xì)胞狀態(tài)Ct獲得最終的輸出信息,具體公式如下所示。其中Wo為權(quán)重系數(shù),bo為偏置常量。()1,tottooWhxb=+……….………………(公式4.7)tanh()ttth=oC……….………………(公式4.8)(3)門控循環(huán)單元GRU門控循環(huán)單元(GatedRecurrentUnit,GRU)是由ChoK于2014年提出的一種LSTM神經(jīng)網(wǎng)絡(luò)的變體[1]。它簡化了LSTM模型的“三門”結(jié)構(gòu),去除了細(xì)胞狀態(tài)的更新,采用重置門與更新門的雙門結(jié)構(gòu),可以有效防止LSTM過擬合的問題,同時(shí)提升神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率,其具體學(xué)習(xí)流程如圖4.5所示。圖4.5重置門與更新門結(jié)構(gòu)GRU網(wǎng)絡(luò)的學(xué)習(xí)具體步驟為:通過更新門決定哪些信息將被傳遞到當(dāng)前的隱層狀態(tài)ht中,用以更新下一代的隱層信息。其中zt為更新概率,Wz為權(quán)重矩陣,ht-1為上一時(shí)刻的隱層狀態(tài),xt為當(dāng)前時(shí)刻的輸入。()1,tzttzWhx=……….………………(公式4.9)通過重置門決定上一時(shí)刻的隱層信息中有多少需要被遺忘,用以更新當(dāng)前記憶內(nèi)容。其中Wr為權(quán)重系數(shù),rt為重置門輸出概率。[1]ChoK,VanMerrienboerB,GulcehreC,etal.LearningPhraseRepresentationsusingRNNEncoder-DecoderforStatisticalMachineTranslation[J].ComputerScience,2014.
【參考文獻(xiàn)】:
期刊論文
[1]漢語句法分析中的論元關(guān)系模型研究[J]. 劉作國,陳笑蓉. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2019(06)
[2]基于短語級(jí)情感分析的不良信息檢測方法[J]. 明弋洋,劉曉潔. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(06)
[3]利用語義信息的句法分析統(tǒng)計(jì)模型[J]. 袁里馳. 小型微型計(jì)算機(jī)系統(tǒng). 2019(10)
[4]攝影領(lǐng)域評(píng)論情感詞典構(gòu)建方法[J]. 劉亞橋,陸向艷,鄧凱凱,阮開棟,劉峻. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(10)
[5]基于類別特征擴(kuò)展的短文本分類方法研究[J]. 邵云飛,劉東蘇. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(09)
[6]新媒體背景下如何提升學(xué)術(shù)期刊的品牌影響力[J]. 薩日娜. 傳播力研究. 2019(27)
[7]基于模糊機(jī)制和語義密度聚類的漢語自動(dòng)語義角色標(biāo)注研究[J]. 王旭陽,朱鵬飛. 計(jì)算機(jī)應(yīng)用與軟件. 2019(09)
[8]新媒體語境下科技期刊傳播效果影響因素分析[J]. 甄偉鋒. 中國科技期刊研究. 2019(08)
[9]大眾性問答社區(qū)答案質(zhì)量排序方法研究[J]. 易明,張婷婷. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(06)
[10]基于用戶畫像的UGC質(zhì)量預(yù)判模型[J]. 金燕,孫佳佳. 情報(bào)理論與實(shí)踐. 2019(10)
博士論文
[1]社會(huì)化電子商務(wù)用戶信息采納過程及影響因素研究[D]. 耿榮娜.吉林大學(xué) 2017
[2]社會(huì)媒體信息推薦關(guān)鍵技術(shù)研究[D]. 李洋.哈爾濱工業(yè)大學(xué) 2017
[3]學(xué)術(shù)新媒體信息服務(wù)模式與服務(wù)質(zhì)量評(píng)價(jià)研究[D]. 李宇佳.吉林大學(xué) 2017
[4]基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字圖書館資源聚合與服務(wù)研究[D]. 伍革新.華中師范大學(xué) 2013
[5]面向網(wǎng)絡(luò)社區(qū)問答對(duì)的語義挖掘研究[D]. 王寶勛.哈爾濱工業(yè)大學(xué) 2013
[6]基于產(chǎn)品評(píng)論的情感分析研究[D]. 李方濤.清華大學(xué) 2011
[7]個(gè)性化推薦技術(shù)中的協(xié)同過濾算法研究[D]. 夏培勇.中國海洋大學(xué) 2011
[8]基于網(wǎng)絡(luò)方法的專家知識(shí)推薦[D]. 許云紅.中國科學(xué)技術(shù)大學(xué) 2010
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的微博觀點(diǎn)檢測方法研究[D]. 韓玉鑫.新疆大學(xué) 2019
[2]基于語義信息的名詞短語指代消歧研究[D]. 張江.新疆大學(xué) 2019
[3]社交電商平臺(tái)用戶行為研究[D]. 樊雨青.山東師范大學(xué) 2019
[4]基于詞嵌入的個(gè)性化新聞推薦算法研究[D]. 李魯君.上海師范大學(xué) 2019
[5]基于文本主題的社會(huì)化問答平臺(tái)知識(shí)網(wǎng)絡(luò)研究[D]. 陳曉威.南京大學(xué) 2019
[6]基于雙語主題詞嵌入模型的中朝跨語言文本分類方法的研究[D]. 田明杰.延邊大學(xué) 2019
[7]維吾爾語名詞短語指代消歧研究[D]. 陶豆豆.新疆大學(xué) 2018
[8]基于關(guān)聯(lián)數(shù)據(jù)的漢語專利信息資源聚合研究[D]. 馬曉暉.河北大學(xué) 2017
[9]虛擬社區(qū)用戶持續(xù)知識(shí)共享行為研究[D]. 張曉亮.浙江工商大學(xué) 2015
[10]問答社區(qū)用戶知識(shí)分享行為的動(dòng)機(jī)研究[D]. 張?bào)w慧.中國礦業(yè)大學(xué) 2014
本文編號(hào):3319439
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:193 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
標(biāo)準(zhǔn)RNN前向傳播流程
吉林大學(xué)博士學(xué)位論文78和梯度爆炸等問題。為更好地處理信息長期依賴的問題,HochreiterS等人建立了長短期記憶(LongShortTermMemory,LSTM)模型[1]。其獨(dú)特的細(xì)胞狀態(tài)更新過程,讓當(dāng)前信息傳遞具有長時(shí)記憶性,讓多個(gè)時(shí)刻的信息相互影響,從而緩解梯度消失等問題。LSTM模型使用“三門”設(shè)計(jì),讓輸入的信息以細(xì)胞狀態(tài)進(jìn)行更新,進(jìn)而對(duì)當(dāng)前的輸出和下一時(shí)刻的更新產(chǎn)生影響。具體的步驟如圖4.4所示。圖4.4LSTM模型結(jié)構(gòu)圖圖中的“三門”分別為:遺忘門、輸入門、輸出門。通過遺忘門,計(jì)算ft概率,用以決定繼承上一時(shí)刻隱藏層信息的比重。具體表達(dá)式如下所示。其中xt為輸入變量,ht-1為上一時(shí)刻的輸出,Wf為權(quán)重系數(shù),bf為偏置常量,σ為sigmoid函數(shù),取值介于0到1之間。()1,tfttffWhxb=+………..………………(公式4.3)通過輸入門,結(jié)合遺忘門的概率ft,計(jì)算細(xì)胞Ct的變化。具體分為兩步:第一步計(jì)算σ層的概率it,決定候選細(xì)胞tCD¤的更新程度,再利用tanh函數(shù)創(chuàng)建一個(gè)新的候選細(xì)胞tCD¤。第二步結(jié)合遺忘門概率ft,前一時(shí)刻的細(xì)胞狀態(tài)Ct-1以及it和tCD¤獲取本層細(xì)胞狀態(tài)信息Ct。其詳細(xì)的計(jì)算公式如下所示。其中Wi、Wc為相應(yīng)的權(quán)重系數(shù),bi,bc為相應(yīng)的偏置常量。()1,tittiiWhxb=+……….………………(公式4.4)()1tanh,tcttcCWhxb=+……….………………(公式4.5)[1]HochreiterS,Schmidhuber,Jürgen.LongShort-TermMemory[J].NeuralComputation,1997,9(8):1735-1780.
第4章多源學(xué)術(shù)新媒體用戶生成內(nèi)容的質(zhì)量評(píng)測79ttt1ttCfCiC=+……….………………(公式4.6)通過輸出門,計(jì)算輸出ht。首先利用σ層計(jì)算一個(gè)輸出概率ot,再結(jié)合當(dāng)前時(shí)刻的細(xì)胞狀態(tài)Ct獲得最終的輸出信息,具體公式如下所示。其中Wo為權(quán)重系數(shù),bo為偏置常量。()1,tottooWhxb=+……….………………(公式4.7)tanh()ttth=oC……….………………(公式4.8)(3)門控循環(huán)單元GRU門控循環(huán)單元(GatedRecurrentUnit,GRU)是由ChoK于2014年提出的一種LSTM神經(jīng)網(wǎng)絡(luò)的變體[1]。它簡化了LSTM模型的“三門”結(jié)構(gòu),去除了細(xì)胞狀態(tài)的更新,采用重置門與更新門的雙門結(jié)構(gòu),可以有效防止LSTM過擬合的問題,同時(shí)提升神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率,其具體學(xué)習(xí)流程如圖4.5所示。圖4.5重置門與更新門結(jié)構(gòu)GRU網(wǎng)絡(luò)的學(xué)習(xí)具體步驟為:通過更新門決定哪些信息將被傳遞到當(dāng)前的隱層狀態(tài)ht中,用以更新下一代的隱層信息。其中zt為更新概率,Wz為權(quán)重矩陣,ht-1為上一時(shí)刻的隱層狀態(tài),xt為當(dāng)前時(shí)刻的輸入。()1,tzttzWhx=……….………………(公式4.9)通過重置門決定上一時(shí)刻的隱層信息中有多少需要被遺忘,用以更新當(dāng)前記憶內(nèi)容。其中Wr為權(quán)重系數(shù),rt為重置門輸出概率。[1]ChoK,VanMerrienboerB,GulcehreC,etal.LearningPhraseRepresentationsusingRNNEncoder-DecoderforStatisticalMachineTranslation[J].ComputerScience,2014.
【參考文獻(xiàn)】:
期刊論文
[1]漢語句法分析中的論元關(guān)系模型研究[J]. 劉作國,陳笑蓉. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2019(06)
[2]基于短語級(jí)情感分析的不良信息檢測方法[J]. 明弋洋,劉曉潔. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(06)
[3]利用語義信息的句法分析統(tǒng)計(jì)模型[J]. 袁里馳. 小型微型計(jì)算機(jī)系統(tǒng). 2019(10)
[4]攝影領(lǐng)域評(píng)論情感詞典構(gòu)建方法[J]. 劉亞橋,陸向艷,鄧凱凱,阮開棟,劉峻. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(10)
[5]基于類別特征擴(kuò)展的短文本分類方法研究[J]. 邵云飛,劉東蘇. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(09)
[6]新媒體背景下如何提升學(xué)術(shù)期刊的品牌影響力[J]. 薩日娜. 傳播力研究. 2019(27)
[7]基于模糊機(jī)制和語義密度聚類的漢語自動(dòng)語義角色標(biāo)注研究[J]. 王旭陽,朱鵬飛. 計(jì)算機(jī)應(yīng)用與軟件. 2019(09)
[8]新媒體語境下科技期刊傳播效果影響因素分析[J]. 甄偉鋒. 中國科技期刊研究. 2019(08)
[9]大眾性問答社區(qū)答案質(zhì)量排序方法研究[J]. 易明,張婷婷. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(06)
[10]基于用戶畫像的UGC質(zhì)量預(yù)判模型[J]. 金燕,孫佳佳. 情報(bào)理論與實(shí)踐. 2019(10)
博士論文
[1]社會(huì)化電子商務(wù)用戶信息采納過程及影響因素研究[D]. 耿榮娜.吉林大學(xué) 2017
[2]社會(huì)媒體信息推薦關(guān)鍵技術(shù)研究[D]. 李洋.哈爾濱工業(yè)大學(xué) 2017
[3]學(xué)術(shù)新媒體信息服務(wù)模式與服務(wù)質(zhì)量評(píng)價(jià)研究[D]. 李宇佳.吉林大學(xué) 2017
[4]基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字圖書館資源聚合與服務(wù)研究[D]. 伍革新.華中師范大學(xué) 2013
[5]面向網(wǎng)絡(luò)社區(qū)問答對(duì)的語義挖掘研究[D]. 王寶勛.哈爾濱工業(yè)大學(xué) 2013
[6]基于產(chǎn)品評(píng)論的情感分析研究[D]. 李方濤.清華大學(xué) 2011
[7]個(gè)性化推薦技術(shù)中的協(xié)同過濾算法研究[D]. 夏培勇.中國海洋大學(xué) 2011
[8]基于網(wǎng)絡(luò)方法的專家知識(shí)推薦[D]. 許云紅.中國科學(xué)技術(shù)大學(xué) 2010
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的微博觀點(diǎn)檢測方法研究[D]. 韓玉鑫.新疆大學(xué) 2019
[2]基于語義信息的名詞短語指代消歧研究[D]. 張江.新疆大學(xué) 2019
[3]社交電商平臺(tái)用戶行為研究[D]. 樊雨青.山東師范大學(xué) 2019
[4]基于詞嵌入的個(gè)性化新聞推薦算法研究[D]. 李魯君.上海師范大學(xué) 2019
[5]基于文本主題的社會(huì)化問答平臺(tái)知識(shí)網(wǎng)絡(luò)研究[D]. 陳曉威.南京大學(xué) 2019
[6]基于雙語主題詞嵌入模型的中朝跨語言文本分類方法的研究[D]. 田明杰.延邊大學(xué) 2019
[7]維吾爾語名詞短語指代消歧研究[D]. 陶豆豆.新疆大學(xué) 2018
[8]基于關(guān)聯(lián)數(shù)據(jù)的漢語專利信息資源聚合研究[D]. 馬曉暉.河北大學(xué) 2017
[9]虛擬社區(qū)用戶持續(xù)知識(shí)共享行為研究[D]. 張曉亮.浙江工商大學(xué) 2015
[10]問答社區(qū)用戶知識(shí)分享行為的動(dòng)機(jī)研究[D]. 張?bào)w慧.中國礦業(yè)大學(xué) 2014
本文編號(hào):3319439
本文鏈接:http://sikaile.net/guanlilunwen/shequguanli/3319439.html
最近更新
教材專著