基于論文數(shù)據(jù)的重要科學(xué)成果挖掘
【學(xué)位單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP311.13;G354
【部分圖文】:
圖 2-1 CBoW 模型和 Skip-Gram 模型示意圖[35]優(yōu)化。.1.3 文本的相似性度量對于文本信息處理任務(wù)來說,度量詞語語義之間的相似程度,對比句子與之間的相關(guān)性也都是很常見的問題,人們經(jīng)常使用的方法有將文本信息轉(zhuǎn)成,再用數(shù)學(xué)方法計算相似度,也可以直接看文檔中共同出現(xiàn)的詞語、短語信頻率。假設(shè)兩份文檔的轉(zhuǎn)化后的語言向量分別是 d1= w1w2w3wn和 d2w′1w′2w′3w′n,其中 n 是向量的維度,一般選擇 200-300 維。于是兩份文本相似度的計算方法常用的有歐氏距離、余弦相似度等。(1)歐氏距離歐氏距離是最常用的刻畫距離的方法,主要是描述空間中兩點之間的距于上述的兩份文本之間相似度的計算,如公式2-4:
圖 2-2 RNN 結(jié)構(gòu)展開圖[41]入的出現(xiàn)是有先后順序的序列,并不是單獨的和之前的信息有關(guān)。對于模塊中的A,它的輸出既要輸出給下個模塊,也要輸出給下一個 A 作為輸入。每個模塊 的輸入就是兩部分,分別是上一個模塊的 A 的輸出,還有此前所有的時間序列的輸入信息在 A 模塊之前的所有的輸出。這樣構(gòu)建的循環(huán)結(jié)構(gòu)的 RNN 模型,建立了與時間先后順序相關(guān)的解決方法,這樣的模型預(yù)測的結(jié)果就不僅和當前的信息有關(guān),也同時和之前的輸入和輸出信息有關(guān)。
圖 2-2 RNN 結(jié)構(gòu)展開圖[41]入的出現(xiàn)是有先后順序的序列,并不是單獨的和之前的信息有關(guān)。對于模塊中的A,它的輸出既要輸出給下個模塊,也要輸出給下一個 A 作為輸入。每個模塊 的輸入就是兩部分,分別是上一個模塊的 A 的輸出,還有此前所有的時間序列的輸入信息在 A 模塊之前的所有的輸出。這樣構(gòu)建的循環(huán)結(jié)構(gòu)的 RNN 模型,建立了與時間先后順序相關(guān)的解決方法,這樣的模型預(yù)測的結(jié)果就不僅和當前的信息有關(guān),也同時和之前的輸入和輸出信息有關(guān)。
【相似文獻】
相關(guān)期刊論文 前10條
1 劉春年;張凌宇;;能力坡道模型視角下期刊論文數(shù)據(jù)生命周期管護分析[J];現(xiàn)代情報;2016年09期
2 本刊編輯部;;論文數(shù)據(jù)的正確書寫[J];寧夏醫(yī)科大學(xué)學(xué)報;2009年02期
3 本刊編輯部;;論文數(shù)據(jù)的正確書寫[J];寧夏醫(yī)學(xué)院學(xué)報;2008年01期
4 付培蓉;醫(yī)學(xué)論文數(shù)據(jù)的核算與修約[J];編輯學(xué)報;2003年06期
5 高振昕;;唯“SCI”論可以休矣![J];耐火材料;2018年06期
6 李旭彥;楊曉秋;宋英華;;論文數(shù)據(jù)分析在國家重點實驗室學(xué)術(shù)評價中的應(yīng)用探討[J];科技進步與對策;2016年11期
7 ;《天津商務(wù)職業(yè)學(xué)院學(xué)報》來稿要求[J];天津商務(wù)職業(yè)學(xué)院學(xué)報;2019年01期
8 ;《天津商務(wù)職業(yè)學(xué)院學(xué)報》來稿要求[J];天津商務(wù)職業(yè)學(xué)院學(xué)報;2018年03期
9 宋先鋒;;來自論文數(shù)據(jù)變化的自信[J];創(chuàng)新科技;2012年02期
10 ;論文數(shù)據(jù)的正確書寫[J];寧夏醫(yī)學(xué)院學(xué)報;2008年05期
相關(guān)會議論文 前2條
1 羅曉琪;劉丹;張彤;;基于《機械工程學(xué)報》論文數(shù)據(jù)探析機械工程學(xué)科發(fā)展動態(tài)與特點[A];第16屆中國科技期刊青年編輯學(xué)術(shù)研討會論文集[C];2016年
2 周在峰;周秋菊;;超越:系統(tǒng)性創(chuàng)新再造產(chǎn)業(yè)未來競爭力[A];2016中國造紙產(chǎn)業(yè)競爭力報告[C];2016年
相關(guān)重要報紙文章 前10條
1 本報首席記者 許琦敏 記者 金婉霞;論文數(shù)據(jù)“臃腫”虛假繁榮,傷害的是科學(xué)的本源[N];文匯報;2019年
2 本報記者 李大慶;“SCI本身不是問題,問題出在我們的濫用”[N];科技日報;2009年
3 江蘇 王志軍;用Excel快速匯總論文數(shù)據(jù)[N];電腦報;2005年
4 記者 馬璇;深大自然指數(shù)全球排名再創(chuàng)新高[N];深圳特區(qū)報;2019年
5 高亞洲;對學(xué)術(shù)失信要零容忍[N];吉林日報;2018年
6 記者 蔣建科;中國在11個熱點前沿表現(xiàn)力居首[N];人民日報海外版;2019年
7 記者 賈西平;我國際科技論文數(shù)躋身世界八強[N];人民日報;2000年
8 記者 李星婷;22個學(xué)科進入世界ESI排名前1%[N];重慶日報;2018年
9 記者方彤 李天舒 特約記者倪黎冬;國內(nèi)論文數(shù)臨床醫(yī)學(xué)排名第一[N];健康報;2009年
10 東航國際金融公司 陳東海;從根源上避免擴張與緊縮反復(fù)折騰[N];證券時報;2013年
相關(guān)碩士學(xué)位論文 前1條
1 王聰;基于論文數(shù)據(jù)的重要科學(xué)成果挖掘[D];電子科技大學(xué);2019年
本文編號:2833948
本文鏈接:http://sikaile.net/tushudanganlunwen/2833948.html