天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 圖書檔案論文 >

基于自組織映射的期刊主題研究

發(fā)布時(shí)間:2020-07-15 18:36
【摘要】:學(xué)術(shù)期刊是科學(xué)交流的重要載體。隨著科學(xué)的發(fā)展與人類知識(shí)的積累,學(xué)術(shù)期刊及其刊載論文的數(shù)量一直保持快速增長(zhǎng)的趨勢(shì)。期刊數(shù)量的不斷增長(zhǎng)必然導(dǎo)致期刊內(nèi)容的交叉重復(fù),同一學(xué)科或研究領(lǐng)域內(nèi)可能包括許多期刊,如何從主題的角度有效地收藏、利用并管理學(xué)術(shù)期刊受到許多機(jī)構(gòu)與個(gè)人的關(guān)注。早期人們對(duì)期刊數(shù)量的關(guān)心也逐漸轉(zhuǎn)化為對(duì)期刊主題內(nèi)容的注意。期刊主題研究具有重要的學(xué)術(shù)意義與實(shí)踐價(jià)值,它可以為圖書館等收藏機(jī)構(gòu)有效采購(gòu)學(xué)術(shù)期刊、新進(jìn)入的研究者選擇研究方向、研究者選擇與其研究?jī)?nèi)容相關(guān)的期刊進(jìn)行投稿、學(xué)術(shù)期刊制定相應(yīng)的發(fā)展策略以及科研政策與資助計(jì)劃的制定提供有意義的參考。 學(xué)術(shù)期刊通常涉及大量的主題,這種高維數(shù)據(jù)的特點(diǎn)使得期刊主題研究開展起來(lái)不太容易。鑒于此,本文將采用一種可視化的降維方法,即自組織映射(SOM)人工神經(jīng)網(wǎng)絡(luò)方法來(lái)研究期刊主題,使高維的期刊主題數(shù)據(jù)顯示在低維的SOM空間中,便于研究者觀察期刊主題的特點(diǎn)。 本文共分為七個(gè)部分: 1.期刊主題研究的理論基礎(chǔ) 本章闡述了期刊主題研究的對(duì)象、主要內(nèi)容、研究方法以及走向與趨勢(shì)。期刊主題研究的對(duì)象主要有兩種,即期刊及其主題。其研究?jī)?nèi)容可歸納為八個(gè)方面:①期刊主題標(biāo)引研究,②期刊主題的聚類研究,③特定類別的主題在期刊中的分布研究,④基于主題的期刊分類與聚類研究,⑤特定期刊的主題構(gòu)成分析,⑥不同國(guó)家與地區(qū)的期刊主題比較研究,⑦期刊主題熱點(diǎn)分析,⑧期刊主題發(fā)展趨勢(shì)研究。期刊主題研究的方法主要是文獻(xiàn)計(jì)量學(xué)方法、內(nèi)容分析法與專家調(diào)查法。潛在語(yǔ)義分析、多維標(biāo)度以及人工神經(jīng)網(wǎng)絡(luò)方法也可用于期刊主題研究。期刊主題研究的發(fā)展趨勢(shì)可歸納為以下幾點(diǎn)。首先,期刊主題研究的方法迫切需要從現(xiàn)有的大量繁瑣的統(tǒng)計(jì)分析工作中解脫出來(lái),引入能有效處理高維數(shù)據(jù)的新方法。其次,研究?jī)?nèi)容需要拓展,包括對(duì)期刊主題的聚類以及基于主題的期刊聚類等內(nèi)容。最后,期刊主題研究的層次需要進(jìn)一步提升。例如,在期刊主題發(fā)展趨勢(shì)研究方面,需要研究如何測(cè)量期刊主題整體隨著時(shí)間變化的程度,而不是僅限于統(tǒng)計(jì)歸納個(gè)別主題隨時(shí)間發(fā)展的狀況。 2.自組織映射用于期刊主題研究的方法論 本章描述了自組織映射(SOM)的原理,比較了兩種主要學(xué)習(xí)算法的優(yōu)缺點(diǎn)與適用條件,歸納了SOM的幾種顯示方式,討論了三種性能較好的SOM軟件工具,設(shè)計(jì)并詳細(xì)闡述了SOM用于期刊主題研究的方法。SOM是一種無(wú)指導(dǎo)學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)方法,其學(xué)習(xí)算法主要是序列學(xué)習(xí)與批學(xué)習(xí)算法,U-matrix圖和成分圖是兩種常見的SOM輸出形式。三維輸出較平面輸出而言,可以避免“邊緣效應(yīng)”,具有更高的準(zhǔn)確性。通過(guò)廣泛調(diào)查與試用,筆者發(fā)現(xiàn)SOM Toolbox, Viscovery SOMine和Databionic ESOM Tools是三種性能較好的SOM軟件工具,并采用SOM Toolbox作為本文的研究工具。為了利用SOM進(jìn)行期刊主題研究,筆者定義了四種SOM輸入矩陣,在Ultsch于2003年定義的U-matrix基礎(chǔ)上進(jìn)行修改,提出一種新的增強(qiáng)型U-matrix。此外,筆者提出了四種新的SOM輸出方式,即綜合成分圖、屬性疊加矩陣、屬性方差矩陣以及關(guān)鍵屬性投影,并詳細(xì)闡述了它們的定義、原理以及在本文的期刊主題研究中的應(yīng)用方法。 3.期刊主題聚類研究 本章旨在利用SOM算法對(duì)期刊的主題進(jìn)行聚類,生成等級(jí)式的主題目錄,為用戶查找相關(guān)主題、瀏覽相關(guān)文獻(xiàn)或改進(jìn)搜索術(shù)語(yǔ)提供建議。筆者以53種與圖書情報(bào)領(lǐng)域相關(guān)的英文期刊為樣本,抽取它們?cè)?007年的主題,構(gòu)造了主題-期刊輸入矩陣,利用SOM算法對(duì)該矩陣進(jìn)行訓(xùn)練,將2330個(gè)主題映射到163個(gè)SOM非空結(jié)點(diǎn)上。通過(guò)比較自定義的增強(qiáng)型U-matrix與Ultsch于2003年定義的U-matrix應(yīng)用于訓(xùn)練結(jié)果的顯示效果,驗(yàn)證了第2章提出的新的增強(qiáng)型U-matrix的有效性與先進(jìn)性。根據(jù)結(jié)點(diǎn)的相鄰性,將SOM結(jié)點(diǎn)中的主題聚為21個(gè)類,例如計(jì)算機(jī)信息管理、計(jì)算機(jī)信息系統(tǒng)、教育等,分析了各個(gè)主題聚類的大小與分布特點(diǎn),并評(píng)價(jià)了聚類的效果。最后,筆者將主題聚類的結(jié)果與相關(guān)研究者的研究結(jié)果進(jìn)行了比較。 4.期刊主題的熱點(diǎn)分析 本章旨在發(fā)現(xiàn)期刊的熱點(diǎn)主題以及這些熱點(diǎn)主題在期刊中的分布狀況。筆者將屬性疊加矩陣應(yīng)用于第3章的SOM訓(xùn)練結(jié)果,識(shí)別這53種期刊在2007年的熱點(diǎn)主題。結(jié)果發(fā)現(xiàn),雖然這些期刊廣泛涉及大量的主題,但熱點(diǎn)主題僅占全部主題數(shù)量的1.1%,主要集中在圖書館、計(jì)算機(jī)信息系統(tǒng)、教育、企業(yè)信息化等領(lǐng)域。筆者將熱點(diǎn)主題的分析結(jié)果與國(guó)內(nèi)相關(guān)研究者的研究結(jié)果進(jìn)行了比較,發(fā)現(xiàn)了國(guó)內(nèi)外圖書情報(bào)期刊在熱點(diǎn)主題上的異同點(diǎn)。接著,筆者選擇了三種重要期刊,分析了它們的熱點(diǎn)主題。最后,通過(guò)分析圖書館、信息技術(shù)與管理信息化這三類熱點(diǎn)主題對(duì)應(yīng)的綜合成分圖,揭示這三類熱點(diǎn)主題主要分布的期刊。 5.期刊的主題相似性與差異研究 本章旨在利用SOM算法根據(jù)期刊的主題對(duì)期刊進(jìn)行聚類,識(shí)別使期刊之間產(chǎn)生主要差異的關(guān)鍵主題,并確定各期刊聚類的主題特點(diǎn)。筆者構(gòu)造了期刊-主題輸入矩陣,利用SOM算法對(duì)該矩陣進(jìn)行訓(xùn)練,將53種期刊映射到140個(gè)SOM結(jié)點(diǎn)上。通過(guò)分析自定義的增強(qiáng)型U-matrix圖,結(jié)合結(jié)點(diǎn)的相鄰程度,將期刊聚成19個(gè)類,并對(duì)聚類效果進(jìn)行了評(píng)價(jià)。然后,筆者將屬性方差矩陣應(yīng)用于第2章對(duì)主題-期刊矩陣的訓(xùn)練結(jié)果,識(shí)別使期刊之間產(chǎn)生主要差異的關(guān)鍵主題;將期刊SOM輸出投影到由圖書館類、信息技術(shù)類與管理信息化類這三組主題形成的三維空間中,從而分析各期刊聚類的主題特點(diǎn)。 6.期刊主題發(fā)展趨勢(shì)研究 本章旨在利用SOM算法確定期刊主題整體在一段時(shí)間內(nèi)變化的程度,分析主題的時(shí)序活躍性以及活躍主題的變化趨勢(shì)。筆者以Journal of Information Science(JIS)從1981-2007年的主題數(shù)據(jù)為樣本,構(gòu)造了年份-主題矩陣,利用SOM算法對(duì)該矩陣進(jìn)行訓(xùn)練,將27個(gè)年份映射到26個(gè)SOM非空結(jié)點(diǎn)上,并以彗星模式顯示SOM輸出。通過(guò)分析連續(xù)年份在SOM輸出中的位置之間的相鄰程度,根據(jù)自定義的增強(qiáng)型U-matrix圖,將27個(gè)年份聚成13個(gè)類,揭示了該期刊的主題在這27年間的整體變化規(guī)律。接著,通過(guò)構(gòu)造主題-年份矩陣,利用SOM算法對(duì)該矩陣進(jìn)行訓(xùn)練,將990個(gè)主題映射到153個(gè)SOM結(jié)點(diǎn)上,應(yīng)用屬性方差矩陣,識(shí)別隨時(shí)間變化較為明顯的活躍主題,結(jié)合屬性疊加矩陣,識(shí)別平穩(wěn)發(fā)展的熱點(diǎn)主題。最后,利用綜合成分圖,分析了信息類、計(jì)算機(jī)與網(wǎng)絡(luò)類以及圖書館類這三類活躍主題隨時(shí)間發(fā)展的趨勢(shì)。 7.研究的不足及展望 本章總結(jié)了本研究在數(shù)據(jù)收集與研究?jī)?nèi)容上的不足,指出后續(xù)將擴(kuò)大研究的期刊范圍與時(shí)間跨度,研究更多期刊在更長(zhǎng)時(shí)間跨度內(nèi)的主題特點(diǎn);闡述了屬性疊加矩陣與屬性方差矩陣用于分析期刊的主題總數(shù)、主題側(cè)重程度之間的差別以及這些指標(biāo)隨時(shí)間變化的規(guī)律的基本原理。此外,比較不同國(guó)家與地區(qū)的圖書情報(bào)期刊在主題上的相似性與差異將有助于國(guó)內(nèi)圖書情報(bào)學(xué)研究與期刊發(fā)展。 圖24,表22
【學(xué)位授予單位】:武漢大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2009
【分類號(hào)】:G353.21
【圖文】:

平面圖,主題,進(jìn)行修改,超環(huán)面


找出最佳的初始化與訓(xùn)練算法,我們進(jìn)行了四輪前期試驗(yàn),分別為:①隨列學(xué)習(xí)算法;②線性初始化和序列學(xué)習(xí)算法;③隨機(jī)初始化和批學(xué)習(xí)算法化和批學(xué)習(xí)算法。結(jié)果顯示,試驗(yàn)④線性初始化和批學(xué)習(xí)算法的最終量化此,筆者采用線性初始化和批學(xué)習(xí)算法。為了避免平面輸出產(chǎn)生的邊緣效超環(huán)面的SOM輸出形狀,并用第2.5.2節(jié)自定義的增強(qiáng)型U一atrix作為OM心l}練的結(jié)果如圖3.2所示,它有20行與12列,共240個(gè)SOM結(jié)點(diǎn)。數(shù)字表示映射到該結(jié)點(diǎn)的主題數(shù)量。需要注意的是,圖3.2是超環(huán)面SO,實(shí)際上圖的上邊緣與下邊緣相連,左邊緣與右邊緣相連。圖右方的顏色matr議值的大小,例如,紅色代表U一atrix值很大,藍(lán)色代表U·matrix值很強(qiáng)型U一mat血有效性的驗(yàn)證

聚類圖,主題,聚類


CCC2111其它 它 28885088818.111113.5.2主題聚類在s0M輸出中的空間分布為了反映各個(gè)主題聚類之間的相對(duì)位置,圖3.4顯示了各個(gè)主題聚類在SOM輸出中的空間分布。其中,顏色相同的連續(xù)區(qū)域表示一個(gè)主題聚類,用標(biāo)簽Ci表示,1=1,2,…,21。白色代表空結(jié)點(diǎn),灰色(即CZI)表示其它類。由于本研究采用超環(huán)面的SOM輸出形狀,SOM輸出的上邊緣與下邊緣、左邊緣與右邊緣是相連的,因此Cl、CZ、C10、C3、CS、C20等聚類雖然看上去由分離的區(qū)域構(gòu)成

矩陣圖,主題,結(jié)果分析,矩陣


4.2.3結(jié)果分析與討論 4.2.了.1琳,首寶題瀚數(shù)量分布圖4.1顯示,位于SOM輸出的四個(gè)“角”(實(shí)際上在超環(huán)面空間中,這些角落與邊緣是連在一起的)的少數(shù)幾個(gè)結(jié)點(diǎn)的屬性疊加矩陣的值較大,呈現(xiàn)紅、橙、黃色,是所有被調(diào)查期刊的熱點(diǎn)主題;位于SOM輸出的“中間偏下方”區(qū)域的屬性疊加矩陣的值居中,呈現(xiàn)綠、青、淡藍(lán)色,是所有被調(diào)查期刊的一般主題;而位于SOM輸出的“上方中間”的大片區(qū)域的屬性疊加矩陣的值較小,呈現(xiàn)深藍(lán)色,是所有被調(diào)查期刊的冷門主題。由此可見,被調(diào)查期刊發(fā)表論文的重點(diǎn)主要集中在少數(shù)幾個(gè)熱點(diǎn)主題上,而大部分主題在被調(diào)查期刊中出現(xiàn)的次數(shù)較少,符合常見的二八原則。根據(jù)圖4.1中各結(jié)點(diǎn)的背景顏色

【引證文獻(xiàn)】

相關(guān)期刊論文 前3條

1 覃麗金;吉家凡;唐朝勝;劉小香;鄧玲;;主題式學(xué)科化服務(wù)模式研究——結(jié)合海南大學(xué)圖書館的案例分析[J];圖書館論壇;2014年04期

2 李湘東;張嬌;袁滿;;基于LDA模型的科技期刊主題演化研究[J];情報(bào)雜志;2014年07期

3 王聰;鄭明慧;王振華;秦譽(yù)嘉;周賢;龔國(guó)祥;李志紅;潘緒斌;;植物檢疫性有害生物名單發(fā)展綜述與制訂方法探討[J];植物檢疫;2014年03期

相關(guān)碩士學(xué)位論文 前1條

1 夏欣;基于PSO-FNN的網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)測(cè)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2013年



本文編號(hào):2756864

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2756864.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶53962***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
开心久久综合激情五月天| 国产免费自拍黄片免费看| 中日韩免费一区二区三区| 久久一区内射污污内射亚洲| 91天堂素人精品系列全集| 91精品国产av一区二区| 国产真人无遮挡免费视频一区| 欧美三级大黄片免费看| 亚洲欧洲成人精品香蕉网| 观看日韩精品在线视频| 久久天堂夜夜一本婷婷| 成人免费高清在线一区二区| 老司机精品视频免费入口| 亚洲色图欧美另类人妻| 亚洲第一区欧美日韩在线| 日韩欧美第一页在线观看| 99久久国产精品亚洲| 中文字幕亚洲视频一区二区| 色婷婷国产精品视频一区二区保健| 国产精品国产亚洲看不卡| 99在线视频精品免费播放| 国产欧美日韩精品一区二| 男女午夜视频在线观看免费| 日本久久中文字幕免费| 精品国产丝袜一区二区| 九九热视频经典在线观看| 国产精品十八禁亚洲黄污免费观看 | 大屁股肥臀熟女一区二区视频| 欧美日韩精品一区二区三区不卡 | 东京不热免费观看日本| 最近最新中文字幕免费| 日本一区二区三区黄色| 亚洲欧美日本国产有色| 插进她的身体里在线观看骚| 久久精品国产99精品亚洲| 乱女午夜精品一区二区三区| 麻豆蜜桃星空传媒在线观看| 国产精品尹人香蕉综合网| 国产亚洲精品一二三区| 日本高清视频在线观看不卡 | 日本少妇aa特黄大片|