天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 數(shù)學(xué)論文 >

基于文本挖掘的期刊決策參考研究

發(fā)布時間:2020-10-14 00:35
   隨著國家對創(chuàng)新發(fā)展重視程度日益增加,各類期刊數(shù)據(jù)累積量亦不斷增長,對其進行分析并挖掘有效知識對期刊業(yè)自身評估、作者評估、文章質(zhì)量評估等方面具有重要意義。文章以為期刊決策提供參考為研究最終目的,提出基于分類詞典的文本相似度量方法和基于關(guān)鍵詞的期刊文本主題提取方法,以上述兩種方法為主要研究方法,結(jié)合數(shù)據(jù)挖掘領(lǐng)域中的文本相似性度量、聚類和分類方法完成期刊決策參考研究。針對現(xiàn)有基于語義知識規(guī)則分析的文本挖掘存在時間復(fù)雜度高的局限性,提出基于分類詞典的文本相似性度量方法。以現(xiàn)代漢語分類詞典作為語義知識庫,在已有語義相似度量方法的基礎(chǔ)上對詞語相似度量方法進行改進,選取其他基于語義知識庫的文本相似度量方法對比該方法,通過聚類與分類實驗對相似度量方法結(jié)果進行驗證,證明了該方法的合理性。方法采用分類詞典作為知識庫,分類詞典相較于詞林和知網(wǎng)收錄了更多的詞語,詞語編碼匹配成功概率更高,對文本相似性度量影響較小;計算過程中僅在詞語編碼匹配一個階段訪問知識庫,提高了基于語義知識庫方法的時間效率;改進了詞語相似度計算方法,計算結(jié)果優(yōu)于其他基于語義知識庫的方法。針對目前文獻分析領(lǐng)域研究者普遍采用統(tǒng)計學(xué)方法對文獻進行分析這一研究現(xiàn)狀,采用基于語義知識庫的文本相似性度量方法與基于關(guān)鍵詞的期刊文本主題提取方法對期刊論文進行知識發(fā)現(xiàn)。以基于分類詞典的相似度量方法為理論基礎(chǔ),以創(chuàng)新研究某期刊2007~2016年所有被引文獻為研究對象,通過AP聚類對文獻進行多次聚類,根據(jù)聚類層次對各類別進行關(guān)鍵詞聚類、主題詞提取和替換,并將最終主題提取結(jié)果以主題樹的形式呈現(xiàn)。對主題提取結(jié)果構(gòu)建主題樹,直觀展示主題提取結(jié)果,且研究對象主題框架清晰明了;以文獻關(guān)鍵詞作為文獻主題,一定程度避免了文獻中提取的詞語不能表達文獻主題的局限;采用基于語義詞典的詞語相似度量方法,一定程度減少了同義詞導(dǎo)致的誤差。在以上述兩種理論方法研究的基礎(chǔ)上,從期刊論文主題分析、引文-參考文獻相關(guān)性、組織/基金-主題等方面對目標期刊進行深入分析,旨在為期刊決策提供一定的參考。期刊決策參考研究中,對2011~2016年目標期刊研究主題進行提取總結(jié)分析,對不同年度期刊的主要研究主題及年度期刊研究主題變化趨勢可以清楚掌握;以詞語相似度量為依據(jù)對引文-參考文獻相關(guān)度進行測算,對期刊參考文獻相關(guān)度進行大體了解,在提高期刊錄用論文的被引用率的同時保障引文自身引用其他論文的質(zhì)量;對期刊基金/機構(gòu)發(fā)文進行分析,得出不同機構(gòu)/基金發(fā)文的被引頻次和主要研究主題等研究結(jié)論,對期刊論文錄用和論文審稿等方面提供一定的決策參考。
【學(xué)位單位】:華僑大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP391.1;O225
【部分圖文】:

論文主題


論文主題部分邏輯關(guān)系圖

實例圖,關(guān)鍵詞,實例,相似度計算


1 1.00 0.62 0.50 0.38 0.29 0.22 0.22 0.22 0.22 0.20 0.21 0.22 0.22 0.33 0.212 0.62 1.00 0.41 0.35 0.25 0.21 0.21 0.23 0.22 0.20 0.21 0.22 0.22 0.30 0.213 0.50 0.41 1.00 1.00 0.29 0.22 0.22 0.22 0.22 0.20 0.21 0.22 0.22 0.33 0.214 0.38 0.35 1.00 1.00 0.27 0.21 0.21 0.22 0.21 0.20 0.21 0.21 0.21 0.30 0.215 0.29 0.25 0.29 0.27 1.00 0.21 0.20 0.30 0.23 0.33 0.28 0.23 0.21 0.21 0.216 0.22 0.21 0.22 0.21 0.21 1.00 0.25 0.20 0.22 0.22 0.23 0.22 0.20 0.25 0.257 0.22 0.21 0.22 0.21 0.20 0.25 1.00 0.20 0.20 0.20 0.21 0.20 0.22 0.21 0.218 0.22 0.23 0.22 0.22 0.30 0.20 0.20 1.00 0.35 0.33 0.21 0.22 0.22 0.20 0.209 0.22 0.22 0.22 0.21 0.23 0.22 0.20 0.35 1.00 0.22 0.21 0.25 0.22 0.22 0.2210 0.20 0.20 0.20 0.20 0.33 0.22 0.20 0.33 0.22 1.00 0.26 0.22 0.20 0.22 0.2211 0.21 0.21 0.21 0.21 0.28 0.23 0.21 0.21 0.21 0.26 1.00 0.21 0.20 0.24 0.2412 0.22 0.22 0.22 0.21 0.23 0.22 0.20 0.22 0.25 0.22 0.21 1.00 0.40 0.22 0.2513 0.22 0.22 0.22 0.21 0.21 0.20 0.22 0.22 0.22 0.20 0.20 0.40 1.00 0.20 0.2014 0.33 0.30 0.33 0.30 0.21 0.25 0.21 0.20 0.22 0.22 0.24 0.22 0.20 1.00 0.2715 0.21 0.21 0.21 0.21 0.21 0.25 0.17 0.20 0.22 0.22 0.24 0.25 0.20 0.27 1.00根據(jù)關(guān)鍵詞相似度計算結(jié)果,通過 AP 聚類方法對關(guān)鍵詞進行聚類,并將原始關(guān)鍵詞替換為該關(guān)鍵詞聚類中心,該替換過程如圖 4.1 所示:

主題樹,意義,類別,節(jié)點


在該類別文獻主題兩個類別主題詞替換同條文獻信息進行多層聚取出類別主題詞數(shù)分別樹如圖 4.2 所示。類別主題”和“包含該主為α ,主題平均他引文章數(shù) t ,主題下被引11tsα =22tsβ =為:
【參考文獻】

相關(guān)期刊論文 前10條

1 徐慶;段利國;李愛萍;陰桂梅;;基于實體詞語義相似度的中文實體關(guān)系抽取[J];山東大學(xué)學(xué)報(工學(xué)版);2015年06期

2 吳菲菲;張輝;黃魯成;;基于文獻計量的技術(shù)轉(zhuǎn)移問題研究主題分析[J];科技管理研究;2015年08期

3 李海林;郭韌;萬;;;基于特征矩陣的多元時間序列最小距離度量方法[J];智能系統(tǒng)學(xué)報;2015年03期

4 王小林;楊林;王東;;基于知網(wǎng)的新詞語相似度算法研究[J];情報科學(xué);2015年02期

5 李思志;李佳駿;李艷紅;;管理科學(xué)與工程領(lǐng)域的創(chuàng)新軌跡研究——基于TOP期刊的文獻計量和文本挖掘視角[J];中國管理科學(xué);2014年S1期

6 易明;操玉杰;鄧衛(wèi)華;毛進;;基于文獻聚類的國內(nèi)外知識傳播研究主題分析[J];情報科學(xué);2014年11期

7 孟令恩;李穎;何彥青;屈鵬;王惠臨;;基于語義角色標注的專利主題提取研究[J];圖書情報工作;2014年19期

8 丁世飛;賈洪杰;史忠植;;基于自適應(yīng)Nystrm采樣的大數(shù)據(jù)譜聚類算法[J];軟件學(xué)報;2014年09期

9 段煉;咼維;朱欣焰;胡寶清;;基于時空主題模型的微博主題提取[J];武漢大學(xué)學(xué)報(信息科學(xué)版);2014年02期

10 侯素芳;湯建民;;國內(nèi)期刊評價研究綜述和評估:1998-2011[J];情報科學(xué);2014年01期


相關(guān)博士學(xué)位論文 前5條

1 陳虹樞;基于主題模型的專利文本挖掘方法及應(yīng)用研究[D];北京理工大學(xué);2015年

2 趙健;基于近20年中醫(yī)期刊文獻的腸易激綜合征辨證用藥規(guī)律研究[D];北京中醫(yī)藥大學(xué);2014年

3 王占一;Web文本挖掘中若干問題的研究[D];北京郵電大學(xué);2012年

4 黃九鳴;面向輿情分析和屬性發(fā)現(xiàn)的網(wǎng)絡(luò)文本挖掘技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

5 楊卉;Web文本觀點挖掘及隱含情感傾向的研究[D];吉林大學(xué);2011年


相關(guān)碩士學(xué)位論文 前1條

1 史燕;基于HNC的漢語句子相似度算法的研究[D];江蘇大學(xué);2009年



本文編號:2839916

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/2839916.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶85665***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com