面向期刊論文的知識挖掘研究
本文選題:科學計量學 + 可視化; 參考:《河北大學》2014年碩士論文
【摘要】:隨著科技的發(fā)展,人們在各領(lǐng)域的研究越發(fā)深入,科技文獻的數(shù)量也隨之增多,在為我們提供了更多新方法和新知識的同時也帶來了新的問題:海量的文獻資源與人們的閱讀時間和利用能力形成了矛盾,阻礙了人們對科技文獻的利用。本文面向期刊論文進行知識挖掘研究:其一有助于科技管理人員把握期刊整體結(jié)構(gòu)及發(fā)展現(xiàn)狀,從而幫助相關(guān)人員針對期刊建設(shè)做出合理的決策;其二從大量的科技文獻中發(fā)現(xiàn)主流主題及其演化情況,可以幫助科研人員減少查閱科技文獻的時間,便于對科技文獻進行整理和總結(jié),把握學科前沿方向,對科研人員的研究具有一定的指導意義。 本文通過對2000-2011年間某期刊論文進行統(tǒng)計和分析,呈現(xiàn)了該期刊在研究隊伍、地域分布、基金資助及其主題內(nèi)容等情況,以揭示該期刊研究的趨勢和特征。本文的主要工作和貢獻如下: 1.研究分析了科學計量學、主題模型的基本理論和方法,并應用科學計量學方法和主題模型對期刊論文進行了知識挖掘。 2.應用科學計量學方法對期刊論文的作者、機構(gòu)、基金資助等內(nèi)容進行了挖掘,實驗結(jié)果可以幫助相關(guān)人員針對期刊建設(shè)做出合理的決策,為期刊的評價提供了量化依據(jù)。 3.把主題模型方法引入期刊論文挖掘,挖掘出了主題分布、主題變化等知識。本文給出“主題共現(xiàn)”方法來描述主題情況,相對于傳統(tǒng)的關(guān)鍵字共現(xiàn)的方式,具有描述清晰簡潔、語義明確的特點。實驗表明,主題模型方法應用于中文期刊論文知識挖掘,具有較好的效果?梢詭椭蒲腥藛T減少查閱時間,便于對科技文獻進行整理和總結(jié),正確把握學科前沿方向。
[Abstract]:With the development of science and technology, people's research in various fields has become more and more in-depth, and the number of scientific and technological documents has also increased. It not only provides us with more new methods and new knowledge, but also brings new problems: the huge amount of literature resources and people's reading time and ability to use the contradiction, hindered the use of scientific and technological documents. This paper aims at the research of knowledge mining for journal papers: firstly, it helps the scientific and technological managers to grasp the whole structure and the current development of periodicals, thus helping the relevant personnel to make reasonable decisions on the construction of periodicals; Second, finding the mainstream themes and their evolution from a large number of scientific and technological documents can help researchers to reduce the time for consulting scientific and technological documents, facilitate the sorting and summing up of scientific and technological documents, and grasp the frontier direction of science and technology. It has certain guiding significance to the research of scientific research personnel. Based on the statistics and analysis of a periodical paper from 2000 to 2011, this paper presents the research team, regional distribution, fund support and its subject content in order to reveal the trend and characteristics of the periodical research. The main work and contributions of this paper are as follows: 1. This paper studies and analyzes the basic theories and methods of science metrology and subject model, and applies the scientific metrology method and subject model to mine the knowledge of journal papers. 2. The scientific metrology method is applied to excavate the contents of the journal papers such as authors, institutions, funds, etc. The experimental results can help the relevant personnel to make reasonable decisions on the periodical construction and provide the quantitative basis for the evaluation of the periodicals. 3. The method of topic model is introduced into the mining of journal papers, and the knowledge of topic distribution and theme change is excavated. This paper presents a method of "theme co-occurrence" to describe the topic situation. Compared with the traditional keyword co-occurrence method, it has the characteristics of clear description and clear semantics. The experimental results show that the method of topic model is effective in the knowledge mining of Chinese periodicals. It can help the scientific research personnel to reduce the time of consulting, facilitate the collation and summary of the scientific and technological documents, and correctly grasp the frontier direction of the subject.
【學位授予單位】:河北大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.1
【共引文獻】
相關(guān)期刊論文 前10條
1 于江德;王希杰;;詞位標注漢語分詞技術(shù)詳解[J];安陽師范學院學報;2010年05期
2 吳華;徐甜;;機器翻譯中源語分析的研究與探討[J];安陽工學院學報;2006年02期
3 楊爾弘;;媒體5年詞語使用情況調(diào)查分析[J];北華大學學報(社會科學版);2011年04期
4 馬志強;周長勝;丁維;楊娜;;校園網(wǎng)搜索引擎的研究與實現(xiàn)[J];北京機械工業(yè)學院學報;2007年01期
5 劉文華;康海燕;;領(lǐng)域問答系統(tǒng)生成器的研究[J];北京信息科技大學學報(自然科學版);2009年03期
6 張晨;祁坤鈺;;基于Penn Treebank英語標注集對《圣經(jīng)》標注集的擴充研究[J];才智;2009年20期
7 祁峰;;單音節(jié)形容詞和名詞組合的選擇性機制[J];長春師范學院學報(人文社會科學版);2009年03期
8 傅鸝;孫堅;付春雷;;基于語義的音樂檢索系統(tǒng)[J];重慶理工大學學報(自然科學版);2011年01期
9 高東平;;基于類型論的漢語分詞系統(tǒng)TTCS[J];重慶理工大學學報(社會科學);2011年08期
10 王小海;關(guān)于計算詞典學[J];辭書研究;2003年05期
相關(guān)會議論文 前10條
1 李金;宋陽;梁洪;;語言殘障患者醫(yī)療輔助系統(tǒng)設(shè)計[A];第九屆全國信息獲取與處理學術(shù)會議論文集Ⅱ[C];2011年
2 于江德;王希杰;樊孝忠;;漢語詞法分析中上文和下文孰重孰輕[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
3 韓冬煦;常寶寶;;基于邊界熵和卡方統(tǒng)計量的多領(lǐng)域適應性中文分詞方法[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
4 修馳;宋柔;;基于“大詞”實例的中文分詞研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
5 通拉嘎;趙小兵;;論蒙古語詞素切分的實現(xiàn)[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
6 余驍捷;邵陽;吳及;王俠;;基于SVM和MMR融和的自動文摘方法[A];第十一屆全國人機語音通訊學術(shù)會議論文集(一)[C];2011年
7 張俊萍;馮志偉;;CTT在漢語語法研究和教學中的應用[A];第六屆漢語詞匯語義學研討會論文集[C];2005年
8 馮志偉;;確定切詞單位的某些非語法因素[A];語言文字應用研究論文集(Ⅱ)[C];2004年
9 李晉霞;;面向計算機的“V_雙+N_雙”結(jié)構(gòu)類型研究[A];語言文字應用研究論文集(Ⅱ)[C];2004年
10 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細則[A];第五屆全國語言文字應用學術(shù)研討會論文集[C];2007年
相關(guān)碩士學位論文 前10條
1 羅義兵;領(lǐng)域文本相似度計算方法研究[D];山東科技大學;2010年
2 馮海瑛;《萬歷野獲編》分詞理論與實踐[D];廣西師范學院;2010年
3 張燕麗;基于Winnow算法和CAPTCHA的垃圾短信過濾研究[D];鄭州大學;2010年
4 于洪霞;基于SVM的中文垃圾郵件過濾[D];哈爾濱工程大學;2009年
5 呂韶華;面向中文評論文本的情感傾向性研究[D];大連理工大學;2010年
6 孫靜;基于組合分類器的生物命名實體識別[D];大連理工大學;2010年
7 劉金寧;詞性標注體系對中文分詞的影響[D];大連理工大學;2010年
8 邢鑫巖;基于序列模型的情感分析研究[D];大連理工大學;2010年
9 程波波;基于文本的茶學本體學習方法研究[D];安徽農(nóng)業(yè)大學;2010年
10 陳旭;地理編碼引擎的設(shè)計與實現(xiàn)[D];遼寧工程技術(shù)大學;2009年
,本文編號:1855213
本文鏈接:http://sikaile.net/wenshubaike/xingzhengshiwu/1855213.html