天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 管理論文 > 管理理論論文 >

基于文本挖掘和潛在狄利克雷分配的科學(xué)管理熱門話題提取與預(yù)測(cè)

發(fā)布時(shí)間:2020-09-29 23:44
   管理科學(xué)是一個(gè)廣泛的跨學(xué)科領(lǐng)域。如果研究者們不了解新興話題,在這個(gè)領(lǐng)域進(jìn)行研究會(huì)非常具有挑戰(zhàn)性。本項(xiàng)研究的首要目標(biāo)是通過(guò)減少僅以確定管理科學(xué)領(lǐng)域當(dāng)前熱點(diǎn)問題為目的多次初步閱讀,解決學(xué)者選擇研究方向的困難。通過(guò)分析管理科學(xué)領(lǐng)域的出版物,研究將有助于確定熱門話題,繪制管理科學(xué)中核心領(lǐng)域地圖。學(xué)者一但開始一項(xiàng)研究活動(dòng),他們的研究在科學(xué)領(lǐng)域具有意義和重要性是非常重要的。本研究的第二個(gè)目的是通過(guò)提供基于已確定趨勢(shì)的熱度預(yù)測(cè)工具,來(lái)更好地定位學(xué)者的研究活動(dòng)來(lái)滿足學(xué)者的科研需求。因此,學(xué)者們可以根據(jù)個(gè)人興趣和學(xué)術(shù)前景,明確研究管理科學(xué)領(lǐng)域的研究側(cè)重點(diǎn)。因此,這項(xiàng)研究的重要性在于它將為科學(xué)管理領(lǐng)域的同仁提供一個(gè)熱門話題框架,以便更好地指導(dǎo)他們的研究工作。他們將能夠識(shí)別短期和長(zhǎng)期趨勢(shì),熟悉并建立管理科學(xué)領(lǐng)域的知識(shí)框架。此外,它可能會(huì)激發(fā)他們對(duì)忽視了的話題的興趣,揭示未來(lái)需要研究的話題。本研究的結(jié)果還將提供一個(gè)審評(píng)人員對(duì)管理科學(xué)領(lǐng)域的興趣概況,有助于期刊等出版物的傳播。這項(xiàng)研究的結(jié)果也可能有助于研究人員熟悉管理科學(xué)中的主題發(fā)展鏈。這項(xiàng)研究將介紹用于分析如科學(xué)出版物等的文件的各種技術(shù),這些出版物可能會(huì)使讀者獲得該領(lǐng)域的知識(shí)。根據(jù)許多其他學(xué)者誰(shuí)在其他學(xué)科做的類似研究,文本挖掘方法在研究領(lǐng)域圖譜是是有價(jià)值的工具。文本挖掘是處理結(jié)構(gòu)化,半結(jié)構(gòu)化甚至非結(jié)構(gòu)化數(shù)據(jù)集(如文本文檔)的特定類型的數(shù)據(jù)挖掘。文本挖掘是屬于人工智能領(lǐng)域的一系列技術(shù),它結(jié)合了語(yǔ)言學(xué),語(yǔ)義學(xué)和語(yǔ)言學(xué),統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)等領(lǐng)域。主題建模是文本挖掘的一種變體。主題建模方法基于的假設(shè)是:文檔由主題構(gòu)成,并且主題是基于詞匯的分布。主題建模是一組統(tǒng)計(jì)方法,用于通過(guò)分析原始文本的文字來(lái)揭示貫穿整個(gè)語(yǔ)料庫(kù)的話題。單個(gè)文本或文檔可能包含多個(gè)主題。最流行的主題建模方法是潛在狄利克雷分布(LDA)。LDA是一個(gè)語(yǔ)料庫(kù)的生成模型,其中文檔是潛在主題的隨機(jī)混合,其中每個(gè)主題的特征是詞匯的概率分布。每個(gè)主題中概率最高的單詞通常會(huì)對(duì)該主題的內(nèi)容給出一個(gè)好主意。LDA在不同領(lǐng)域展示了在巨大信息和科學(xué)文獻(xiàn)中確定隱藏結(jié)構(gòu)的有效性,因此它是本研究選擇的方法。為了縮小研究領(lǐng)域,分析INFORMS數(shù)據(jù)庫(kù)中包含的出版物是一個(gè)妥當(dāng)?shù)倪x擇。INFORMS(運(yùn)籌學(xué)與管理科學(xué)研究所)是運(yùn)籌研究(OR)管理科學(xué)以及分析領(lǐng)域?qū)W者的國(guó)際性論壇。INFORMS與ES發(fā)布所有相關(guān)的管理科學(xué)領(lǐng)域的學(xué)術(shù)同行評(píng)議期刊。因此,為了更好地達(dá)到研究目標(biāo),我們對(duì)2008年至2017年的INFORMS的文章出版物進(jìn)行了十年的分析。大多數(shù)先前的研究使用摘要或關(guān)鍵詞作為出版物的代表。然而,標(biāo)題,摘要和關(guān)鍵詞是更好地描述文章內(nèi)容的特征。本研究中的方法是首先收集INFORMS期刊上發(fā)表的研究論文的標(biāo)題,摘要和關(guān)鍵詞,然后應(yīng)用具有潛在狄利克雷分布的文本挖掘技術(shù)以識(shí)別管理科學(xué)領(lǐng)域的熱門主題。為了測(cè)試熱度預(yù)測(cè)工具的性能,收集了來(lái)自不同科學(xué)領(lǐng)域(包括管理科學(xué))的各種來(lái)源的20份研究論文摘要,以便更好地評(píng)估該工具根據(jù)相關(guān)領(lǐng)域或非相關(guān)領(lǐng)域論文工作來(lái)確定熱度的能力。開展這項(xiàng)研究的第一步是收集相關(guān)數(shù)據(jù)。使用網(wǎng)絡(luò)爬蟲來(lái)從Informs網(wǎng)站收集出版物元數(shù)據(jù){標(biāo)題,摘要和關(guān)鍵詞}。共有6749篇研究論文,摘錄自十年內(nèi)(2008-2017)十二個(gè)學(xué)術(shù)期刊:《決策分析》,《信息系統(tǒng)研究》,《INFORMS計(jì)算學(xué)報(bào)》,《INFORMS教育交流》,《界面》,《管理科學(xué)》,《制造與服務(wù)運(yùn)營(yíng)管理》,《營(yíng)銷科學(xué)》,《運(yùn)籌數(shù)學(xué)》,《運(yùn)籌學(xué)》,《組織科學(xué)》,《服務(wù)科學(xué)》,《戰(zhàn)略科學(xué)》,《運(yùn)輸科學(xué)》。收集出版物后,它們被存儲(chǔ)在My SQL數(shù)據(jù)庫(kù)中。下一步就是通過(guò)去除無(wú)價(jià)值的信息來(lái)清理數(shù)據(jù)。對(duì)收集的數(shù)據(jù)進(jìn)行了四個(gè)主要操作:大小寫字母統(tǒng)一,非字母字符移除,停用詞移除,罕見字移除LDA模型的一個(gè)重要輸入是推斷的主題數(shù)量。初步分析表明,12種主題可以保證模型質(zhì)量。LDA模型的輸入是詞向量語(yǔ)料庫(kù),主題數(shù)量和一些調(diào)整參數(shù)。經(jīng)過(guò)連續(xù)的訓(xùn)練,LDA模型幫助發(fā)現(xiàn)了管理科學(xué)學(xué)科的12個(gè)主題。主題0與交通規(guī)劃和交通管理有關(guān),主題1與線性規(guī)劃有關(guān)。主題2與運(yùn)營(yíng)管理和決策系統(tǒng)支持有關(guān)。主題3與數(shù)字營(yíng)銷有關(guān)。主題4與組織行為有關(guān)。主題5與數(shù)學(xué)優(yōu)化有關(guān)。主題6與決策有關(guān)。主題7與知識(shí)管理有關(guān)。主題8與服務(wù)運(yùn)營(yíng)有關(guān)。議題9與財(cái)務(wù)風(fēng)險(xiǎn)有關(guān)。主題10與供求關(guān)系密切。議題11與博弈論有關(guān)的。在這些話題中,話題0,話題2,話題4.話題7,話題9.話題10,對(duì)應(yīng)于管理科學(xué)領(lǐng)域中的著名研究領(lǐng)域。其余主題是與用于支持管理科學(xué)研究的數(shù)學(xué),計(jì)算方法和理論相關(guān)的一般主題,但也用于解決許多其他科學(xué)應(yīng)用中的問題。對(duì)往期期刊的分布在LDA模型的結(jié)果進(jìn)行分析,有助于發(fā)現(xiàn)2013年至今,金融風(fēng)險(xiǎn),數(shù)字營(yíng)銷和運(yùn)輸計(jì)劃及交通管理是熱門話題。從2008年到2001年,熱門話題是知識(shí)管理,服務(wù)運(yùn)營(yíng)和供求關(guān)系。從2011年到2003年,最熱門的話題是組織行為。對(duì)這些主題及其相關(guān)期刊的進(jìn)一步分析有助于發(fā)現(xiàn)類似內(nèi)容的期刊,例如:《INFORMS教育交流》和《界面》都是教育相關(guān);《信息系統(tǒng)研究》和《組織科學(xué)》。也被發(fā)現(xiàn)了具有獨(dú)特內(nèi)容的期刊《決策分析》和《運(yùn)輸研究》。發(fā)現(xiàn)的熱門話題主要與以下期刊有關(guān):《市場(chǎng)營(yíng)銷科學(xué)》,《信息系統(tǒng)研究》和《交通規(guī)劃》與《交通管理》,也進(jìn)一步證實(shí)了此前有關(guān)這些主題的研究的預(yù)測(cè)。從LDA模型的輸出結(jié)果中可知,構(gòu)建的預(yù)測(cè)工具,將主題分配給新文檔并預(yù)測(cè)熱度。在該工具上進(jìn)行的測(cè)試證實(shí)了它在分配主題,期刊和預(yù)測(cè)管理科學(xué)相關(guān)論文的熱度方面的表現(xiàn)。遺憾的是,由于該學(xué)科的廣泛性以及與其他學(xué)科的交織,該工具無(wú)法確定論文是否與管理科學(xué)有關(guān)。盡管進(jìn)行的分析的有一定的有效性,但也發(fā)現(xiàn)了一些研究的局限。數(shù)據(jù)集的大小并不能確保對(duì)管理科學(xué)中的所有出版物進(jìn)行分析,因此,其他一些熱門話題可能還沒有被發(fā)現(xiàn)。進(jìn)行的預(yù)處理步驟是自定義的,可能不完美。用不同方法對(duì)相同數(shù)據(jù)集進(jìn)行的其他研究可能會(huì)導(dǎo)致不同的結(jié)果。為了利用本研究并提升研究效果,可以在其他科學(xué)領(lǐng)域進(jìn)行類似的分析。從獲得的結(jié)果中,可以建立協(xié)作學(xué)術(shù)研究工具來(lái)幫助各學(xué)科的學(xué)者進(jìn)行他們的研究。這個(gè)協(xié)作工具可以通過(guò)推薦熱門話題以及領(lǐng)域?qū)<。它也可以預(yù)測(cè)提交論文的熱度,并最終建議出可以發(fā)表論文的期刊?偟膩(lái)說(shuō),這項(xiàng)研究已經(jīng)證明了主題模型在發(fā)現(xiàn)潛在話題方面的有效性,它有助于發(fā)現(xiàn)管理科學(xué)領(lǐng)域的一些熱點(diǎn)話題,并提出了一種幫助管理科學(xué)學(xué)者進(jìn)行研究活動(dòng)的工具。
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:C93
【文章目錄】:
摘要
Abstract
Description of Variables and Parameters
Chapter 1 Introduction
    1.1 Background
    1.2 Purpose and Significance
    1.3 Literature Review
        1.3.1 Topic Extraction from Scientific Publications
        1.3.2 Topic Modeling Approaches
        1.3.3 LDA and Management Science Publications
        1.3.4 Hotness Prediction of Scientific Paper or Research
        1.3.5 Comments on the Literature Review
    1.4 Delimitation of the Research
    1.5 Content of the Thesis
Chapter 2 Theoretical Foundation
    2.1 LDA Generative Model
    2.2 Posterior Inference of LDA Model
        2.2.1 Variational Inference
        2.2.2 Online Variational Inference
        2.2.3 Gibbs Sampling
    2.3 LDA Evaluation Metrics
        2.3.1 Perplexity
        2.3.2 Topic Coherence
    2.4 LDA-based Predictive Model
    2.5 Chapter Summary
Chapter 3 Data Acquisition and Preprocessing
    3.1 Process Overview
    3.2 Data Collection
        3.2.1 Data Source
        3.2.2 Extraction of Publications
    3.3 Data Preprocessing
    3.4 Chapter Summary
Chapter 4 Data Analysis and Results
    4.1 Hot Topics Extraction with LDA
        4.1.1 Running LDA
        4.1.2 The topics of Management Science
        4.1.3 Trends Analysis
    4.2 Hot Topics Prediction Tool
    4.3 Chapter Summary
Chapter 5 Findings, Limitations and Future Directions
    5.1 Major Findings of the Study
        5.1.1 Hot Topics Dynamics
        5.1.2 Hotness Prediction
        5.1.3 Discussion
    5.2 Limitations
    5.3 Future Directions
    5.4 Chapter Summary
Conclusion
References
Appendix I Python Source Code for LDA modeling
Appendix II Topics’ Top 10 Words
Appendix III Overtime Journal Topic Distribution
List of Abbreviations and Acronyms
Acknowledgements
Resume

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張祖明;談高等學(xué)校人事管理的職能[J];信陽(yáng)師范學(xué)院學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);1989年03期

2 吳登生;李若筠;;中國(guó)管理科學(xué)領(lǐng)域機(jī)構(gòu)合作的網(wǎng)絡(luò)結(jié)構(gòu)與演化規(guī)律研究[J];中國(guó)管理科學(xué);2017年09期

3 楊列勛;;NSFC與RSE在管理科學(xué)領(lǐng)域合作取得進(jìn)展[J];自然科學(xué)進(jìn)展;2009年03期

4 閆相斌;宋曉龍;宋曉紅;;我國(guó)管理科學(xué)領(lǐng)域機(jī)構(gòu)學(xué)術(shù)合作網(wǎng)絡(luò)分析[J];科研管理;2011年12期

5 李志宏;馬倩;周廣剛;;國(guó)內(nèi)管理科學(xué)領(lǐng)域高校間學(xué)術(shù)論文合著網(wǎng)絡(luò)的時(shí)間演化分析[J];管理工程學(xué)報(bào);2013年04期

6 吳蓉;管理科學(xué)領(lǐng)域的新突破——高軍教授和他的余弦管理理論與方法[J];吉林省經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào);2001年05期

7 韓建國(guó);陳樂生;朱東華;范英;黃璐;;科學(xué)基金國(guó)際評(píng)估的實(shí)踐——中德科學(xué)中心評(píng)估工作[J];中國(guó)科學(xué)基金;2009年03期

8 陳安;;管物、理人,什么最難?[J];大學(xué)生;2013年18期

9 葛皎麗;;淺析項(xiàng)目管理中的風(fēng)險(xiǎn)管理[J];江蘇商論;2014年06期

10 楊列勛;;NSFC與RSE在管理科學(xué)領(lǐng)域合作取得進(jìn)展[J];中國(guó)科學(xué)基金;2009年02期

相關(guān)會(huì)議論文 前2條

1 吳沖鋒;劉杰;席酉民;;編者的話[A];管理科學(xué)與系統(tǒng)科學(xué)進(jìn)展——全國(guó)青年管理科學(xué)與系統(tǒng)科學(xué)論文集(第3卷)[C];1995年

2 席酉民;馮耕中;;應(yīng)用于DSS設(shè)計(jì)并支持決策分析的決策環(huán)境模型[A];科學(xué)決策與系統(tǒng)工程——中國(guó)系統(tǒng)工程學(xué)會(huì)第六次年會(huì)論文集[C];1990年

相關(guān)重要報(bào)紙文章 前5條

1 張子倩 焉巋然;我市申報(bào)國(guó)家自然科學(xué)基金項(xiàng)目又創(chuàng)歷史記錄[N];青島日?qǐng)?bào);2006年

2 ;解讀知識(shí)管理[N];網(wǎng)絡(luò)世界;2002年

3 本報(bào)記者 晏燕;“走出去”的法寶[N];科技日?qǐng)?bào);2005年

4 冰潔;讓你管理時(shí)得心應(yīng)手[N];中國(guó)人事報(bào);2005年

5 楊明清;在平凡崗位上挑戰(zhàn)極限[N];工人日?qǐng)?bào);2007年

相關(guān)碩士學(xué)位論文 前3條

1 GONCALVES ANTONELLA HONORIA IMANE(古韋斯);基于文本挖掘和潛在狄利克雷分配的科學(xué)管理熱門話題提取與預(yù)測(cè)[D];哈爾濱工業(yè)大學(xué);2018年

2 姜愛仙;管理科學(xué)領(lǐng)域的合作社會(huì)網(wǎng)絡(luò)研究[D];哈爾濱工業(yè)大學(xué);2008年

3 周廣剛;國(guó)內(nèi)管理科學(xué)領(lǐng)域高校間學(xué)術(shù)論文合作網(wǎng)絡(luò)研究[D];華南理工大學(xué);2012年



本文編號(hào):2830433

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/glzh/2830433.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶83d31***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com