天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 管理理論論文 >

基于文本挖掘的管理科學(xué)熱點識別與演化分析

發(fā)布時間:2021-05-18 05:46
  計算機科學(xué)已經(jīng)進入了跨時代發(fā)展的階段,人工智能和文本挖掘技術(shù)的成熟為深入分析挖掘科研文獻的摘要長文本提供了新的手段和方法。目前,LDA主題模型在微博話題識別、新聞主題識別等領(lǐng)域表現(xiàn)出了優(yōu)異的性能,但針對科研文獻等領(lǐng)域的應(yīng)用較少,已經(jīng)有部分學(xué)者應(yīng)用LDA主題模型對情報學(xué)、計算機科學(xué)等領(lǐng)域的學(xué)術(shù)期刊進行主題分析。在我國應(yīng)用深層語義挖掘模型對管理科學(xué)領(lǐng)域的科學(xué)文獻研究仍處于起步狀態(tài)。本文率先將LDA主題模型應(yīng)用于管理科學(xué)領(lǐng)域?qū)W術(shù)文獻的主題挖掘中,進而探索我國管理科學(xué)領(lǐng)域主題的演化與發(fā)展。本文分析數(shù)據(jù)選取期刊中的摘要部分,摘要是學(xué)者對其論文的高度概括和總結(jié),涵蓋了文獻的整體信息。與一般關(guān)鍵詞共現(xiàn)分析方法相比,對摘要長文本進行主題提取可以在更大的程度上保留了文獻原始信息,可以在一定程度上解決關(guān)鍵詞無法很好的概括文獻信息的問題。本文創(chuàng)新性的提出基于一階差分的概率閾值設(shè)定和基于滑動時間窗口的數(shù)據(jù)切分方法。差分概率閾值設(shè)定有效的改善了主題篩選困難的問題,有效的識別相近概率的主題群,完善主題識別過程。本文提出的滑動時間窗口的數(shù)據(jù)切分,克服了不同時間區(qū)域內(nèi)主題對齊困難,改善了主題斷層問題。本文通過LDA主... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:57 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 課題背景與研究意義
        1.1.1 課題背景
        1.1.2 研究意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 管理科學(xué)研究現(xiàn)狀
        1.2.2 文本挖掘研究現(xiàn)狀
        1.2.3 研究現(xiàn)狀綜述
    1.3 論文研究結(jié)構(gòu)與方法
        1.3.1 論文研究結(jié)構(gòu)
        1.3.2 論文研究方法
第2章 文本挖掘理論基礎(chǔ)
    2.1 文本預(yù)處理
        2.1.1 中文文本分詞
        2.1.2 詞性標注
        2.1.3 停用詞過濾
        2.1.4 特征選擇
    2.2 主題模型
        2.2.1 主題模型介紹
        2.2.2 模型求解
        2.2.3 評價體系
    2.3 本章小結(jié)
第3章 熱點主題識別與演化建模
    3.1 數(shù)據(jù)選擇與預(yù)處理
        3.1.1 數(shù)據(jù)選擇
        3.1.2 數(shù)據(jù)預(yù)處理
    3.2 熱點主題識別建模
        3.2.1 主題模型訓(xùn)練與調(diào)參
        3.2.2 文檔-主題矩陣與主題-詞矩陣
        3.2.3 一階差分閾值設(shè)定法
    3.3 主題演化建模
        3.3.1 基于時間滑動窗口的子話題獲取
        3.3.2 子話題強度計算
        3.3.3 子話題相似度計算
    3.4 主題對齊與演化分析
    3.5 本章小結(jié)
第4章 實驗與結(jié)果評價
    4.1 熱點主題識別實驗
        4.1.1 超參數(shù)與主題數(shù)選取
        4.1.2 基于概率值一階差分的閾值設(shè)定
        4.1.3 熱點主題TOP-N排序
    4.2 熱點主題演化分析實驗
        4.2.1 基于滑動時間窗的數(shù)據(jù)切分
        4.2.2 熱點主題強度演化分析
        4.2.3 熱點主題內(nèi)容演化分析
    4.3 基于共詞分析的對比分析
        4.3.1 高頻詞抽取
        4.3.2 共詞分析
        4.3.3 對比分析
    4.4 本章小結(jié)
結(jié)論
參考文獻
致謝


【參考文獻】:
期刊論文
[1]2013—2017年國際上管理學(xué)創(chuàng)新研究熱點、前沿及其演進探析[J]. 房宏君,陳靜,劉鳳霞,王亞林.  科技管理研究. 2019(02)
[2]基于關(guān)鍵詞的國內(nèi)管理科學(xué)與工程領(lǐng)域研究熱點透析[J]. 周潤澤.  全國流通經(jīng)濟. 2019(02)
[3]基于LDA的大V與草根用戶微博主題模型構(gòu)建[J]. 張鈺莎,羅莉霞.  現(xiàn)代計算機(專業(yè)版). 2019(02)
[4]基于話題標簽的微博熱點話題演化研究[J]. 李慧,王麗婷.  情報科學(xué). 2019(01)
[5]一種基于詞加權(quán)LDA模型的專利文獻分類方法[J]. 孫偉,劉文靜,葛麗閣,余璇.  計算機技術(shù)與發(fā)展. 2019(03)
[6]文本分類中卡方統(tǒng)計特征選擇算法的改進[J]. 陳偉鴻,林偉.  有線電視技術(shù). 2018(12)
[7]基于輔助集的專利主題分析領(lǐng)域停用詞選取[J]. 俞琰,趙乃瑄.  數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(11)
[8]2006—2016年管理科學(xué)與工程研究熱點主題研究——基于LDA概率主題模型分析[J]. 陳植元,楊海霞,王先甲.  珞珈管理評論. 2018(04)
[9]管理學(xué)科體系的網(wǎng)絡(luò)分析[J]. 鄭騰豪,王鳳彬,王璁.  管理評論. 2018(10)
[10]基于變分貝葉斯推斷的字典學(xué)習(xí)算法[J]. 劉連,王孝通.  控制與決策. 2020(02)

博士論文
[1]我國管理科學(xué)學(xué)科演進的知識圖譜研究[D]. 何超.湖南大學(xué) 2012
[2]工商管理學(xué)科演進與前沿熱點的可視化分析[D]. 侯劍華.大連理工大學(xué) 2009

碩士論文
[1]基于主題特征和深度學(xué)習(xí)的情感分析算法研究[D]. 鄭灶旭.華南理工大學(xué) 2018
[2]基于股吧文本的主題挖掘及其股票投資應(yīng)用[D]. 張惠玲.華南理工大學(xué) 2018
[3]經(jīng)濟學(xué)與商學(xué)學(xué)科文獻計量與可視化分析[D]. 萬姍姍.中國科學(xué)技術(shù)大學(xué) 2017



本文編號:3193233

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/glzh/3193233.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶46f44***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com