天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

海量學術資源的自動分類應用研究

發(fā)布時間:2021-06-14 06:22
  隨著互聯(lián)網的興起和信息技術的高速發(fā)展,每年都有數以億計的學術資源誕生。這些數據在向人們傳遞海量信息的同時,也給用戶查找以及使用這些資源造成了困擾——信息過載。伴隨而來的,人們獲取信息的方式發(fā)生了變化,由單純的“人找信息”轉變?yōu)椤八阉?推薦”的雙引擎模式。標記數據的價值逐漸凸顯,對數據標注的質量要求也越來越高。文本是學術資源的主要呈現(xiàn)方式,作為分布最廣、數據量最大的信息載體,如何對這些數據進行科學、有效地組織和管理是亟待解決的難題。學科分類作為區(qū)分不同內容學術資源的重要標簽,給海量學術資源的組織、歸檔、檢索與推薦帶來了極大的幫助。因此,自動化文本分類技術的研究顯得尤為重要,引起了學術界和工業(yè)界的廣泛關注。學術資源分類是依據學術數據的基本內容,發(fā)掘一些與類別緊密關聯(lián)的特征和信息,將資源映射到具體類別的過程。傳統(tǒng)的機器學習方法高度依賴人為選擇的特征,泛化以及領域遷移能力較差。采用深度學習方法將特征工程融合于模型的構建過程中,從而減少人為設計特征的不完備性和冗余是當前的研究熱點。本文面向海量學術數據,根據跨類型學術資源的基本特點,分別設計了對應的分類模型,包括基于雙向GRU網絡與注意力機制的文... 

【文章來源】:寧波大學浙江省

【文章頁數】:67 頁

【學位級別】:碩士

【文章目錄】:
引言
1 緒論
    1.1 文本分類研究背景
    1.2 課題研究背景與意義
    1.3 當前面臨的問題
    1.4 論文的主要工作
    1.5 論文的組織結構
2 文本分類綜述
    2.1 文本分類的發(fā)展歷程
    2.2 文本分類概述
    2.3 文本分類的關鍵技術
        2.3.1 文本預處理
        2.3.2 詞向量與文本表示
        2.3.3 特征選擇
        2.3.4 特征抽取
    2.4 分類算法
    2.5 深度學習與文本分類
        2.5.1 卷積神經網絡
        2.5.2 循環(huán)神經網絡
        2.5.3 注意力機制
    2.6 評價指標
    2.7 本章小結
3 基于BiGRU網絡與Attention機制的學術資源分類模型
    3.1 GRU與 BiGRU
    3.2 卷積層
    3.3 注意力機制
    3.4 Softmax層
    3.5 基于注意力池化方法的專利標題分類
    3.6 實驗
        3.6.1 實驗環(huán)境和數據集
        3.6.2 實驗設計
        3.6.3 實驗結果與分析
    3.7 本章小結
4 基于關鍵詞特征和卷積神經網絡的學術資源分類模型
    4.1 引入類別信息的CI-TFDF算法
    4.2 基于CI-TFDF算法的文本分類
    4.3 改進的卷積神經網絡
        4.3.1 輸入層的特征拼接結構
        4.3.2 最大-均值池化層
        4.3.3 全連接層Maxout+Dropout
        4.3.4 Softmax層
    4.4 混合模型(Hybrid Model)
        4.4.1 混合模型與文本分類
        4.4.2 混合模型與關鍵詞抽取
        4.4.3 詞性特征
    4.5 實驗
        4.5.1 實驗數據集
        4.5.2 實驗設計及評估指標
        4.5.3 實驗結果與分析
    4.6 本章小結
5 結論
    5.1 工作總結
    5.2 研究展望
參考文獻
在學研究成果
致謝
Abstract of Thesis
論文摘要


【參考文獻】:
期刊論文
[1]結合改進的CHI統(tǒng)計方法的TF-IDF算法優(yōu)化[J]. 馬瑩,趙輝,李萬龍,龐海龍,崔巖.  計算機應用研究. 2019(09)
[2]基于多通道卷積神經網絡的中文微博情感分析[J]. 陳珂,梁斌,柯文德,許波,曾國超.  計算機研究與發(fā)展. 2018(05)
[3]基于LDA擴展主題詞庫的主題爬蟲研究[J]. 費晨杰,劉柏嵩.  計算機應用與軟件. 2018(04)
[4]深度神經網絡訓練中梯度不穩(wěn)定現(xiàn)象研究綜述[J]. 陳建廷,向陽.  軟件學報. 2018(07)
[5]基于主題增強卷積神經網絡的用戶興趣識別[J]. 杜雨萌,張偉男,劉挺.  計算機研究與發(fā)展. 2018(01)
[6]結合注意力機制的長文本分類方法[J]. 盧玲,楊武,王遠倫,雷子鑒,李瑩.  計算機應用. 2018(05)
[7]面向大規(guī)模圖像分類的深度卷積神經網絡優(yōu)化[J]. 白琮,黃玲,陳佳楠,潘翔,陳勝勇.  軟件學報. 2018(04)
[8]基于多注意力卷積神經網絡的特定目標情感分析[J]. 梁斌,劉全,徐進,周倩,章鵬.  計算機研究與發(fā)展. 2017(08)
[9]跨類型的學術資源優(yōu)質推薦算法研究[J]. 尹麗玲,劉柏嵩,王洋洋.  情報學報. 2017(07)
[10]基于CP-CNN的中文短文本分類研究[J]. 余本功,張連彬.  計算機應用研究. 2018(04)



本文編號:3229248

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3229248.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶0609f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com