面向高教人才培養(yǎng)質量社會評價的文本分析方法研究
發(fā)布時間:2022-11-06 12:39
隨著國家教育事業(yè)的蓬勃發(fā)展,關于人才素質的培養(yǎng)不斷受到重視,“數(shù)據(jù)驅動學校,分析變革教育”的大數(shù)據(jù)時代已經(jīng)到來。緊隨著移動互聯(lián)網(wǎng)的快速發(fā)展,使得網(wǎng)絡中產(chǎn)生大量關于高教在培養(yǎng)人才質量方面的評價數(shù)據(jù),這些數(shù)據(jù)對研究如何提高人才培養(yǎng)質量具有重要價值,所以迫切需要利用文本分析技術對這些數(shù)據(jù)進行有效的抓取及合理的分析,實現(xiàn)對目標數(shù)據(jù)的自動化采集與分析,從而為相關部門提供人才培養(yǎng)方面的決策支持。因此,本文提出構建面向高教人才培養(yǎng)質量社會評價數(shù)據(jù)文本分析方法,對此進行了以下研究:(1)針對互聯(lián)網(wǎng)社交媒體網(wǎng)站的結構不同,制定多源數(shù)據(jù)采集方案,設計網(wǎng)絡爬蟲爬取目標數(shù)據(jù)。在此基礎上,進一步完成對高教人才培養(yǎng)質量指標體系的構建,最終制定出標準數(shù)據(jù)集。(2)針對高等教育人才培養(yǎng)質量社會評價數(shù)據(jù)集進行文本情感分析?紤]數(shù)據(jù)來源的網(wǎng)絡環(huán)境以及數(shù)據(jù)的領域性,在基礎的情感詞典中加入社交網(wǎng)絡詞典和領域詞典,從而制定一種基于改進情感詞典的文本情感強度計算方法。(3)針對高等教育人才培養(yǎng)質量社會評價數(shù)據(jù)集進行文本分類。鑒于文本數(shù)據(jù)的語義特性和上下文關聯(lián)性,引入循環(huán)神經(jīng)網(wǎng)絡(RNN)來解決上下文語義關聯(lián)性問題,并融合注意力模...
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 教育數(shù)據(jù)挖掘研究現(xiàn)狀
1.2.2 文本分類研究現(xiàn)狀
1.2.3 文本情感分析研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 本文組織結構
第二章 相關理論與技術
2.1 教育數(shù)據(jù)挖掘概述
2.2 網(wǎng)絡爬蟲技術
2.2.1 技術概述
2.2.2 工作原理及基礎架構
2.3 Word Embedding技術
2.3.1 詞向量簡介
2.3.2 word2vec模型
2.4 循環(huán)神經(jīng)網(wǎng)絡模型
2.4.1 神經(jīng)網(wǎng)絡綜述
2.4.2 循環(huán)神經(jīng)網(wǎng)絡基本原理
2.5 基于情感詞典的分析方法
2.6 本章小結
第三章 多源數(shù)據(jù)采集與數(shù)據(jù)處理
3.1 引言
3.2 高教社會評價數(shù)據(jù)多源采集
3.2.1 百度知道數(shù)據(jù)采集
3.2.2 網(wǎng)頁新聞數(shù)據(jù)采集
3.2.3 360 問答數(shù)據(jù)采集
3.2.4 新浪微博數(shù)據(jù)采集
3.3 高教社會評價數(shù)據(jù)預處理
3.4 高教人才培養(yǎng)質量社會評價指標體系構建
3.4.1 構建原則
3.4.2 高教人才培養(yǎng)質量社會評價指標詞典構建
3.4.3 高教人才培養(yǎng)質量社會評價數(shù)據(jù)集篩選
3.5 本章小結
第四章 基于改進情感詞典的文本情感強度計算方法研究
4.1 引言
4.2 社交網(wǎng)絡詞典構建
4.3 高教人才培養(yǎng)領域詞典構建
4.4 情感強度值計算方法
4.5 實驗結果與分析
4.5.1 實驗數(shù)據(jù)與指標
4.5.2 實驗結果對比分析
4.6 本章小結
第五章 基于雙向循環(huán)注意力神經(jīng)網(wǎng)絡的文本分類方法研究
5.1 引言
5.2 詞向量模型
5.3 基于雙向循環(huán)注意力神經(jīng)網(wǎng)絡的文本分類模型
5.3.1 文本表示層
5.3.2 雙向循環(huán)層
5.3.3 注意力分配層
5.4 文本分類器
5.5 實驗結果與分析
5.5.1 實驗數(shù)據(jù)與指標
5.5.2 實驗結果對比分析
5.6 本章小結
第六章 原型系統(tǒng)的設計與實現(xiàn)
6.1 引言
6.2 系統(tǒng)分析與設計
6.2.1 需求分析
6.2.2 系統(tǒng)設計
6.2.3 數(shù)據(jù)庫設計
6.3 系統(tǒng)實現(xiàn)
6.3.1 系統(tǒng)運行環(huán)境
6.3.2 數(shù)據(jù)可視化實現(xiàn)
6.4 本章總結
第七章 總結與展望
7.1 工作總結
7.2 未來展望
參考文獻
攻讀碩士學位期間研究成果
致謝
【參考文獻】:
期刊論文
[1]基于網(wǎng)絡爬蟲大數(shù)據(jù)的地方高校人才培養(yǎng)質量社會關注度挖掘[J]. 周世軍,戴玉純,洪旭東. 黑龍江高教研究. 2019(03)
[2]基于神經(jīng)網(wǎng)絡的文本表示模型新方法[J]. 曾誰飛,張笑燕,杜曉峰,陸天波. 通信學報. 2017(04)
[3]基于詞向量模型的情感分析[J]. 魏廣順,吳開超. 計算機系統(tǒng)應用. 2017(03)
[4]改進的關聯(lián)規(guī)則算法在學生成績預警中的應用[J]. 王華,劉萍. 計算機工程與設計. 2015(03)
[5]從大數(shù)據(jù)挖掘的視角分析學生評教的有效性[J]. 馬秀麟,衷克定,劉立超. 中國電化教育. 2014(10)
[6]基于統(tǒng)計的自動化Web新聞正文抽取[J]. 林子熠,沈備軍. 計算機應用與軟件. 2010(12)
[7]基于DOM的網(wǎng)頁主題信息的抽取[J]. 劉軍,張凈. 計算機應用與軟件. 2010(05)
[8]國外高校人才培養(yǎng)質量評估的初步研究[J]. 宋丁全,黃洋,王基林. 金陵科技學院學報(社會科學版). 2006(01)
[9]程度副詞的特點范圍與分類[J]. 藺璜,郭姝慧. 山西大學學報(哲學社會科學版). 2003(02)
博士論文
[1]課程評論的情感傾向識別與話題挖掘技術研究[D]. 劉智.華中師范大學 2014
[2]高校學生能力素質模型構建及其應用研究[D]. 鄭媖.武漢大學 2013
碩士論文
[1]基于深度學習的情感詞向量及文本情感分析的研究[D]. 張志華.華東師范大學 2016
[2]基于語義技術的中文信息情感分析方法研究[D]. 林斌.哈爾濱工業(yè)大學 2006
本文編號:3703515
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 教育數(shù)據(jù)挖掘研究現(xiàn)狀
1.2.2 文本分類研究現(xiàn)狀
1.2.3 文本情感分析研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 本文組織結構
第二章 相關理論與技術
2.1 教育數(shù)據(jù)挖掘概述
2.2 網(wǎng)絡爬蟲技術
2.2.1 技術概述
2.2.2 工作原理及基礎架構
2.3 Word Embedding技術
2.3.1 詞向量簡介
2.3.2 word2vec模型
2.4 循環(huán)神經(jīng)網(wǎng)絡模型
2.4.1 神經(jīng)網(wǎng)絡綜述
2.4.2 循環(huán)神經(jīng)網(wǎng)絡基本原理
2.5 基于情感詞典的分析方法
2.6 本章小結
第三章 多源數(shù)據(jù)采集與數(shù)據(jù)處理
3.1 引言
3.2 高教社會評價數(shù)據(jù)多源采集
3.2.1 百度知道數(shù)據(jù)采集
3.2.2 網(wǎng)頁新聞數(shù)據(jù)采集
3.2.3 360 問答數(shù)據(jù)采集
3.2.4 新浪微博數(shù)據(jù)采集
3.3 高教社會評價數(shù)據(jù)預處理
3.4 高教人才培養(yǎng)質量社會評價指標體系構建
3.4.1 構建原則
3.4.2 高教人才培養(yǎng)質量社會評價指標詞典構建
3.4.3 高教人才培養(yǎng)質量社會評價數(shù)據(jù)集篩選
3.5 本章小結
第四章 基于改進情感詞典的文本情感強度計算方法研究
4.1 引言
4.2 社交網(wǎng)絡詞典構建
4.3 高教人才培養(yǎng)領域詞典構建
4.4 情感強度值計算方法
4.5 實驗結果與分析
4.5.1 實驗數(shù)據(jù)與指標
4.5.2 實驗結果對比分析
4.6 本章小結
第五章 基于雙向循環(huán)注意力神經(jīng)網(wǎng)絡的文本分類方法研究
5.1 引言
5.2 詞向量模型
5.3 基于雙向循環(huán)注意力神經(jīng)網(wǎng)絡的文本分類模型
5.3.1 文本表示層
5.3.2 雙向循環(huán)層
5.3.3 注意力分配層
5.4 文本分類器
5.5 實驗結果與分析
5.5.1 實驗數(shù)據(jù)與指標
5.5.2 實驗結果對比分析
5.6 本章小結
第六章 原型系統(tǒng)的設計與實現(xiàn)
6.1 引言
6.2 系統(tǒng)分析與設計
6.2.1 需求分析
6.2.2 系統(tǒng)設計
6.2.3 數(shù)據(jù)庫設計
6.3 系統(tǒng)實現(xiàn)
6.3.1 系統(tǒng)運行環(huán)境
6.3.2 數(shù)據(jù)可視化實現(xiàn)
6.4 本章總結
第七章 總結與展望
7.1 工作總結
7.2 未來展望
參考文獻
攻讀碩士學位期間研究成果
致謝
【參考文獻】:
期刊論文
[1]基于網(wǎng)絡爬蟲大數(shù)據(jù)的地方高校人才培養(yǎng)質量社會關注度挖掘[J]. 周世軍,戴玉純,洪旭東. 黑龍江高教研究. 2019(03)
[2]基于神經(jīng)網(wǎng)絡的文本表示模型新方法[J]. 曾誰飛,張笑燕,杜曉峰,陸天波. 通信學報. 2017(04)
[3]基于詞向量模型的情感分析[J]. 魏廣順,吳開超. 計算機系統(tǒng)應用. 2017(03)
[4]改進的關聯(lián)規(guī)則算法在學生成績預警中的應用[J]. 王華,劉萍. 計算機工程與設計. 2015(03)
[5]從大數(shù)據(jù)挖掘的視角分析學生評教的有效性[J]. 馬秀麟,衷克定,劉立超. 中國電化教育. 2014(10)
[6]基于統(tǒng)計的自動化Web新聞正文抽取[J]. 林子熠,沈備軍. 計算機應用與軟件. 2010(12)
[7]基于DOM的網(wǎng)頁主題信息的抽取[J]. 劉軍,張凈. 計算機應用與軟件. 2010(05)
[8]國外高校人才培養(yǎng)質量評估的初步研究[J]. 宋丁全,黃洋,王基林. 金陵科技學院學報(社會科學版). 2006(01)
[9]程度副詞的特點范圍與分類[J]. 藺璜,郭姝慧. 山西大學學報(哲學社會科學版). 2003(02)
博士論文
[1]課程評論的情感傾向識別與話題挖掘技術研究[D]. 劉智.華中師范大學 2014
[2]高校學生能力素質模型構建及其應用研究[D]. 鄭媖.武漢大學 2013
碩士論文
[1]基于深度學習的情感詞向量及文本情感分析的研究[D]. 張志華.華東師范大學 2016
[2]基于語義技術的中文信息情感分析方法研究[D]. 林斌.哈爾濱工業(yè)大學 2006
本文編號:3703515
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3703515.html
最近更新
教材專著