基于決策樹的大學生心理危機預(yù)警模型研究及應(yīng)用
發(fā)布時間:2021-07-08 00:30
近年來高校心理問題學生數(shù)量呈現(xiàn)逐年上升趨勢,自殺已成為15-34歲青少年人群死亡的最主要原因,給家庭、學校和社會帶來巨大創(chuàng)傷和損失,有效做好心理危機預(yù)警及干預(yù)至關(guān)重要。但是,當前的大學生心理危機預(yù)警手段較為單一,絕大多數(shù)僅停留在傳統(tǒng)的新生入學階段SCL量表測試,預(yù)警效果有限且時效性差。因此,有效借助新技術(shù)對學生的屬性行為數(shù)據(jù)進行挖掘分析,實現(xiàn)心理危機預(yù)警,對學生管理者做好心理健康工作具有重要意義。本文提出一種基于決策樹算法的大學生心理危機預(yù)警方法,通過評估后選用C4.5分類算法對可能產(chǎn)生心理危機的顯著特征屬性進行分析,根據(jù)特征屬性的不同取值情況判斷出該學生是否可能存在心理危機。在特征屬性的選取過程中,本文借鑒了學生管理專家的意見并對部分屬性進行二元Logistic回歸分析后,最終選出性格特征、家庭構(gòu)成、家庭經(jīng)濟、家庭關(guān)系、請假類型、掛科情況六個最為顯著的特征屬性用于決策樹建模,并提取預(yù)警結(jié)果呈陽性的14條規(guī)則對模型加以描述。根據(jù)相關(guān)文獻對模型進行定性評價,證明其具備可信度和參考價值;對比不同數(shù)據(jù)集對模型的定量檢驗結(jié)果可知,模型預(yù)測的整體準確率可達到95%以上,精確率達80%以上,召回率...
【文章來源】:北京林業(yè)大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【部分圖文】:
技術(shù)路線圖
基于決策樹的大學生心理危機預(yù)警模型研究及應(yīng)用14性的取值含義如表2.3所示。用于模型構(gòu)建的標準訓練集數(shù)據(jù)片段如圖2.1所示。圖2.1訓練集數(shù)據(jù)片段Figure2.1DatasectionofthetrainingsetC4.5算法的核心思想是在決策樹各節(jié)點選擇出信息增益率最大的屬性標記為當前節(jié)點,然后該過程遞歸直至生成完整決策樹。具體的信息增益率計算過程為:定義2.1類別信息熵設(shè)S是訓練樣本集,S由s個數(shù)據(jù)樣本構(gòu)成,假設(shè)樣本S中的不同類別有m個,定義它們?yōu)镃i(i=1,2,…,m)。設(shè)si為類別Ci中的樣本個數(shù),那么對于一個給定的樣本數(shù)據(jù)集,其類別信息熵也就是分類所需的信息量計算公式為:(1,2,…,)=∑log2=1(2-5)公式2-5中,pi是任意樣本屬于Ci的概率,一般可用來表示,其中S=S1+S2+…+Sm。定義2.2條件信息熵設(shè)屬性A具有v個不同值{a1,a2,…av},可以用屬性A將S劃分成v個子集{S1,S2,…,SV},假設(shè)其中的Sj包含S中在屬性A上具有相同值aj(j=1,2,…,v)的所有樣本。設(shè)sij是子集Sj中類Ci的樣本個數(shù),那么由屬性A劃分成子集的條件信息熵的計算公式為:()=-∑1+2++(1+2++)=1(2-6)(1+2++)=-∑log2=1(2-7)
基于決策樹的大學生心理危機預(yù)警模型研究及應(yīng)用16(3)計算特征屬性的信息增益量性格特征=(54,539)性格特征=0.0868(4)計算特征屬性的分裂信息熵性格特征=(502,91)=0.6184(5)計算特征屬性的信息增益率性格特征=性格特征性格特征=0.1404根據(jù)上述同樣的步驟,可求得剩余各個特征屬性的信息增益率分別是:家庭經(jīng)濟=家庭經(jīng)濟家庭經(jīng)濟=0.073家庭關(guān)系=家庭關(guān)系家庭關(guān)系=0.067家庭構(gòu)成=家庭構(gòu)成家庭構(gòu)成=0.068掛科情況=掛科情況掛科情況=0.077請假類型=請假類型請假類型=0.034(6)生成決策樹由上述計算結(jié)果可以看出,在所有特征屬性中,“性格特征”的信息增益率為最大,按照C4.5算法思路,選擇“性格特征”標記根節(jié)點。而“性格特征”屬性具有兩個屬性值,因此所有訓練集樣本會被劃分為兩部分,決策樹根節(jié)點如下圖所示:圖2.2決策樹根節(jié)點Figure2.2Therootnode
本文編號:3270677
【文章來源】:北京林業(yè)大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【部分圖文】:
技術(shù)路線圖
基于決策樹的大學生心理危機預(yù)警模型研究及應(yīng)用14性的取值含義如表2.3所示。用于模型構(gòu)建的標準訓練集數(shù)據(jù)片段如圖2.1所示。圖2.1訓練集數(shù)據(jù)片段Figure2.1DatasectionofthetrainingsetC4.5算法的核心思想是在決策樹各節(jié)點選擇出信息增益率最大的屬性標記為當前節(jié)點,然后該過程遞歸直至生成完整決策樹。具體的信息增益率計算過程為:定義2.1類別信息熵設(shè)S是訓練樣本集,S由s個數(shù)據(jù)樣本構(gòu)成,假設(shè)樣本S中的不同類別有m個,定義它們?yōu)镃i(i=1,2,…,m)。設(shè)si為類別Ci中的樣本個數(shù),那么對于一個給定的樣本數(shù)據(jù)集,其類別信息熵也就是分類所需的信息量計算公式為:(1,2,…,)=∑log2=1(2-5)公式2-5中,pi是任意樣本屬于Ci的概率,一般可用來表示,其中S=S1+S2+…+Sm。定義2.2條件信息熵設(shè)屬性A具有v個不同值{a1,a2,…av},可以用屬性A將S劃分成v個子集{S1,S2,…,SV},假設(shè)其中的Sj包含S中在屬性A上具有相同值aj(j=1,2,…,v)的所有樣本。設(shè)sij是子集Sj中類Ci的樣本個數(shù),那么由屬性A劃分成子集的條件信息熵的計算公式為:()=-∑1+2++(1+2++)=1(2-6)(1+2++)=-∑log2=1(2-7)
基于決策樹的大學生心理危機預(yù)警模型研究及應(yīng)用16(3)計算特征屬性的信息增益量性格特征=(54,539)性格特征=0.0868(4)計算特征屬性的分裂信息熵性格特征=(502,91)=0.6184(5)計算特征屬性的信息增益率性格特征=性格特征性格特征=0.1404根據(jù)上述同樣的步驟,可求得剩余各個特征屬性的信息增益率分別是:家庭經(jīng)濟=家庭經(jīng)濟家庭經(jīng)濟=0.073家庭關(guān)系=家庭關(guān)系家庭關(guān)系=0.067家庭構(gòu)成=家庭構(gòu)成家庭構(gòu)成=0.068掛科情況=掛科情況掛科情況=0.077請假類型=請假類型請假類型=0.034(6)生成決策樹由上述計算結(jié)果可以看出,在所有特征屬性中,“性格特征”的信息增益率為最大,按照C4.5算法思路,選擇“性格特征”標記根節(jié)點。而“性格特征”屬性具有兩個屬性值,因此所有訓練集樣本會被劃分為兩部分,決策樹根節(jié)點如下圖所示:圖2.2決策樹根節(jié)點Figure2.2Therootnode
本文編號:3270677
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3270677.html
教材專著