基于語言特征的中文微博自殺意念檢測方法研究
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【部分圖文】:
圖2-1.Logisticdistribution的密度函數(shù)與分布函數(shù)圖形
歸又被稱為對率回歸、邏輯斯蒂回歸,是一種經(jīng)典的機器學習分類算法介紹該分類算法的數(shù)學原理、特點及其優(yōu)缺點。ticDistribution1(LogisticDistribution)設(shè)X是連續(xù)隨機變量,X服從邏輯斯蒂分布是布函數(shù)和密度函數(shù):1exp(()/)1()()....
圖2-2.支持向量與間隔(1)學習策略
ii)0,then按如下規(guī)則更新參數(shù)iiwyx,ibby;直至訓練集中沒有誤分類點.量機分支持向量機)給定線性可分的訓練數(shù)據(jù)集二次規(guī)劃問題學習得到的分離超平面為0**wxb函數(shù)為()()**fxsigwnxb向量機[44]。
圖4-1正樣例“文心”語言分析結(jié)果
中北大學學位論文LinguisticInquiryandWordCount)的語言分析軟件。它可分析出包含表4-1的詞性在內(nèi)的102項特征,可對句子中的詞性成分進行分析,計算出其在句子中所占的比圖4-1、4-2為正負樣本使用“文心”軟件進行語言分析的結(jié)果。具體的....
圖4-2負樣例“文心”語言分析結(jié)果
Step1將數(shù)據(jù)輸入“文心”軟件中,選擇LTP模式,輸出分析結(jié)果;Step2從Step1的結(jié)果中選取實驗所需的詞性特征,記錄該值;Step3使用式(3.4)對數(shù)值進行歸一化處理;Step4對詞性特征中的句子長度(詞數(shù))根據(jù)所有數(shù)據(jù)的長度做歸一化處理。圖....
本文編號:3903458
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3903458.html