基于機器學(xué)習(xí)的《紅樓夢》作者問題研究
發(fā)布時間:2020-04-03 02:34
【摘要】:《紅樓夢》是我國古典文學(xué)作品的瑰寶,如果要選一部中國藝術(shù)文學(xué)作品推向世界《紅樓夢》是不二之選,但這部文學(xué)巨作的作者歸屬自其成書200多年以來一直懸而未決,也許正是基于這個原因至今《紅樓夢》的作者問題仍是人們關(guān)注的熱點。毫無疑問,已有許多研究者運用各種分析方法對這一問題進行過認真研究并得出了各種判斷結(jié)論,在這諸多結(jié)論中被大家普遍接受的是:《紅樓夢》前80 回由一人所寫后40回也由一人所寫,但前后不是同一人?紤]到前面大多數(shù)的分析研究都是基于比較傳統(tǒng)的統(tǒng)計學(xué)習(xí)方法(比如假設(shè)性檢驗),在此基礎(chǔ)上對《紅樓夢》作者問題所下的各種結(jié)論均是缺乏一定的可靠性,又考慮到伴隨著大數(shù)據(jù)時代的來臨機器學(xué)習(xí)被廣泛應(yīng)用,抱著“與時俱進”與改進實驗分析技術(shù)的想法,本研究打算借助R語言對《紅樓夢》進行文本分析并按本文作者所創(chuàng)造的甄選原則選取出100個高頻詞匯作為作者寫作風(fēng)格的用詞特征,以此來獲取實驗數(shù)據(jù);再從機器學(xué)習(xí)的Bagging、Adaboost、Rotation Forest三個角度出發(fā)分別對《紅樓夢》作者歸屬問題進行分類研究。分析表明,Bagging、Adaboost、Rotation Forest的實驗結(jié)果呈現(xiàn)出一致性,即《紅樓夢》前80 回與后40回在寫作風(fēng)格上有明顯差異,從技術(shù)角度確定了《紅樓夢》前后由不同兩人完成,運用信息技術(shù)手段佐證了大家對《紅樓夢》的普遍認識。
【圖文】:
《西游記》數(shù)據(jù)圖 I
《西游記》數(shù)據(jù)圖 II
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP181;I207.411
本文編號:2612813
【圖文】:
《西游記》數(shù)據(jù)圖 I
《西游記》數(shù)據(jù)圖 II
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP181;I207.411
【參考文獻】
相關(guān)期刊論文 前2條
1 施建軍;;基于支持向量機技術(shù)的《紅樓夢》作者研究[J];紅樓夢學(xué)刊;2011年05期
2 李賢平;;《紅樓夢》成書新說[J];復(fù)旦學(xué)報(社會科學(xué)版);1987年05期
,本文編號:2612813
本文鏈接:http://sikaile.net/gudaiwenxuelunwen/2612813.html