學(xué)位論文預(yù)審分配管理系統(tǒng)研究
本文關(guān)鍵詞:學(xué)位論文預(yù)審分配管理系統(tǒng)研究
更多相關(guān)文章: 論文預(yù)審 文本分類 支持向量機(jī) 特征選擇
【摘要】:隨著計算機(jī)技術(shù)的飛速發(fā)展,人類每天接觸到的信息爆炸式的增長,人類的生活節(jié)奏越來越快。在這種情況下,人類渴望能夠用機(jī)器代替大腦的某些功能,幫助他們工作的更加有效率,甚至能夠讓他們從繁瑣的工作中解放出來。本文研究的學(xué)位論文預(yù)審分配管理系統(tǒng)正是針對管理類研究生論文預(yù)審工作,利用人工智能領(lǐng)域中的文本分類技術(shù)實現(xiàn)學(xué)位論文預(yù)審分配管理的自動化、智能化,從而將負(fù)責(zé)此項工作的老師從繁瑣的工作中解放出來,同時也為申請答辯的學(xué)員提供網(wǎng)上申請的便利。 研究中將經(jīng)濟(jì)與管理學(xué)院所有老師的研究方向進(jìn)行了匯總、分類,并以此為關(guān)鍵詞從“維普資訊”中文期刊網(wǎng)上獲得了8720篇文本作為數(shù)據(jù)集(包括訓(xùn)練集和測試集),數(shù)據(jù)集包含9個類別,營造與房地產(chǎn)、信息管理與信息系統(tǒng)、系統(tǒng)工程、國際貿(mào)易、會計學(xué)、技術(shù)經(jīng)濟(jì)、金融學(xué)、企業(yè)管理、行政管理,包含181個小類,分別為這9大類別下的細(xì)分方向。本文在構(gòu)建系統(tǒng)之前,首先在收集的數(shù)據(jù)集上,通過實驗比較、分析了不同的特征選擇算法、分類算法、特征空間維度構(gòu)建的分類器的分類結(jié)果,從中選擇準(zhǔn)確率最高的算法組合應(yīng)用于本文研究的系統(tǒng)當(dāng)中。 在研究的初期,通過實地調(diào)研,從實際的業(yè)務(wù)流程中提煉出了系統(tǒng)應(yīng)滿足的基本業(yè)務(wù)需求及分類、分配原則。從系統(tǒng)的基本業(yè)務(wù)需求中,選擇預(yù)審論文自動分類中涉及的文本分類問題作為本文研究的核心問題,并對預(yù)審論文自動分類模型中的文本預(yù)處理模塊所涉及的詞條抽取、特征選擇、文本表示三個子模塊給出了詳細(xì)設(shè)計。在詞條抽取過程中采用正則表達(dá)式代替?zhèn)鹘y(tǒng)的停用詞典用于初降維。文本預(yù)處理過程中采用數(shù)據(jù)庫存儲各類中間數(shù)據(jù),并將存儲過程應(yīng)用于特征選擇中對詞頻信息的統(tǒng)計。 本文最終實現(xiàn)了一個基于B/S架構(gòu)的學(xué)位論文預(yù)審分配管理系統(tǒng),此系統(tǒng)現(xiàn)已交由負(fù)責(zé)此項工作的老師進(jìn)行測試,系統(tǒng)運行基本穩(wěn)定、分配結(jié)果令人滿意,能夠滿足此項工作的各項要求。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2010
【分類號】:G311
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 顧益軍,樊孝忠,王建華,汪濤,黃維金;中文停用詞表的自動選取[J];北京理工大學(xué)學(xué)報;2005年04期
2 馬建斌;李瀅;滕桂法;王芳;趙洋;;KNN和SVM算法在中文文本自動分類技術(shù)上的比較研究[J];河北農(nóng)業(yè)大學(xué)學(xué)報;2008年03期
3 朱靖波,陳文亮;基于領(lǐng)域知識的文本分類[J];東北大學(xué)學(xué)報;2005年08期
4 姚振軍;黃德根;紀(jì)翔宇;;正則表達(dá)式在漢英對照中國文化術(shù)語抽取中應(yīng)用[J];大連理工大學(xué)學(xué)報;2010年02期
5 胡佳妮,徐蔚然,郭軍,鄧偉洪;中文文本分類中的特征選擇算法研究[J];光通信研究;2005年03期
6 王維娜;康耀紅;伍小芹;;文本分類中特征選擇方法研究[J];信息技術(shù);2008年12期
7 孫鐵利;劉延吉;;中文分詞技術(shù)的研究現(xiàn)狀與困難[J];信息技術(shù);2009年07期
8 李曉黎,劉繼敏,史忠植;概念推理網(wǎng)及其在文本分類中的應(yīng)用[J];計算機(jī)研究與發(fā)展;2000年09期
9 王愛華,張銘,楊冬青,唐世渭;PCCS部分聚類分類:一種快速的Web文檔聚類方法[J];計算機(jī)研究與發(fā)展;2001年04期
10 張劍;李春平;;基于WordNet概念向量空間模型的文本分類[J];計算機(jī)工程與應(yīng)用;2006年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 宋楓溪;自動文本分類若干基本問題研究[D];南京理工大學(xué);2004年
2 尚文倩;文本分類及其相關(guān)技術(shù)研究[D];北京交通大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 龐劍鋒;基于向量空間模型的自反饋的文本分類系統(tǒng)的研究與實現(xiàn)[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2001年
2 孫爽;基于語義相似度的文本聚類算法的研究[D];南京航空航天大學(xué);2007年
,本文編號:1290880
本文鏈接:http://sikaile.net/wenshubaike/xindetihui/1290880.html