半監(jiān)督學(xué)習(xí)在大學(xué)生就業(yè)數(shù)據(jù)中的應(yīng)用研究
本文關(guān)鍵詞:半監(jiān)督學(xué)習(xí)在大學(xué)生就業(yè)數(shù)據(jù)中的應(yīng)用研究
更多相關(guān)文章: 就業(yè)分析 數(shù)據(jù)挖掘 半監(jiān)督學(xué)習(xí) 非對稱稀疏圖 貝葉斯分類
【摘要】:隨著高等院校的發(fā)展和擴(kuò)招,學(xué)生數(shù)量劇增,學(xué)生的就業(yè)成為一個日益嚴(yán)峻的問題。同時,各高校的學(xué)生信息化系統(tǒng)積累了大量的學(xué)生數(shù)據(jù),面對這些數(shù)據(jù),我們使用查詢、修改、添加和刪除等操作是不夠的,借助數(shù)據(jù)挖掘技術(shù)對這些數(shù)據(jù)進(jìn)行學(xué)習(xí),發(fā)揮它們潛在的應(yīng)用價值,為高校大學(xué)生就業(yè)服務(wù),是近年來教育領(lǐng)域研究的熱點(diǎn)之一。使用數(shù)據(jù)挖掘技術(shù)對大學(xué)生就業(yè)數(shù)據(jù)行進(jìn)分析,研究較多的算法有決策樹、聚類分析和關(guān)聯(lián)規(guī)則。決策樹算法的核心問題根據(jù)決策屬性對數(shù)據(jù)集進(jìn)行分類,決策屬性的選擇和計算方法決定了它很難適用于大規(guī)模的訓(xùn)練集,雖然提出了ID3、ID4和C4.5等改進(jìn)算法,但是并未考慮屬性間的關(guān)聯(lián)度和錯分積累問題,不能從根本提高分類的準(zhǔn)確率,同時決策樹算法也是一種監(jiān)督學(xué)習(xí)算法,而大學(xué)生就業(yè)數(shù)據(jù)含有缺失類標(biāo)記數(shù)據(jù),算法健壯性不能得到保證。聚類算法對大學(xué)生就業(yè)數(shù)據(jù)進(jìn)行分析,是在無類別標(biāo)記指導(dǎo)的前提下進(jìn)行的無監(jiān)督學(xué)習(xí),常用的算法有K-means算法等,這類基于劃分算法的聚類結(jié)果強(qiáng)烈依賴初始化參數(shù)的選擇,算法執(zhí)行后把就業(yè)單位性質(zhì)相近的學(xué)生聚成一類,對其他未就業(yè)的學(xué)生并未形成指導(dǎo)性意見。關(guān)聯(lián)規(guī)則算法可以挖掘出影響大學(xué)生就業(yè)的相關(guān)因素,根據(jù)這些因素可以為大學(xué)生的培養(yǎng)提供參考性建議,使用較多的是Apropri算法和其改進(jìn)算法,但是算法執(zhí)行過程中生成數(shù)量巨大的備選項(xiàng)集、過多的I/O操作和較多的循環(huán)影響執(zhí)行速度,算法在執(zhí)行效率上很低。為了解決以上數(shù)據(jù)挖掘算法在就業(yè)數(shù)據(jù)分析中存在的問題,充分利用就業(yè)數(shù)據(jù)中有標(biāo)記數(shù)據(jù)的引導(dǎo)作用,發(fā)揮無標(biāo)記數(shù)據(jù)的輔助作用,訓(xùn)練出具有泛化性的分類器,對大學(xué)生就業(yè)數(shù)據(jù)進(jìn)行分類和預(yù)測,使之成為還沒有就業(yè)學(xué)生推薦就業(yè)的依據(jù)。本文所做工作如下:(1)分析國內(nèi)外高校大學(xué)畢業(yè)生就業(yè)形勢和影響就業(yè)的相關(guān)因素,對重慶市某高校教務(wù)系統(tǒng)的學(xué)生成績信息表、學(xué)生管理系統(tǒng)的學(xué)生基本信息表和高校就業(yè)管理系統(tǒng)的學(xué)生就業(yè)數(shù)據(jù)表進(jìn)行合并處理,得到畢業(yè)生的綜合數(shù)據(jù)。(2)在圖算法基礎(chǔ)上,討論基于圖的半監(jiān)督學(xué)習(xí)算法,把核函數(shù)引進(jìn)到半監(jiān)督學(xué)習(xí)框架中,發(fā)揮核函數(shù)的優(yōu)勢,解決低維空間線性不可分的問題,提出了基于核的圖上半監(jiān)督學(xué)習(xí)算法。最后使用畢業(yè)生綜合數(shù)據(jù)集與基于全局和局部的半監(jiān)督學(xué)習(xí)算法進(jìn)行對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果證明了提出算法的有效性和可行性。(3)研究了稀疏圖的構(gòu)造方法,討論了稀疏圖有效反映數(shù)據(jù)之間幾何關(guān)系和空間構(gòu)造的特性,并證明了用該方法求解屬性權(quán)值的正確性和合理性,提出非對稱稀疏圖的半監(jiān)督學(xué)習(xí)算法。最后通過線性規(guī)劃求解最優(yōu)的稀疏表達(dá),并與對稱圖的拉普拉斯算法進(jìn)行對比驗(yàn)證,實(shí)驗(yàn)結(jié)果證實(shí)了提出算法的可行性。(4)在樸素貝葉斯分類算法的基礎(chǔ)上,弱化特征屬性間彼此獨(dú)立的條件假設(shè),使其決策屬性具有更合理的權(quán)值,對分類的影響更準(zhǔn)確,提出了改進(jìn)屬性加權(quán)貝葉斯多分類算法。最后在畢業(yè)生數(shù)據(jù)集上與樸素貝葉斯算法進(jìn)行對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果證實(shí)了改進(jìn)算法的有效性。(5)提出大學(xué)生就業(yè)問題的四點(diǎn)建議,并指出下一步的研究目標(biāo)和工作方向。
【關(guān)鍵詞】:就業(yè)分析 數(shù)據(jù)挖掘 半監(jiān)督學(xué)習(xí) 非對稱稀疏圖 貝葉斯分類
【學(xué)位授予單位】:重慶師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:G647.38
【目錄】:
- 摘要5-7
- ABSTRACT7-11
- 1 緒論11-18
- 1.1 背景和實(shí)際意義11-12
- 1.1.1 背景11-12
- 1.1.2 實(shí)際意義12
- 1.2 研究現(xiàn)狀12-15
- 1.2.1 國內(nèi)外高校就業(yè)信息現(xiàn)狀12-14
- 1.2.2 數(shù)據(jù)挖掘國內(nèi)外研究現(xiàn)狀14-15
- 1.3 研究內(nèi)容15-17
- 1.3.1 研究內(nèi)容16
- 1.3.2 論文結(jié)構(gòu)16-17
- 1.4 本章小結(jié)17-18
- 2 相關(guān)技術(shù)簡介18-26
- 2.1 半監(jiān)督學(xué)習(xí)18-22
- 2.1.1 半監(jiān)督學(xué)習(xí)的假設(shè)20-21
- 2.1.2 半監(jiān)督學(xué)習(xí)經(jīng)典算法簡介21-22
- 2.2 圖的構(gòu)造方法22-24
- 2.3 基于圖的半監(jiān)督學(xué)習(xí)算法24-25
- 2.4 本章小結(jié)25-26
- 3 基于圖的半監(jiān)督學(xué)習(xí)算法26-32
- 3.1 基于核的圖上半監(jiān)督學(xué)習(xí)26-28
- 3.1.1 算法的執(zhí)行流程27-28
- 3.2 基于稀疏圖的半監(jiān)督學(xué)習(xí)28-31
- 3.2.1 算法的描述和推導(dǎo)30-31
- 3.2.2 算法的執(zhí)行過程31
- 3.3 本章小結(jié)31-32
- 4 基于改進(jìn)貝葉斯半監(jiān)督分類模型32-36
- 4.1 貝葉斯算法32
- 4.2 樸素貝葉斯分類32-33
- 4.3 改進(jìn)屬性加權(quán)貝葉斯分類算法33-34
- 4.4 算法執(zhí)行過程34-35
- 4.5 本章小結(jié)35-36
- 5 就業(yè)數(shù)據(jù)分析和實(shí)驗(yàn)36-47
- 5.1 大學(xué)生就業(yè)數(shù)據(jù)36-39
- 5.1.1 數(shù)據(jù)預(yù)處理37
- 5.1.2 數(shù)據(jù)泛化、數(shù)值化37-39
- 5.2 基于核的圖上半監(jiān)督學(xué)習(xí)實(shí)驗(yàn)39-41
- 5.3 基于稀疏圖的半監(jiān)督學(xué)習(xí)實(shí)驗(yàn)41-43
- 5.4 改進(jìn)屬性加權(quán)貝葉斯半監(jiān)督分類實(shí)驗(yàn)43-46
- 5.5 大學(xué)生就業(yè)問題建議46
- 5.6 本章小結(jié)46-47
- 6 總結(jié)和展望47-49
- 6.1 總結(jié)47
- 6.2 展望47-49
- 參考文獻(xiàn)49-53
- 附錄A53-54
- 致謝#@@
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前8條
1 王成家,裴春民;高校畢業(yè)生就業(yè)數(shù)據(jù)公布與就業(yè)質(zhì)量的關(guān)系研究[J];思想政治教育研究;2005年02期
2 世笑瑾;范以錦;;從就業(yè)數(shù)據(jù)看社會對泛媒體人才的需求[J];青年記者;2013年34期
3 王曉東;;美國經(jīng)濟(jì)難言衰退——美國就業(yè)數(shù)據(jù)簡評[J];證券導(dǎo)刊;2008年02期
4 徐靜波;楊光坤;;輔導(dǎo)員如何更好地開展就業(yè)工作[J];北京教育(德育);2012年11期
5 ;就業(yè)數(shù)據(jù)表明美國經(jīng)濟(jì)強(qiáng)勁復(fù)蘇[J];財經(jīng)界;2010年07期
6 邱瑾;;決策樹在高職學(xué)生就業(yè)數(shù)據(jù)分析中的應(yīng)用研究[J];柳州職業(yè)技術(shù)學(xué)院學(xué)報;2012年02期
7 本刊編輯部;;近期資訊[J];青海金融;2011年12期
8 朱建強(qiáng);;以“我”為主[J];考試(高考族);2009年01期
中國重要報紙全文數(shù)據(jù)庫 前10條
1 實(shí)習(xí)記者 潘穎;就業(yè)數(shù)據(jù)進(jìn)一步降低美國加息預(yù)期[N];北京現(xiàn)代商報;2006年
2 證券時報記者 吳家明;美就業(yè)數(shù)據(jù)喜訊令美元飆升[N];證券時報;2009年
3 吳家明;美5月私營就業(yè)數(shù)據(jù)欠佳[N];證券時報;2011年
4 記者 王麗娜;美元對日元匯價升至5周新高[N];上海證券報;2006年
5 記者 劉洪 劉麗娜;美就業(yè)數(shù)據(jù)喜人奧巴馬乘勢鼓勁[N];新華每日電訊;2010年
6 樊宇;美國7月份就業(yè)數(shù)據(jù)喜憂參半[N];中華工商時報;2012年
7 記者 莫莉;法就業(yè)數(shù)據(jù)添憂 歐洲經(jīng)濟(jì)不勝“愁”[N];金融時報;2011年
8 記者 廖政軍;美國就業(yè)數(shù)據(jù)仍顯疲弱[N];人民日報;2013年
9 張涵;美就業(yè)數(shù)據(jù) 好過預(yù)期[N];21世紀(jì)經(jīng)濟(jì)報道;2012年
10 樊宇 蔣旭峰;美國就業(yè)數(shù)據(jù)遜色引發(fā)經(jīng)濟(jì)減速擔(dān)憂[N];中國改革報;2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 劉建峰;半監(jiān)督學(xué)習(xí)在大學(xué)生就業(yè)數(shù)據(jù)中的應(yīng)用研究[D];重慶師范大學(xué);2015年
,本文編號:857976
本文鏈接:http://sikaile.net/jiaoyulunwen/shifanjiaoyulunwen/857976.html