天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 管理論文 > 人力資源論文 >

基于混合遺傳集成學(xué)習(xí)的人力資源推薦算法

發(fā)布時(shí)間:2020-12-30 23:44
  近年來(lái),各大人力資源服務(wù)企業(yè)積極布局互聯(lián)網(wǎng)招聘市場(chǎng),使得行業(yè)的同質(zhì)化競(jìng)爭(zhēng)加劇。為了提升自身優(yōu)勢(shì),企業(yè)需要為用戶提供更加精準(zhǔn)的推薦服務(wù),這就要求在線招聘平臺(tái)具有性能更好的人力資源推薦算法。因此,本文從實(shí)際的業(yè)務(wù)場(chǎng)景出發(fā),對(duì)人力資源數(shù)據(jù)進(jìn)行采集、預(yù)處理和存儲(chǔ),構(gòu)建人力資源數(shù)據(jù)倉(cāng)庫(kù),同時(shí)結(jié)合用戶信息、行為信息和崗位信息,研究基于混合遺傳集成學(xué)習(xí)的人力資源推薦算法,主要工作內(nèi)容包括以下三點(diǎn):(1)數(shù)據(jù)采集與預(yù)處理:本文研究與實(shí)現(xiàn)了一種數(shù)據(jù)預(yù)處理方法,該方法將人力資源平臺(tái)采集到的數(shù)據(jù)進(jìn)行清洗、集成、規(guī)約和變換等預(yù)處理操作,保證數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的準(zhǔn)確性、完整性、一致性和可用性。(2)數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)倉(cāng)庫(kù):本文提出了基于分布式列式存儲(chǔ)的人力資源數(shù)據(jù)并行處理技術(shù),在分布式列式存儲(chǔ)上設(shè)計(jì)并實(shí)現(xiàn)了人力資源數(shù)據(jù)倉(cāng)庫(kù),并在Spark框架上進(jìn)行了算法并行化實(shí)現(xiàn)。(3)人力資源推薦算法的研究與實(shí)現(xiàn):本文結(jié)合矩陣分解協(xié)同過(guò)濾、選擇性集成和混合推薦的思想,提出了基于混合遺傳集成學(xué)習(xí)的人力資源推薦算法。在離線訓(xùn)練中,算法通過(guò)選擇性集成學(xué)習(xí)獲得分類模型。在實(shí)時(shí)推薦中,算法首先基于人力資源的隱式反饋,進(jìn)行矩陣分解協(xié)同過(guò)濾,獲得... 

【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:84 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于混合遺傳集成學(xué)習(xí)的人力資源推薦算法


Bagging算法原理圖

算法原理,分類器


圖 2-2 boosting 算法原理圖2.2.4 選擇性集成學(xué)習(xí)由于集成學(xué)習(xí)能用多個(gè)基分類器得到強(qiáng)的分類器。因此,一種普遍的想法是:能否通過(guò)集成數(shù)目盡可能多的基分類器來(lái)獲得具有更強(qiáng)預(yù)測(cè)分類能力的分類器。但這一做法有明顯的缺點(diǎn)。一方面,使用過(guò)多的分類器將導(dǎo)致不可估計(jì)的計(jì)算和存儲(chǔ)開(kāi)銷(xiāo),對(duì)于有限的計(jì)算資源而言不可行;另一方面,當(dāng)基分類器數(shù)目增加大一定規(guī)模之后,由于訓(xùn)練基分類器的數(shù)據(jù)集之間的差異性降低,會(huì)導(dǎo)致分類器之間的相似性越來(lái)越大,進(jìn)而影響集成學(xué)習(xí)的效果。因此,南京大學(xué)周志華教授及其團(tuán)隊(duì)提出了選擇性集成理論(SelectiveEnsemble)。該理論主要是將訓(xùn)練出的一組分類器,通過(guò)一定的方法選擇這一組分類器中的一部分進(jìn)行集成,從而獲得比集成所有基分類器更好的效果。以分類任務(wù)為例,周志華教授證明了剔除部分基分類器之后的集成擁有比原來(lái)集成全部基分類器更小的泛化誤差,其論證過(guò)程如下[32]:

集成原理,選擇性,分類器


| 時(shí),剔除掉第 k 個(gè)基分類器不會(huì)影響集成在第 j 個(gè)示例上 ( )和 Sgn(x)在 且 上的性質(zhì): 2Sgn x yError Sgn x Error Sgn x y 出應(yīng)被剔除的基分類器 所滿足的條件:1(( ) ) 0mj kj jjSgn Sum f d 11)是可以滿足的,且當(dāng)所有基分類器都相同時(shí),式(2-11)可以失分類能力。理論分析可知,在執(zhí)行分類任務(wù)時(shí),從訓(xùn)練得到的多個(gè)基分類器,比使用所有基分類器進(jìn)行集成的分類效果更好。選擇性集成的

【參考文獻(xiàn)】:
期刊論文
[1]基于差異性聚類的選擇性集成人體行為識(shí)別模型[J]. 王忠民,張爽,賀炎.  計(jì)算機(jī)科學(xué). 2018(01)
[2]協(xié)同過(guò)濾推薦算法研究進(jìn)展[J]. 翁小蘭,王志堅(jiān).  計(jì)算機(jī)工程與應(yīng)用. 2018(01)
[3]基于用戶信任和興趣的概率矩陣分解推薦方法[J]. 彭鵬,米傳民,肖琳.  計(jì)算機(jī)系統(tǒng)應(yīng)用. 2017(09)
[4]基于混合遺傳算法的任務(wù)驅(qū)動(dòng)分組優(yōu)化研究[J]. 李浩君,杜兆宏,邱飛岳.  計(jì)算機(jī)科學(xué). 2017(S1)
[5]基于相異度的SVM選擇性集成霧霾天氣預(yù)測(cè)方法[J]. 朱旭輝,倪志偉,倪麗萍,程美英,李敬明,金飛飛.  系統(tǒng)科學(xué)與數(shù)學(xué). 2017(06)
[6]基于Ext-GBDT集成的類別不平衡信用評(píng)分模型[J]. 陳啟偉,王偉,馬迪,毛偉.  計(jì)算機(jī)應(yīng)用研究. 2018(02)
[7]基于Spark的混合推薦算法研究[J]. 胡德敏,龔燕.  計(jì)算機(jī)應(yīng)用研究. 2017(12)
[8]大數(shù)據(jù)的數(shù)據(jù)清洗方法研究[J]. 譚暉,廖振松,周小翠,賀凡.  信息通信. 2017(01)
[9]基于Spark的并行遺傳算法研究[J]. 余濤,劉澤燊.  計(jì)算機(jī)時(shí)代. 2017(01)
[10]基于隨機(jī)貪心選擇的選擇性集成算法[J]. 江峰,張友強(qiáng),杜軍威,劉國(guó)柱,眭躍飛.  濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)

碩士論文
[1]基于Bagging的兩階段特征選擇集成分類器研究[D]. 邢盼盼.鄭州大學(xué) 2017



本文編號(hào):2948523

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/renliziyuanguanlilunwen/2948523.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b0449***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com