天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 信息管理論文 >

基于機器學習的網(wǎng)絡招聘薪資影響因素研究

發(fā)布時間:2024-05-11 15:23
  隨著我國經濟結構的優(yōu)化調整與信息化時代的到來,如今網(wǎng)絡招聘越來越流行,網(wǎng)上的招聘信息也越來越多,而薪資情況是每個求職者最為關心的事情之一,所以對影響薪資因素的研究,能夠為求職者提供相關參考,使得求職者能從海量的招聘信息中獲取就業(yè)需求信息。本文利用python語言編寫爬蟲程序獲取智聯(lián)招聘中的數(shù)據(jù)分析、機器學習、數(shù)據(jù)挖掘、深度學習的崗位數(shù)據(jù),建立薪資水平的預測模型,分析在這些崗位數(shù)據(jù)中影響薪資水平的因素。本論文主要從XGBoost模型和GBDT模型這兩個方面對薪資預測模型進行了研究,主要工作內容如下:(1)采用深度優(yōu)先和寬度優(yōu)先的兩種爬蟲策略,通過多進程爬取招聘信息中的崗位數(shù)據(jù)。通過掌握XGBoost模型和GBDT模型的算法過程,為模型的研究建立理論基礎。(2)本文獲取的招聘數(shù)據(jù)中存在大量的結構化和非結構化的文本數(shù)據(jù),對結構化數(shù)據(jù)采用探索性分析及可視化技術,分析各個變量與薪資之間的影響關系。對非結構化變量中的文本數(shù)據(jù)采用了文本處理技術及可視化技術,使用這兩個技術對文本數(shù)據(jù)中的信息進行可視化處理以及利用可視化中的詞云圖提取崗位招聘數(shù)據(jù)中的技能信息。通過對結構化數(shù)據(jù)的分析及非結構化數(shù)據(jù)的技能信...

【文章頁數(shù)】:66 頁

【學位級別】:碩士

【部分圖文】:

圖2-1深度優(yōu)先算法Figure2-1depthfirstalgorithm

圖2-1深度優(yōu)先算法Figure2-1depthfirstalgorithm

第2章相關理論基礎9外一個未訪問過的鄰接頂點。(4)若頂點b尚未被訪問,則訪問頂點b并標記頂點b為已訪問。(5)繼續(xù)查找頂點b的下一個鄰接頂點c,此時c可以看作是頂點a按步奏(3)的邏輯執(zhí)行。直到連通圖中所有頂點全部訪問過為止。如圖2-1所示:圖2-1深度優(yōu)先算法Figure2-....


圖2-2寬度優(yōu)先算法Figure2-2widthfirstalgorithm

圖2-2寬度優(yōu)先算法Figure2-2widthfirstalgorithm

第2章相關理論基礎10圖2-2寬度優(yōu)先算法Figure2-2widthfirstalgorithm2.1.2工作流程爬蟲程序的主要原理是以一個初始的URL地址信息為起點來抓取網(wǎng)頁,通過初始URL地址獲取到網(wǎng)頁信息后,匹配到網(wǎng)頁所抓取的地址信息,然后又從該地址信息中提取到新的URL....


圖3-1數(shù)據(jù)崗位技能要求詞云圖

圖3-1數(shù)據(jù)崗位技能要求詞云圖

第3章數(shù)據(jù)處理及探索性數(shù)據(jù)分析26圖3-1數(shù)據(jù)崗位技能要求詞云圖Figure3-1cloudchartofdatapostskillrequirements由此可見,在崗位數(shù)據(jù)中主要的技能要求為Python語言,Java語言,Ruby語言,Shell語言,PHP語言,MySQL數(shù)....


圖3-2薪資特征的分布情況

圖3-2薪資特征的分布情況

第3章數(shù)據(jù)處理及探索性數(shù)據(jù)分析27在機器學習中,許多的模型均需要假設一個數(shù)據(jù)集或者其參數(shù)服從正態(tài)分布所以對于數(shù)據(jù)需要進行變換,數(shù)據(jù)變換是指選擇某個函數(shù),將其作用在樣本上,得到新的樣本的過程,雖然是對樣本做變換,但同時也改變了總體的分布,因為總體的任何一個樣本可能的取值也都映射到函....



本文編號:3970068

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/sjfx/3970068.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶7dc81***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com