基于文本挖掘的數據分析崗位人才需求分析
發(fā)布時間:2021-09-08 18:35
隨著大數據時代的到來,數據分析崗位一躍成為當今備受關注冉冉升起的新星,各行各業(yè)都需要具備數據分析技能的人才,然而就在數據分析崗位需求量日益增加的同時,還是有很多專業(yè)十分對口的應屆畢業(yè)生存在就業(yè)困難的情況。因此本文旨在探究就業(yè)市場上數據分析人才的招聘情況,挖掘出企業(yè)方對于數據分析人才的要求,從而為學校的人才培養(yǎng)以及想從事數據分析崗位的求職者提供一些參考。本文從前程無憂招聘網站中爬取了11224條數據分析崗位招聘信息,首先,采用描述性統計,根據公司所有權性質、公司規(guī)模、行業(yè)分布三方面刻畫需要數據分析崗位的公司,從公司、行業(yè)、地區(qū)三個角度比較數據分析崗位的需求量差異,從學歷、工作經驗、技能要求三方面看公司對數據分析崗位的具體要求,并探究不同地區(qū)、行業(yè)、公司的薪資差異;其次,對各個地區(qū)的崗位要求進行主題詞提取,構建LDA主題模型,輸出各地區(qū)對數據分析崗位的特征詞,探究地區(qū)間的差異;最后,對崗位要求進行文本聚類,利用預訓練的Word2vec模型對文本進行向量化,再使用Single-pass聚類,最后將各個類別的數據分析崗位從技能要求、地區(qū)分布、行業(yè)分布、薪資水平四方面進行比較。最后得出民營企業(yè)、...
【文章來源】:江西財經大學江西省
【文章頁數】:87 頁
【學位級別】:碩士
【部分圖文】:
前程無憂詳細信息網頁
講煌騁唬?薹ń?瀉嵯蜃菹蛞約扒?虻確矯嫘階識員齲??此在預處理階段需要解決薪資格式不統一。所使用的工具有access、python。解決思路如下,首先,需要知道這11224個樣本中,薪資的格式和單位共有多少種不同的形式。下一步就是根據不同形式,在python中使用正則表達式和條件語句結構,生成薪資統一的新變量,并將新數據框存儲到CSV文件中。在access中進行去重操作及LIKE近似匹配,發(fā)現薪資共有四種格式:1.x-y萬/月;2.x-y萬/年;3.x-y千/月;4.x元/天;目的是將這些全都統一成“千/月”的單位,因此轉化的邏輯框架如下圖。圖2-3薪資預處理思路圖
基于文本挖掘的數據分析崗位人才需求分析163數據分析崗的主要特征3.1樣本公司畫像根據爬取到的發(fā)布招聘廣告的公司信息,可以分析得到對數據分析人才有所需求的公司畫像。根據數據情況,可以從三方面刻畫需要數據分析人才的公司,分別是公司所有權性質,人數規(guī)模以及所屬行業(yè)。(1)公司所有權性質圖3-1發(fā)布招聘信息的公司其屬性分布圖在11224個樣本中,發(fā)布數據分析人才招聘信息最多的公司是民營公司,共計8413家,占比75.04%;其次是外資企業(yè),共計851家,占比7.59%;發(fā)布量排名第三的是合資公司跟上市公司,分別有653、657家,均占比約5.8%;國企跟創(chuàng)業(yè)公司也對數據分析類人才有所需求,在樣本中共有368家(3.28%)國企以及198家(1.77%)創(chuàng)業(yè)公司發(fā)布了數據分析招聘信息;外企代表處,事業(yè)單位,非盈利機構對數據分析人才的招聘發(fā)布量較少。(2)公司規(guī)模從圖3-2中可以看出,發(fā)布招聘數據分析崗位的公司規(guī)模集中在50-150人及150-500人的中小型企業(yè),分別是3491家及2795家,共占據數據分析需求市場56%的份額;員工數量少于50人的小企業(yè)緊隨其后,共有1779家,占比約16%;規(guī)模上千的企業(yè)對數據分析人才招聘信息的發(fā)布量較多,規(guī)模為1000-5000人的企業(yè)有1377家(12.27%),規(guī)模為500-1000人的企業(yè)有1188家(10.58%);規(guī)模近萬的大型規(guī)模企業(yè)由于人員較為飽和,招聘數據分析人才的需求較少,因此發(fā)布數據分析招聘信息且規(guī)模在10000人以上的企業(yè)僅有352家,規(guī)模為5000-10000人的企業(yè)僅242家。
【參考文獻】:
期刊論文
[1]面向社交媒體評論的子話題挖掘研究[J]. 夏麗華,韓冬梅. 情報雜志. 2020(04)
[2]基于詞向量和增量聚類的短文本聚類算法[J]. 楊波,楊文忠,殷亞博,何雪琴,袁婷婷,劉澤洋. 計算機工程與設計. 2019(10)
[3]基于灰色模型的網絡招聘信息人才趨勢預測[J]. 李趙興. 榆林學院學報. 2019(02)
[4]中美高校圖書館崗位招聘對比分析[J]. 曾偉忠,胡惠芳. 圖書館學研究. 2018(23)
[5]基于模糊匹配的招聘網頁技能術語抽取研究[J]. 孫瑜,莫凌飛. 信息技術與信息化. 2018(11)
[6]一種具有新主題偏向性的短文本動態(tài)聚類方法[J]. 朱映雪,黃瑞章,馬燦. 山東大學學報(工學版). 2018(06)
[7]基于數據挖掘的互聯網行業(yè)崗位類型分析[J]. 詹翠芬. 計算機產品與流通. 2018(07)
[8]基于深度學習的數據科學招聘實體自動抽取及分析研究[J]. 王東波,胡昊天,周鑫,朱丹浩. 圖書情報工作. 2018(13)
[9]國內招聘類網站的數據類崗位人才需求特征挖掘[J]. 張俊峰,魏瑞斌. 情報雜志. 2018(06)
[10]會計人才需求問題研究——基于會計人才的市場調查[J]. 羅玉波,張冬霞. 廣東石油化工學院學報. 2018(02)
博士論文
[1]基于內容的互聯網輿情信息挖掘關鍵技術研究[D]. 劉玉國.山東大學 2011
碩士論文
[1]基于Web招聘信息的文本挖掘系統研究[D]. 鐘曉旭.合肥工業(yè)大學 2010
本文編號:3391285
【文章來源】:江西財經大學江西省
【文章頁數】:87 頁
【學位級別】:碩士
【部分圖文】:
前程無憂詳細信息網頁
講煌騁唬?薹ń?瀉嵯蜃菹蛞約扒?虻確矯嫘階識員齲??此在預處理階段需要解決薪資格式不統一。所使用的工具有access、python。解決思路如下,首先,需要知道這11224個樣本中,薪資的格式和單位共有多少種不同的形式。下一步就是根據不同形式,在python中使用正則表達式和條件語句結構,生成薪資統一的新變量,并將新數據框存儲到CSV文件中。在access中進行去重操作及LIKE近似匹配,發(fā)現薪資共有四種格式:1.x-y萬/月;2.x-y萬/年;3.x-y千/月;4.x元/天;目的是將這些全都統一成“千/月”的單位,因此轉化的邏輯框架如下圖。圖2-3薪資預處理思路圖
基于文本挖掘的數據分析崗位人才需求分析163數據分析崗的主要特征3.1樣本公司畫像根據爬取到的發(fā)布招聘廣告的公司信息,可以分析得到對數據分析人才有所需求的公司畫像。根據數據情況,可以從三方面刻畫需要數據分析人才的公司,分別是公司所有權性質,人數規(guī)模以及所屬行業(yè)。(1)公司所有權性質圖3-1發(fā)布招聘信息的公司其屬性分布圖在11224個樣本中,發(fā)布數據分析人才招聘信息最多的公司是民營公司,共計8413家,占比75.04%;其次是外資企業(yè),共計851家,占比7.59%;發(fā)布量排名第三的是合資公司跟上市公司,分別有653、657家,均占比約5.8%;國企跟創(chuàng)業(yè)公司也對數據分析類人才有所需求,在樣本中共有368家(3.28%)國企以及198家(1.77%)創(chuàng)業(yè)公司發(fā)布了數據分析招聘信息;外企代表處,事業(yè)單位,非盈利機構對數據分析人才的招聘發(fā)布量較少。(2)公司規(guī)模從圖3-2中可以看出,發(fā)布招聘數據分析崗位的公司規(guī)模集中在50-150人及150-500人的中小型企業(yè),分別是3491家及2795家,共占據數據分析需求市場56%的份額;員工數量少于50人的小企業(yè)緊隨其后,共有1779家,占比約16%;規(guī)模上千的企業(yè)對數據分析人才招聘信息的發(fā)布量較多,規(guī)模為1000-5000人的企業(yè)有1377家(12.27%),規(guī)模為500-1000人的企業(yè)有1188家(10.58%);規(guī)模近萬的大型規(guī)模企業(yè)由于人員較為飽和,招聘數據分析人才的需求較少,因此發(fā)布數據分析招聘信息且規(guī)模在10000人以上的企業(yè)僅有352家,規(guī)模為5000-10000人的企業(yè)僅242家。
【參考文獻】:
期刊論文
[1]面向社交媒體評論的子話題挖掘研究[J]. 夏麗華,韓冬梅. 情報雜志. 2020(04)
[2]基于詞向量和增量聚類的短文本聚類算法[J]. 楊波,楊文忠,殷亞博,何雪琴,袁婷婷,劉澤洋. 計算機工程與設計. 2019(10)
[3]基于灰色模型的網絡招聘信息人才趨勢預測[J]. 李趙興. 榆林學院學報. 2019(02)
[4]中美高校圖書館崗位招聘對比分析[J]. 曾偉忠,胡惠芳. 圖書館學研究. 2018(23)
[5]基于模糊匹配的招聘網頁技能術語抽取研究[J]. 孫瑜,莫凌飛. 信息技術與信息化. 2018(11)
[6]一種具有新主題偏向性的短文本動態(tài)聚類方法[J]. 朱映雪,黃瑞章,馬燦. 山東大學學報(工學版). 2018(06)
[7]基于數據挖掘的互聯網行業(yè)崗位類型分析[J]. 詹翠芬. 計算機產品與流通. 2018(07)
[8]基于深度學習的數據科學招聘實體自動抽取及分析研究[J]. 王東波,胡昊天,周鑫,朱丹浩. 圖書情報工作. 2018(13)
[9]國內招聘類網站的數據類崗位人才需求特征挖掘[J]. 張俊峰,魏瑞斌. 情報雜志. 2018(06)
[10]會計人才需求問題研究——基于會計人才的市場調查[J]. 羅玉波,張冬霞. 廣東石油化工學院學報. 2018(02)
博士論文
[1]基于內容的互聯網輿情信息挖掘關鍵技術研究[D]. 劉玉國.山東大學 2011
碩士論文
[1]基于Web招聘信息的文本挖掘系統研究[D]. 鐘曉旭.合肥工業(yè)大學 2010
本文編號:3391285
本文鏈接:http://sikaile.net/shoufeilunwen/shuoshibiyelunwen/3391285.html