天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于改進(jìn)的樸素貝葉斯算法和KNN算法在招聘文本分類(lèi)中的應(yīng)用

發(fā)布時(shí)間:2022-12-07 21:18
  隨著因特網(wǎng)時(shí)代的快速發(fā)展,大量的數(shù)據(jù)可以通過(guò)因特網(wǎng)來(lái)獲得。同樣的,求職者也可以從因特網(wǎng)中的招聘網(wǎng)站上獲取招聘信息。但是在這些招聘網(wǎng)站上,卻存在著一些亂象:例如,存在大量不相干的廣告,或者存在需求不明確的招聘信息。這些情況的出現(xiàn),給求職者在尋找工作的道路上平添了許多煩惱,不僅需要浪費(fèi)大量的時(shí)間去瀏覽無(wú)效的招聘信息,還需要花費(fèi)精力去分析這些招聘信息是否是正確的“招聘信息”。這些情況的出現(xiàn),嚴(yán)重影響求職者的求職效率。為了改善這種情況,可以對(duì)招聘的文本進(jìn)行分類(lèi)處理。例如將招聘信息進(jìn)行準(zhǔn)確分類(lèi),就可以剔除掉那些不屬于招聘信息的文本。那樣,求職者只需要在屬于招聘信息的文本中瀏覽自己感興趣的招聘信息即可。通常對(duì)文本進(jìn)行分類(lèi)可采用的算法有:樸素貝葉斯算法、KNN算法、支持向量機(jī)等。本論文通過(guò)分析招聘文本信息的特點(diǎn),改進(jìn)了樸素貝葉斯算法和KNN算法,并且分別實(shí)現(xiàn)了改進(jìn)后的算法,完成了對(duì)招聘文本更加準(zhǔn)確快速分類(lèi)的工作。本論文的主要研究工作為:(1)改進(jìn)了樸素貝葉斯算法,提出了No-Zero Na?ve Bayes(NZ-NB)算法,并對(duì)其進(jìn)行驗(yàn)證。通過(guò)分析招聘文本存在的特征和樸素貝葉斯算法的原理,發(fā)現(xiàn)樸素... 

【文章頁(yè)數(shù)】:60 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 引言
    1.1 研究背景與意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 國(guó)外研究現(xiàn)狀
        1.2.2 國(guó)內(nèi)研究現(xiàn)狀
    1.3 本文主要研究?jī)?nèi)容
        1.3.1 論文的主要工作
        1.3.2 論文的組織結(jié)構(gòu)
    1.4 本章小結(jié)
第2章 關(guān)于文本分類(lèi)相關(guān)技術(shù)的研究
    2.1 數(shù)據(jù)獲取
    2.2 數(shù)據(jù)預(yù)處理
        2.2.1 中文分詞
        2.2.2 去除停用詞
        2.2.3 特征選擇
    2.3 文本分類(lèi)的種類(lèi)及算法
    2.4 本章小結(jié)
第3章 基于招聘文本分類(lèi)改進(jìn)的樸素貝葉斯算法
    3.1 樸素貝葉斯算法的研究現(xiàn)狀
    3.2 面對(duì)招聘文本時(shí)樸素貝葉斯算法存在的不足
    3.3 樸素貝葉斯算法的改進(jìn)
    3.4 改進(jìn)后樸素貝葉斯算法
    3.5 實(shí)驗(yàn)設(shè)置及結(jié)果
        3.5.1 實(shí)驗(yàn)設(shè)置
        3.5.2 實(shí)驗(yàn)結(jié)果分析
    3.6 結(jié)論
    3.7 本章小結(jié)
第4章 基于招聘文本分類(lèi)改進(jìn)的KNN算法
    4.1 KNN算法的研究現(xiàn)狀
    4.2 面對(duì)招聘文本時(shí)KNN算法存在的不足
    4.3 KNN算法的改進(jìn)
    4.4 改進(jìn)后的KNN算法
    4.5 實(shí)驗(yàn)設(shè)置及結(jié)果
        4.5.1 實(shí)驗(yàn)設(shè)置
        4.5.2 實(shí)驗(yàn)結(jié)果及分析
    4.6 結(jié)論
    4.7 本章小結(jié)
第5章 總結(jié)與未來(lái)工作
    5.1 總結(jié)
    5.2 未來(lái)工作
參考文獻(xiàn)
致謝
攻讀學(xué)位期間的科研成果


【參考文獻(xiàn)】:
期刊論文
[1]基于TF-IDF算法和LDA主題模型數(shù)據(jù)挖掘技術(shù)在電力客戶(hù)抱怨文本中的應(yīng)用[J]. 李銳,張偉彬.  自動(dòng)化技術(shù)與應(yīng)用. 2018(11)
[2]基于輔助集的專(zhuān)利主題分析領(lǐng)域停用詞選取[J]. 俞琰,趙乃瑄.  數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2018(11)
[3]基于爬蟲(chóng)的智能爬行算法研究[J]. 侯美靜,崔艷鵬,胡建偉.  計(jì)算機(jī)應(yīng)用與軟件. 2018(11)
[4]基于改進(jìn)特征選擇方法的文本情感分類(lèi)研究[J]. 劉洺辛,陳晶,王麒媛.  電信科學(xué). 2018(10)
[5]分布式數(shù)據(jù)挖掘算法在熱點(diǎn)微博分析系統(tǒng)中的應(yīng)用[J]. 朱賀,黃克清.  數(shù)字通信世界. 2018(10)
[6]面向新聞文本的分類(lèi)方法的比較研究[J]. 劉測(cè),韓家新.  智能計(jì)算機(jī)與應(yīng)用. 2018(05)
[7]樸素貝葉斯算法在垃圾郵件過(guò)濾方面的應(yīng)用[J]. 徐夢(mèng)龍,黃家旺.  網(wǎng)絡(luò)安全技術(shù)與應(yīng)用. 2018(07)
[8]文本分類(lèi)中一種特征選擇方法研究[J]. 趙婧,邵雄凱,劉建舟,王春枝.  計(jì)算機(jī)應(yīng)用研究. 2019(08)
[9]基于樸素貝葉斯的農(nóng)業(yè)文本分類(lèi)方法研究[J]. 趙燕,李曉輝,周云成,張?jiān)?  節(jié)水灌溉. 2018(02)
[10]K最近鄰算法理論與應(yīng)用綜述[J]. 毋雪雁,王水花,張煜東.  計(jì)算機(jī)工程與應(yīng)用. 2017(21)

碩士論文
[1]數(shù)據(jù)挖掘分類(lèi)算法的改進(jìn)研究[D]. 陳潔.南京郵電大學(xué) 2018
[2]基于樸素貝葉斯算法的不良文本過(guò)濾技術(shù)研究及應(yīng)用[D]. 趙文.長(zhǎng)安大學(xué) 2018
[3]基于深度神經(jīng)網(wǎng)絡(luò)的文本表示與分類(lèi)研究[D]. 劉騰飛.北京交通大學(xué) 2018
[4]KNN文本分類(lèi)算法的研究[D]. 田琳.西安理工大學(xué) 2016
[5]基于支持向量機(jī)的文本分類(lèi)研究[D]. 張華鑫.西南科技大學(xué) 2016
[6]基于文本語(yǔ)義及結(jié)構(gòu)的中文文本相似度研究[D]. 鐘杰.江西財(cái)經(jīng)大學(xué) 2015
[7]企業(yè)級(jí)元搜索引擎的研究與應(yīng)用[D]. 胡楊.復(fù)旦大學(xué) 2012
[8]基于詞袋模型的醫(yī)學(xué)影像分類(lèi)的研究與實(shí)現(xiàn)[D]. 劉岳.東北大學(xué) 2012
[9]基于演化樸素貝葉斯的木馬檢測(cè)技術(shù)研究[D]. 劉永昌.華中科技大學(xué) 2012
[10]K-近鄰中文文本分類(lèi)方法的研究[D]. 魯婷.合肥工業(yè)大學(xué) 2010



本文編號(hào):3712871

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3712871.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)984a9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com