應(yīng)用導(dǎo)向的高校計(jì)算機(jī)課程數(shù)據(jù)挖掘
發(fā)布時(shí)間:2021-01-02 19:08
在當(dāng)代信息化的年代里,文本數(shù)據(jù)在高速的增長(zhǎng),人們逐漸進(jìn)入到了信息過(guò)載的時(shí)代。計(jì)算機(jī)技術(shù)的應(yīng)用已經(jīng)滲入到了人類社會(huì)生活的各個(gè)方面,計(jì)算機(jī)應(yīng)用能力掌握程度直接影響著其工作和學(xué)習(xí)的效率和質(zhì)量。隨著數(shù)據(jù)的高速增長(zhǎng),如何有效的獲取有用的信息,數(shù)據(jù)挖掘技術(shù)在這方面發(fā)揮著巨大作用。它可以幫助人們是把隱藏在看上去雜亂無(wú)章的數(shù)據(jù)中通過(guò)信息集中、萃取和提煉等方法挖掘出來(lái),以找出所研究對(duì)象的內(nèi)在規(guī)律,并提供價(jià)值參考,幫助人們快速、準(zhǔn)確的做出決策判斷。本文依據(jù)目前高校畢業(yè)生面臨就業(yè)的現(xiàn)狀和當(dāng)前國(guó)內(nèi)高等教育現(xiàn)狀,包括高校新生的增長(zhǎng)情況和高校畢業(yè)生面臨就業(yè)難的問(wèn)題,對(duì)各類招聘網(wǎng)站數(shù)據(jù)進(jìn)行數(shù)據(jù)抓取,分析當(dāng)前IT行業(yè)用人單位對(duì)計(jì)算機(jī)應(yīng)用能力的需求,就目前國(guó)內(nèi)各行業(yè)招聘信息及高校畢業(yè)生就業(yè)狀況,預(yù)測(cè)未來(lái)社會(huì)對(duì)計(jì)算機(jī)人才所需求,對(duì)IT行業(yè)就業(yè)未來(lái)發(fā)展趨勢(shì)簡(jiǎn)要分析。本文提出了一種新的衡量文本相似度的方法Adaptive Metric Selection(AMS),通過(guò)對(duì)分詞后的文本信息進(jìn)行特征提取、降維,使用自適應(yīng)選擇方法AMS對(duì)數(shù)據(jù)進(jìn)行相似度衡量,再進(jìn)行聚類分析,實(shí)驗(yàn)表明自適應(yīng)指標(biāo)選擇AMS方法在距離相似度量方面有著比較...
【文章來(lái)源】:廣州大學(xué)廣東省
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1分詞前的例子Fig.2-1Examplebeforethesplit
圖2-2分詞后的例子Fig.2-2Exampleafterthesplit
圖 2-3 一致矩陣的構(gòu)造流程圖Fig.2-3 The flow chart of the structure of the consistent matrix維后的數(shù)據(jù),經(jīng)過(guò) k 均值算法得到 5 個(gè)簇,使得 1500 篇文章都被一個(gè)。利用這些聚類類別,通過(guò)轉(zhuǎn)化把向量矢量轉(zhuǎn)變?yōu)榫仃嚨男?
【參考文獻(xiàn)】:
期刊論文
[1]基于信息融合的網(wǎng)頁(yè)文本聚類距離選擇方法[J]. 張少宏,李繼巧,羅嘉怡,謝冬青,王婧. 廣州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(01)
[2]關(guān)于數(shù)據(jù)挖掘研究現(xiàn)狀及發(fā)展趨勢(shì)的探究[J]. 任新社,陳靜遠(yuǎn). 信息通信. 2016(02)
[3]基于Active Learning的中文分詞領(lǐng)域自適應(yīng)[J]. 許華婷,張玉潔,楊曉暉,單華,徐金安,陳鈺楓. 中文信息學(xué)報(bào). 2015(05)
[4]數(shù)據(jù)挖掘研究現(xiàn)狀及發(fā)展趨勢(shì)[J]. 張莉. 赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版). 2014(18)
[5]對(duì)計(jì)算機(jī)專業(yè)教學(xué)改革的思考[J]. 張巍. 黑龍江科學(xué). 2013(10)
[6]垂直搜索引擎中分詞技術(shù)的算法研究[J]. 鄒嵩,趙詩(shī)陽(yáng),周新志. 計(jì)算機(jī)技術(shù)與發(fā)展. 2012(02)
[7]計(jì)算機(jī)專業(yè)人才需求調(diào)研報(bào)告[J]. 孫中勝,孟浩. 計(jì)算機(jī)教育. 2011(19)
[8]文本分類中特征項(xiàng)權(quán)重算法的改進(jìn)[J]. 盧志翔,蒙麗莉. 柳州師專學(xué)報(bào). 2011(04)
[9]數(shù)據(jù)挖掘研究現(xiàn)狀及發(fā)展趨勢(shì)[J]. 王惠中,彭安群. 工礦自動(dòng)化. 2011(02)
[10]從Web網(wǎng)頁(yè)上獲取一價(jià)事件常識(shí)的方法[J]. 楊帆,孫強(qiáng). 科學(xué)技術(shù)與工程. 2010(25)
碩士論文
[1]基于相關(guān)性的癌癥特征選擇及分類算法研究[D]. 彭湘華.湖南大學(xué) 2012
[2]基于機(jī)器學(xué)習(xí)的經(jīng)濟(jì)行業(yè)分類方法研究[D]. 王垚堯.哈爾濱工業(yè)大學(xué) 2011
[3]中文文本分類中互信息特征選擇方法研究[D]. 鄧彩鳳.西南大學(xué) 2011
[4]XML文檔分類方法的研究及其應(yīng)用[D]. 田偉.大連理工大學(xué) 2009
[5]基于Web文本內(nèi)容的信息過(guò)濾系統(tǒng)的研究與設(shè)計(jì)[D]. 劉七.南京理工大學(xué) 2004
本文編號(hào):2953470
【文章來(lái)源】:廣州大學(xué)廣東省
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1分詞前的例子Fig.2-1Examplebeforethesplit
圖2-2分詞后的例子Fig.2-2Exampleafterthesplit
圖 2-3 一致矩陣的構(gòu)造流程圖Fig.2-3 The flow chart of the structure of the consistent matrix維后的數(shù)據(jù),經(jīng)過(guò) k 均值算法得到 5 個(gè)簇,使得 1500 篇文章都被一個(gè)。利用這些聚類類別,通過(guò)轉(zhuǎn)化把向量矢量轉(zhuǎn)變?yōu)榫仃嚨男?
【參考文獻(xiàn)】:
期刊論文
[1]基于信息融合的網(wǎng)頁(yè)文本聚類距離選擇方法[J]. 張少宏,李繼巧,羅嘉怡,謝冬青,王婧. 廣州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(01)
[2]關(guān)于數(shù)據(jù)挖掘研究現(xiàn)狀及發(fā)展趨勢(shì)的探究[J]. 任新社,陳靜遠(yuǎn). 信息通信. 2016(02)
[3]基于Active Learning的中文分詞領(lǐng)域自適應(yīng)[J]. 許華婷,張玉潔,楊曉暉,單華,徐金安,陳鈺楓. 中文信息學(xué)報(bào). 2015(05)
[4]數(shù)據(jù)挖掘研究現(xiàn)狀及發(fā)展趨勢(shì)[J]. 張莉. 赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版). 2014(18)
[5]對(duì)計(jì)算機(jī)專業(yè)教學(xué)改革的思考[J]. 張巍. 黑龍江科學(xué). 2013(10)
[6]垂直搜索引擎中分詞技術(shù)的算法研究[J]. 鄒嵩,趙詩(shī)陽(yáng),周新志. 計(jì)算機(jī)技術(shù)與發(fā)展. 2012(02)
[7]計(jì)算機(jī)專業(yè)人才需求調(diào)研報(bào)告[J]. 孫中勝,孟浩. 計(jì)算機(jī)教育. 2011(19)
[8]文本分類中特征項(xiàng)權(quán)重算法的改進(jìn)[J]. 盧志翔,蒙麗莉. 柳州師專學(xué)報(bào). 2011(04)
[9]數(shù)據(jù)挖掘研究現(xiàn)狀及發(fā)展趨勢(shì)[J]. 王惠中,彭安群. 工礦自動(dòng)化. 2011(02)
[10]從Web網(wǎng)頁(yè)上獲取一價(jià)事件常識(shí)的方法[J]. 楊帆,孫強(qiáng). 科學(xué)技術(shù)與工程. 2010(25)
碩士論文
[1]基于相關(guān)性的癌癥特征選擇及分類算法研究[D]. 彭湘華.湖南大學(xué) 2012
[2]基于機(jī)器學(xué)習(xí)的經(jīng)濟(jì)行業(yè)分類方法研究[D]. 王垚堯.哈爾濱工業(yè)大學(xué) 2011
[3]中文文本分類中互信息特征選擇方法研究[D]. 鄧彩鳳.西南大學(xué) 2011
[4]XML文檔分類方法的研究及其應(yīng)用[D]. 田偉.大連理工大學(xué) 2009
[5]基于Web文本內(nèi)容的信息過(guò)濾系統(tǒng)的研究與設(shè)計(jì)[D]. 劉七.南京理工大學(xué) 2004
本文編號(hào):2953470
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2953470.html
最近更新
教材專著