基于GPU的支持向量機(jī)文本挖掘算法的研究
本文關(guān)鍵詞:基于格網(wǎng)單元的縣級(jí)土地利用總體規(guī)劃生態(tài)環(huán)境影響評(píng)價(jià)方法與應(yīng)用,由筆耕文化傳播整理發(fā)布。
《北京郵電大學(xué)》 2014年
基于GPU的支持向量機(jī)文本挖掘算法的研究
王亮
【摘要】:在21世紀(jì),隨著互聯(lián)網(wǎng)信息的大規(guī)模累積,在互聯(lián)網(wǎng)中充斥大量的文本數(shù)據(jù)。對(duì)網(wǎng)絡(luò)中的文本數(shù)據(jù)進(jìn)行收集,再通過數(shù)據(jù)文本挖據(jù)的方法進(jìn)行整合、預(yù)處理、建模訓(xùn)練和最終的預(yù)測(cè),可以完成聚類、分類和推薦等重要的決策。這一類的技術(shù)是目前計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域研究的熱點(diǎn)和焦點(diǎn),也是在大數(shù)據(jù)時(shí)代解決問題的關(guān)鍵途徑。 支持向量機(jī)算法是一個(gè)經(jīng)典的分類算法,它適合解決小數(shù)據(jù)集的分類問題。當(dāng)數(shù)據(jù)集的規(guī)模比較大時(shí),支持向量機(jī)的算法的效果不是很好,它需要付出較大的內(nèi)存空間的代價(jià)而且需要更多的訓(xùn)練時(shí)間去建模。如何高速的訓(xùn)練大規(guī)模的數(shù)據(jù)集,是支持向量機(jī)領(lǐng)域研究的熱點(diǎn)。目前存在很多高性能的并行化計(jì)算模型,基于GPU的CUDA編程就是其中的一種,它跟其他的計(jì)算方式相比,有著個(gè)人計(jì)算機(jī)先天優(yōu)勢(shì),僅僅依靠自己的力量就可以進(jìn)行高速的計(jì)算。 本文將支持向量機(jī)和GPU編程相結(jié)合,完成了LIBSVM算法的并行化改進(jìn),保證預(yù)測(cè)精確度基本不下降的前提下,訓(xùn)練和預(yù)測(cè)階段的計(jì)算效率得到了一定提升。本文完成的主要工作如下:針對(duì)高性能計(jì)算的起源和發(fā)展做了簡(jiǎn)單的回顧與陳述,重點(diǎn)研究了基于GPU的CUDA的體系結(jié)構(gòu)和它所帶來的在GPU上編程的革新。針對(duì)基于GPU的CUDA編程體系做了深入和全面地研究,對(duì)SVM算法的原理做了完整和詳細(xì)的研究與分析。進(jìn)行了基于LIBSVM的若干經(jīng)典數(shù)據(jù)集的仿真測(cè)試,完成了LIBSVM算法的訓(xùn)練和預(yù)測(cè)流程的分解,對(duì)基于LIBSVM算法的CUDA框架進(jìn)行了搭建,對(duì)算法的特點(diǎn)進(jìn)行了分析,完成了CPU和GPU計(jì)算任務(wù)的劃分,重點(diǎn)研究并完成了核函數(shù)矩陣形成的CUDA實(shí)現(xiàn),用于加速LIBSVM算法的訓(xùn)練建模和預(yù)測(cè)建模兩個(gè)過程。在不同的測(cè)試平臺(tái)上使用七組經(jīng)典的數(shù)據(jù)集進(jìn)行比對(duì)測(cè)試,從數(shù)據(jù)集本身、特征值、訓(xùn)練樣本和分類個(gè)數(shù)等多個(gè)角度對(duì)測(cè)試結(jié)果進(jìn)行了分析。 經(jīng)過改造可以有效地提升訓(xùn)練建模和預(yù)測(cè)建模的運(yùn)行效率,減少它們的運(yùn)行時(shí)間,針對(duì)特征值和樣本數(shù)很大的數(shù)據(jù)集的效果更明顯。
【關(guān)鍵詞】:
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.1;TP181
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前9條
1 陳述彭,陳秋曉,周成虎;網(wǎng)格地圖與網(wǎng)格計(jì)算[J];測(cè)繪科學(xué);2002年04期
2 程鵬飛,蔡艷輝,王華;GridGNSS——網(wǎng)格化全球衛(wèi)星導(dǎo)航系統(tǒng)[J];測(cè)繪科學(xué);2005年04期
3 韓冀中,韓承德;高性能計(jì)算技術(shù)的發(fā)展現(xiàn)狀及趨勢(shì)[J];中國工程科學(xué);2000年01期
4 夏永祥;史志才;;基于GPU和特征選擇的SVM入侵檢測(cè)模型[J];計(jì)算機(jī)工程;2012年08期
5 王慧勤;雷剛;;基于LIBSVM的風(fēng)速預(yù)測(cè)方法研究[J];科學(xué)技術(shù)與工程;2011年22期
6 羅成石;;基于LIBSVM的糧食水分?jǐn)?shù)據(jù)融合研究[J];科學(xué)技術(shù)與工程;2012年02期
7 王世春;王平根;;基于CUDA的快速車牌字符識(shí)別[J];計(jì)算機(jī)應(yīng)用與軟件;2012年10期
8 任立輝;李文東;慈興華;史曉鳳;孫政;鄭榮兒;;基于LIBSVM的石油錄井中巖屑巖性識(shí)別方法研究[J];中國海洋大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年09期
9 魏洪濤,石峰,李群,王維平;網(wǎng)格計(jì)算在軍事仿真中的應(yīng)用[J];系統(tǒng)仿真學(xué)報(bào);2005年03期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 陽安國;熊助國;劉向銅;;基于AutoCAD的網(wǎng)格化調(diào)查數(shù)據(jù)文件生成綜合方法[J];北京測(cè)繪;2007年03期
2 王華;程鵬飛;蔡艷輝;;單基站GPS差分系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)方法[J];測(cè)繪工程;2006年01期
3 王喜;楊華;范況生;;城市網(wǎng)格化管理系統(tǒng)的關(guān)鍵技術(shù)及示范應(yīng)用研究[J];測(cè)繪科學(xué);2006年04期
4 劉宇;李成名;劉德欽;馬維軍;;空間信息格網(wǎng)研究進(jìn)展[J];測(cè)繪科學(xué);2007年04期
5 楊帆;米紅;;一種基于網(wǎng)格的空間聚類方法在區(qū)域劃分中的應(yīng)用[J];測(cè)繪科學(xué);2007年S1期
6 陽安國;熊助國;劉向銅;;基于AutoCAD的城市市政信息網(wǎng)格化調(diào)查與數(shù)據(jù)集成方法[J];測(cè)繪科學(xué);2008年05期
7 祝會(huì)忠;高星偉;李明;;Winsock在網(wǎng)絡(luò)RTK數(shù)據(jù)傳輸中的應(yīng)用[J];測(cè)繪科學(xué);2009年05期
8 胡引翠;網(wǎng)格計(jì)算技術(shù)的應(yīng)用及其發(fā)展趨勢(shì)[J];測(cè)繪通報(bào);2005年03期
9 李健;呂志平;喬書波;李昌貴;;大規(guī)模連續(xù)運(yùn)行基準(zhǔn)站網(wǎng)的技術(shù)體系[J];測(cè)繪通報(bào);2009年01期
10 馬昕煒;曾永年;;基于格網(wǎng)單元的縣級(jí)土地利用總體規(guī)劃生態(tài)環(huán)境影響評(píng)價(jià)方法與應(yīng)用[J];長江流域資源與環(huán)境;2011年10期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前5條
1 李雄;黨生;;基于網(wǎng)格的復(fù)雜戰(zhàn)爭(zhēng)系統(tǒng)仿真研究[A];第二十六屆中國控制會(huì)議論文集[C];2007年
2 呂蓬;梁曉燕;李磊;李強(qiáng);;網(wǎng)格GIS在數(shù)字城市中的研究和應(yīng)用[A];中國地理信息系統(tǒng)協(xié)會(huì)第四次會(huì)員代表大會(huì)暨第十一屆年會(huì)論文集[C];2007年
3 王喜珍;滕云田;胡星星;張旸;吳瓊;周鶴鳴;;中國月震探測(cè)系統(tǒng)研制[A];中國地球物理·2009[C];2009年
4 郭達(dá)志;;天地一體化數(shù)字影像地理空間信息的獲取與更新[A];煤炭資源高效綠色開采與數(shù)字礦山學(xué)術(shù)討論會(huì)論文集[C];2005年
5 Xiyun Yang;Feifei Jiang;Xiaoning Wu;;Prediction of Lead-acid Storage Battery's Remaining Capacity Based on LM-BP Neural Network[A];第25屆中國控制與決策會(huì)議論文集[C];2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 馮麟涵;艦船系統(tǒng)抗沖擊性能全局優(yōu)化方法研究[D];哈爾濱工程大學(xué);2009年
2 鄭偉;聯(lián)邦式圖書館資源管理模型研究[D];吉林大學(xué);2011年
3 劉民岷;基于網(wǎng)格計(jì)算的分布式仿真關(guān)鍵問題研究[D];電子科技大學(xué);2011年
4 劉嶸;集群式網(wǎng)格地理信息服務(wù)注冊(cè)中心的構(gòu)建研究[D];解放軍信息工程大學(xué);2011年
5 李健;聯(lián)合型連續(xù)運(yùn)行基準(zhǔn)站網(wǎng)的動(dòng)態(tài)定位服務(wù)機(jī)制[D];解放軍信息工程大學(xué);2011年
6 傅明;基于Web的空間數(shù)據(jù)挖掘研究[D];中南大學(xué);2004年
7 魏洪濤;基于網(wǎng)格計(jì)算的仿真任務(wù)管理與調(diào)度方法研究[D];國防科學(xué)技術(shù)大學(xué);2005年
8 張建兵;基于網(wǎng)格的空間信息服務(wù)關(guān)鍵技術(shù)研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2006年
9 危擁軍;三維GIS數(shù)據(jù)組織管理及符號(hào)化表示研究[D];解放軍信息工程大學(xué);2006年
10 阮啟明;面向區(qū)域目標(biāo)的成像偵察衛(wèi)星調(diào)度問題研究[D];國防科學(xué)技術(shù)大學(xué);2006年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 崔俊芳;邯鄲市網(wǎng)格化管理信息系統(tǒng)的研究與開發(fā)[D];河北工程大學(xué);2010年
2 張展華;網(wǎng)格計(jì)算中容錯(cuò)策略的研究[D];哈爾濱理工大學(xué);2010年
3 曹份檳;基于PCA和SVM的貨車故障檢測(cè)[D];北京交通大學(xué);2011年
4 楊麗婷;基于云計(jì)算數(shù)據(jù)存儲(chǔ)技術(shù)的研究[D];中北大學(xué);2011年
5 鄭偉偉;基于UI調(diào)用的地理信息平臺(tái)[D];太原科技大學(xué);2011年
6 馬昕煒;基于格網(wǎng)單元的縣級(jí)土地利用總體規(guī)劃生態(tài)環(huán)境影響評(píng)價(jià)方法與應(yīng)用[D];中南大學(xué);2011年
7 秦氏雪;城市網(wǎng)格化管理工作流引擎建模與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
8 賀雅璇;教育社交網(wǎng)絡(luò)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
9 劉勇燕;基于網(wǎng)格的礦井通風(fēng)計(jì)算并行處理模式研究[D];西安科技大學(xué);2003年
10 于雷易;基于空間數(shù)據(jù)網(wǎng)格的空間數(shù)據(jù)共享技術(shù)研究[D];武漢大學(xué);2004年
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 蔡艷輝,程鵬飛,李夕銀;用遞歸算法實(shí)現(xiàn)整周模糊度矢量空間的遍歷[J];測(cè)繪科學(xué);2002年04期
2 許妙忠;4D產(chǎn)品的生產(chǎn)和應(yīng)用系列講座 第三講 數(shù)字柵格地圖的生產(chǎn)和應(yīng)用[J];測(cè)繪信息與工程;2002年01期
3 趙振斌,包浩生,馬榮華;城市格網(wǎng)化及其景觀生態(tài)效應(yīng)研究——以西安市為例[J];地理科學(xué);2001年05期
4 秦昆,關(guān)澤群,李德仁,周軍其;基于柵格數(shù)據(jù)的最佳路徑分析方法研究[J];國土資源遙感;2002年02期
5 陳麗;陳靜;高新濤;王來生;;基于支持向量機(jī)與反K近鄰的分類算法研究[J];計(jì)算機(jī)工程與應(yīng)用;2010年24期
6 張小云,劉允才;高斯核支撐向量機(jī)的性能分析[J];計(jì)算機(jī)工程;2003年08期
7 史志才;夏永祥;;基于知識(shí)約簡(jiǎn)的網(wǎng)絡(luò)入侵特征提取[J];計(jì)算機(jī)工程;2011年05期
8 于海鵬;劉一星;劉鎮(zhèn)波;;基于圖像紋理特征的木材樹種識(shí)別[J];林業(yè)科學(xué);2007年04期
9 李小昱,王為,雷廷武,沈逸;多傳感器信息融合技術(shù)及在農(nóng)業(yè)工程中的應(yīng)用前景[J];農(nóng)業(yè)工程學(xué)報(bào);2003年03期
10 蔣平;朱傳祥;呂德志;高成沖;;循環(huán)式糧食干燥機(jī)的智能控制系統(tǒng)[J];農(nóng)業(yè)工程學(xué)報(bào);2006年11期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 程鵬飛;;伽利略衛(wèi)星導(dǎo)航定位系統(tǒng)最新進(jìn)展[A];地理空間信息技術(shù)與應(yīng)用——中國科協(xié)2002年學(xué)術(shù)年會(huì)測(cè)繪論文集[C];2002年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 肖洋;風(fēng)電場(chǎng)風(fēng)速和發(fā)電功率預(yù)測(cè)研究[D];東北電力大學(xué);2005年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊強(qiáng),吳中福,余平,鐘將;基于正反饋的支持向量機(jī)[J];重慶大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年05期
2 孫蕾,周明全,李丙春;一種非平衡分布數(shù)據(jù)的支持向量機(jī)新算法[J];計(jì)算機(jī)應(yīng)用;2004年12期
3 黃勇;鄭春穎;宋忠虎;;多類支持向量機(jī)算法綜述[J];計(jì)算技術(shù)與自動(dòng)化;2005年04期
4 楊強(qiáng),吳中福,余萍,鐘將;一種新型支持向量機(jī)[J];重慶大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年02期
5 張猛,付麗華,王高峰;模糊臨近支持向量機(jī)[J];計(jì)算機(jī)工程與應(yīng)用;2005年05期
6 張浩然;汪曉東;張長江;徐秀玲;;一種新型回歸支持向量機(jī)的學(xué)習(xí)算法[J];測(cè)試技術(shù)學(xué)報(bào);2006年02期
7 王曄;黃上騰;;基于間隔區(qū)域樣本數(shù)量的加權(quán)支持向量機(jī)[J];計(jì)算機(jī)工程;2006年06期
8 梁新榮;劉智勇;孫德山;毛宗源;;支持向量機(jī)在混沌系統(tǒng)預(yù)測(cè)中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用研究;2006年05期
9 盧敏;張展羽;馮寶平;賈仁輔;;基于支持向量機(jī)的區(qū)域水安全預(yù)警模型及應(yīng)用[J];計(jì)算機(jī)工程;2006年15期
10 張陽;劉永革;景旭;;一種改進(jìn)的線性支持向量機(jī)的特征篩選算法[J];西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年10期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 侯澍旻;李友榮;劉光臨;;基于支持向量機(jī)的設(shè)備振動(dòng)信號(hào)趨勢(shì)預(yù)測(cè)[A];12省區(qū)市機(jī)械工程學(xué)會(huì)2006年學(xué)術(shù)年會(huì)湖北省論文集[C];2006年
2 張曉濱;尹英順;趙培坤;馬秀蘭;;基于漸進(jìn)直推支持向量機(jī)的半對(duì)半多類文本分類[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
3 徐會(huì)敏;王玉蘭;;線性規(guī)劃支持向量機(jī)模型的研究[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
4 晏慶華;;支持向量機(jī)算法綜述[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
5 郭一楠;程健;肖大偉;楊梅;;分布式多分類支持向量機(jī)[A];2011年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第一分冊(cè))[C];2011年
6 林關(guān)成;李亞安;;一種支持向量機(jī)訓(xùn)練集選取算法改進(jìn)[A];2009’中國西部地區(qū)聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2009年
7 楊凌;劉玉樹;;基于支持向量機(jī)的坦克識(shí)別算法[A];第三屆全國數(shù)字成像技術(shù)及相關(guān)材料發(fā)展與應(yīng)用學(xué)術(shù)研討會(huì)論文摘要集[C];2004年
8 李方方;趙英凱;賈玉瑩;杜杰;;基于最小二乘支持向量機(jī)的油品質(zhì)量預(yù)測(cè)[A];第25屆中國控制會(huì)議論文集(上冊(cè))[C];2006年
9 曾江輝;耿金鳳;汪邦軍;郝建春;;面向時(shí)間序列質(zhì)量波動(dòng)預(yù)測(cè)的支持向量機(jī)回歸模型研究[A];使命與責(zé)任—以質(zhì)量方法促轉(zhuǎn)型升級(jí)——第五屆中國質(zhì)量學(xué)術(shù)與創(chuàng)新論壇論文集(上)[C];2012年
10 戴林超;吳琳麗;趙海娜;李訓(xùn)銘;;基于最小二乘支持向量機(jī)的故障預(yù)測(cè)法[A];2009年中國智能自動(dòng)化會(huì)議論文集(第六分冊(cè))[中南大學(xué)學(xué)報(bào)(增刊)][C];2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周喜川;非可信環(huán)境下的支持向量機(jī)研究[D];浙江大學(xué);2010年
2 常甜甜;支持向量機(jī)學(xué)習(xí)算法若干問題的研究[D];西安電子科技大學(xué);2010年
3 王超;三類不確定支持向量機(jī)及其應(yīng)用[D];河北大學(xué);2013年
4 杜喆;幾類支持向量機(jī)變型算法的研究[D];西安電子科技大學(xué);2009年
5 張國云;支持向量機(jī)算法及其應(yīng)用研究[D];湖南大學(xué);2006年
6 李海生;支持向量機(jī)回歸算法與應(yīng)用研究[D];華南理工大學(xué);2005年
7 李華慶;支持向量機(jī)及其在人臉識(shí)別中的應(yīng)用研究[D];上海交通大學(xué);2006年
8 劉京禮;魯棒最小二乘支持向量機(jī)研究與應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2010年
9 董春曦;支持向量機(jī)及其在入侵檢測(cè)中的應(yīng)用研究[D];西安電子科技大學(xué);2004年
10 唐發(fā)明;基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)算法研究[D];華中科技大學(xué);2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周林成;小波支持向量機(jī)在數(shù)據(jù)建模中的研究及應(yīng)用[D];江南大學(xué);2008年
2 王芳;支持向量機(jī)算法的研究及應(yīng)用[D];江南大學(xué);2008年
3 高泓;基于支持向量機(jī)的動(dòng)態(tài)預(yù)測(cè)方法與實(shí)現(xiàn)技術(shù)研究[D];大慶石油學(xué)院;2009年
4 王永吉;支持向量機(jī)泛化性能的研究及其應(yīng)用[D];江南大學(xué);2009年
5 梁宏霞;支持向量機(jī)模型研究及應(yīng)用[D];遼寧師范大學(xué);2009年
6 孫慶嘉;多類支持向量機(jī)的研究與分析[D];北京交通大學(xué);2010年
7 朱杰;基于最小二乘支持向量機(jī)的傳染病預(yù)測(cè)與研究[D];蘇州大學(xué);2009年
8 王琳;支持向量機(jī)及相關(guān)理論研究[D];遼寧師范大學(xué);2010年
9 萬家強(qiáng);支持向量機(jī)在質(zhì)量管理中的應(yīng)用研究[D];重慶理工大學(xué);2010年
10 李響;基于半監(jiān)督支持向量機(jī)的網(wǎng)絡(luò)流量分類機(jī)制的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年
本文關(guān)鍵詞:基于格網(wǎng)單元的縣級(jí)土地利用總體規(guī)劃生態(tài)環(huán)境影響評(píng)價(jià)方法與應(yīng)用,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):228782
本文鏈接:http://sikaile.net/shengtaihuanjingbaohulunwen/228782.html