天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

推薦系統(tǒng)中隨機(jī)森林算法的優(yōu)化與應(yīng)用

發(fā)布時間:2017-06-13 05:03

  本文關(guān)鍵詞:推薦系統(tǒng)中隨機(jī)森林算法的優(yōu)化與應(yīng)用,由筆耕文化傳播整理發(fā)布。


【摘要】:如今,推薦系統(tǒng)已成為一種熱門的與計算機(jī)學(xué)科和數(shù)據(jù)挖掘聯(lián)系緊密的技術(shù),在現(xiàn)代互聯(lián)網(wǎng)行業(yè)中有著重要的地位。隨機(jī)森林算法比其他線性分類器具有很多優(yōu)勢,不僅在結(jié)果預(yù)測的準(zhǔn)確度上有所提高,一般誤差也更小,并且對高維數(shù)據(jù)的處理也更高效,訓(xùn)練過程快速而且可以并行化實現(xiàn)。這使得隨機(jī)森林相關(guān)的優(yōu)化問題十分具有研究價值。然而,現(xiàn)階段使用的隨機(jī)森林在進(jìn)行特征選擇時屬于純隨機(jī),在保證弱化數(shù)據(jù)關(guān)聯(lián)度時的同時會導(dǎo)致模型強(qiáng)度的下降。此外,對于數(shù)據(jù)的類別分布不平衡的情況,即存在某一個或一些類別的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)小于其他類別,使用隨機(jī)森林模型進(jìn)行預(yù)測的準(zhǔn)確率會下降,并且一般誤差會增大。本文主要針對特征選擇和不平衡分類兩個問題,利用推薦系統(tǒng)競賽提供的數(shù)據(jù),對隨機(jī)森林模型的優(yōu)化問題進(jìn)行研究。以隨機(jī)森林RC形態(tài)為基礎(chǔ),利用卡方計算特征之間的相關(guān)性,對特征進(jìn)行排序,將特征分為兩個區(qū)間,分別進(jìn)行抽樣,使用特征的線性組合,完成特征選擇。針對類不平衡問題的研究,結(jié)合了隨機(jī)森林的平衡和加權(quán)兩種算法,設(shè)計了平衡加權(quán)隨機(jī)森林,針對重采樣和代價敏感學(xué)習(xí)本身的弊端進(jìn)行了改進(jìn)。并且對特征選擇的改進(jìn)和類不平衡問題的改進(jìn)算法分別進(jìn)行了實驗,利用F1值對實驗結(jié)果進(jìn)行了對比和評估,闡明了對隨機(jī)森林特征選擇和不平衡分類問題的改善成果。
【關(guān)鍵詞】:推薦系統(tǒng) 隨機(jī)森林 特征選擇 不平衡數(shù)據(jù)分類
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【目錄】:
  • 摘要3-4
  • Abstract4-11
  • 縮寫、符號清單、術(shù)語表11-12
  • 第1章 緒論12-19
  • 1.1 課題背景12-13
  • 1.2 研究現(xiàn)狀13-16
  • 1.2.1 推薦系統(tǒng)與隨機(jī)森林13-14
  • 1.2.2 特征選擇14-15
  • 1.2.3 不平衡分類15-16
  • 1.2.4 總結(jié)分析16
  • 1.3 本文的主要工作16-18
  • 1.4 論文的組織架構(gòu)18-19
  • 第2章 基礎(chǔ)研究與系統(tǒng)設(shè)計19-26
  • 2.1 推薦系統(tǒng)中分類算法的應(yīng)用19-22
  • 2.1.1 決策樹19-20
  • 2.1.2 集成方法與隨機(jī)森林20-22
  • 2.2 問題描述與系統(tǒng)設(shè)計22-23
  • 2.2.1 數(shù)據(jù)描述22
  • 2.2.2 總體設(shè)計22-23
  • 2.3 系統(tǒng)評價指標(biāo)23-25
  • 2.4 本章小結(jié)25-26
  • 第3章 數(shù)據(jù)統(tǒng)計與特征提取26-41
  • 3.1 數(shù)據(jù)統(tǒng)計與可視化26-31
  • 3.2 特征提取31-34
  • 3.2.1 會話特征31
  • 3.2.2 商品特征31-32
  • 3.2.3 時間特征32
  • 3.2.4 會話-商品特征32-33
  • 3.2.5 總結(jié)33-34
  • 3.3 數(shù)據(jù)處理34-40
  • 3.3.1 缺失值填充35-36
  • 3.3.2 異常值處理36-37
  • 3.3.3 數(shù)據(jù)標(biāo)準(zhǔn)化37-38
  • 3.3.4 離散化處理38-40
  • 3.4 本章小結(jié)40-41
  • 第4章 隨機(jī)森林模型的改進(jìn)與應(yīng)用41-58
  • 4.1 針對隨機(jī)森林的特征選擇改進(jìn)41-50
  • 4.1.1 隨機(jī)森林的基礎(chǔ)形態(tài)41-44
  • 4.1.2 改進(jìn)思想44-48
  • 4.1.3 改進(jìn)方法48-50
  • 4.2 類不平衡問題與模型改進(jìn)50-57
  • 4.2.1 平衡隨機(jī)森林50-52
  • 4.2.2 加權(quán)隨機(jī)森林52-53
  • 4.2.3 改進(jìn)思想53-55
  • 4.2.4 改進(jìn)方法55-57
  • 4.3 本章小結(jié)57-58
  • 第5章 實驗結(jié)果與分析58-72
  • 5.1 基于會話、會話-商品的隨機(jī)森林模型58-67
  • 5.1.1 模型構(gòu)建58-61
  • 5.1.2 基于會話的實驗61-66
  • 5.1.3 基于會話-商品的實驗66
  • 5.1.4 結(jié)果分析66-67
  • 5.2 隨機(jī)森林特征選擇的改進(jìn)實驗67-69
  • 5.2.1 實驗結(jié)果67-68
  • 5.2.2 結(jié)果分析68-69
  • 5.3 不平衡分類問題改進(jìn)實驗69-70
  • 5.3.1 實驗結(jié)果69-70
  • 5.3.2 結(jié)果分析70
  • 5.4 本章小結(jié)70-72
  • 第6章 總結(jié)與展望72-74
  • 6.1 總結(jié)72-73
  • 6.2 展望73-74
  • 參考文獻(xiàn)74-78
  • 致謝78

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 劉足華;熊惠霖;;基于隨機(jī)森林的目標(biāo)檢測與定位[J];計算機(jī)工程;2012年13期

2 董師師;黃哲學(xué);;隨機(jī)森林理論淺析[J];集成技術(shù);2013年01期

3 王象剛;;基于K均值隨機(jī)森林快速算法及入侵檢測中的應(yīng)用[J];科技通報;2013年08期

4 陳姝;彭小寧;;基于粒子濾波和在線隨機(jī)森林分類的目標(biāo)跟蹤[J];江蘇大學(xué)學(xué)報(自然科學(xué)版);2014年02期

5 羅知林;陳挺;蔡皖東;;一個基于隨機(jī)森林的微博轉(zhuǎn)發(fā)預(yù)測算法[J];計算機(jī)科學(xué);2014年04期

6 王麗婷;丁曉青;方馳;;基于隨機(jī)森林的人臉關(guān)鍵點(diǎn)精確定位方法[J];清華大學(xué)學(xué)報(自然科學(xué)版);2009年04期

7 李建更;高志坤;;隨機(jī)森林針對小樣本數(shù)據(jù)類權(quán)重設(shè)置[J];計算機(jī)工程與應(yīng)用;2009年26期

8 張建;武東英;劉慧生;;基于隨機(jī)森林的流量分類方法[J];信息工程大學(xué)學(xué)報;2012年05期

9 吳華芹;;基于訓(xùn)練集劃分的隨機(jī)森林算法[J];科技通報;2013年10期

10 張華偉;王明文;甘麗新;;基于隨機(jī)森林的文本分類模型研究[J];山東大學(xué)學(xué)報(理學(xué)版);2006年03期

中國重要會議論文全文數(shù)據(jù)庫 前7條

1 謝程利;王金橋;盧漢清;;核森林及其在目標(biāo)檢測中的應(yīng)用[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會議(CHCI2010)、第5屆全國普適計算學(xué)術(shù)會議(PCC2010)論文集[C];2010年

2 武曉巖;方慶偉;;基因表達(dá)數(shù)據(jù)分析的隨機(jī)森林方法及算法改進(jìn)[A];黑龍江省第十次統(tǒng)計科學(xué)討論會論文集[C];2008年

3 張?zhí)忑?梁龍;王康;李華;;隨機(jī)森林結(jié)合激光誘導(dǎo)擊穿光譜技術(shù)用于的鋼鐵分類[A];中國化學(xué)會第29屆學(xué)術(shù)年會摘要集——第19分會:化學(xué)信息學(xué)與化學(xué)計量學(xué)[C];2014年

4 相玉紅;張卓勇;;組蛋白去乙;敢种苿┑臉(gòu)效關(guān)系研究[A];第十一屆全國計算(機(jī))化學(xué)學(xué)術(shù)會議論文摘要集[C];2011年

5 張濤;李貞子;武曉巖;李康;;隨機(jī)森林回歸分析方法及在代謝組學(xué)中的應(yīng)用[A];2011年中國衛(wèi)生統(tǒng)計學(xué)年會會議論文集[C];2011年

6 馮飛翔;馮輔周;江鵬程;劉菁;劉建敏;;隨機(jī)森林和k-近鄰法在某型坦克變速箱狀態(tài)識別中的應(yīng)用[A];第八屆全國轉(zhuǎn)子動力學(xué)學(xué)術(shù)討論會論文集[C];2008年

7 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹的集合體和后向消除策略去分類P-糖蛋白化合物[A];第十屆全國計算(機(jī))化學(xué)學(xué)術(shù)會議論文摘要集[C];2009年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條

1 曹正鳳;隨機(jī)森林算法優(yōu)化研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2014年

2 雷震;隨機(jī)森林及其在遙感影像處理中應(yīng)用研究[D];上海交通大學(xué);2012年

3 岳明;基于隨機(jī)森林和規(guī)則集成法的酒類市場預(yù)測與發(fā)展戰(zhàn)略[D];天津大學(xué);2008年

4 李書艷;單點(diǎn)氨基酸多態(tài)性與疾病相關(guān)關(guān)系的預(yù)測及其機(jī)制研究[D];蘭州大學(xué);2010年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 錢維;藥品不良反應(yīng)監(jiān)測中隨機(jī)森林方法的建立與實現(xiàn)[D];第二軍醫(yī)大學(xué);2012年

2 韓燕龍;基于隨機(jī)森林的指數(shù)化投資組合構(gòu)建研究[D];華南理工大學(xué);2015年

3 賀捷;隨機(jī)森林在文本分類中的應(yīng)用[D];華南理工大學(xué);2015年

4 張文婷;交通環(huán)境下基于改進(jìn)霍夫森林的目標(biāo)檢測與跟蹤[D];華南理工大學(xué);2015年

5 李強(qiáng);基于多視角特征融合與隨機(jī)森林的蛋白質(zhì)結(jié)晶預(yù)測[D];南京理工大學(xué);2015年

6 朱玟謙;一種收斂性隨機(jī)森林在人臉檢測中的應(yīng)用研究[D];武漢理工大學(xué);2015年

7 肖宇;基于序列圖像的手勢檢測與識別算法研究[D];電子科技大學(xué);2014年

8 李慧;一種改進(jìn)的隨機(jī)森林并行分類方法在運(yùn)營商大數(shù)據(jù)的應(yīng)用[D];電子科技大學(xué);2015年

9 趙亞紅;面向多類標(biāo)分類的隨機(jī)森林算法研究[D];哈爾濱工業(yè)大學(xué);2014年

10 黎成;基于隨機(jī)森林和ReliefF的致病SNP識別方法[D];西安電子科技大學(xué);2014年


  本文關(guān)鍵詞:推薦系統(tǒng)中隨機(jī)森林算法的優(yōu)化與應(yīng)用,由筆耕文化傳播整理發(fā)布。

,

本文編號:445721

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/445721.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dacd2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com