面向大規(guī)模數(shù)據(jù)分類問題的監(jiān)督學(xué)習(xí)算法研究與并行應(yīng)用
發(fā)布時(shí)間:2023-01-15 07:59
近年來,隨著科學(xué)技術(shù)的迅猛發(fā)展,產(chǎn)生了各行各業(yè)都在迅速產(chǎn)生海量數(shù)據(jù)的社會現(xiàn)象,導(dǎo)致了人們逐漸開始思考該如何最大化且最有效地使用這些數(shù)據(jù)。機(jī)器學(xué)習(xí)(Machine Learning)與深度學(xué)習(xí)(Deep Learning)技術(shù)異軍突起,分類算法作為機(jī)器學(xué)習(xí)與深度學(xué)習(xí)最典型的應(yīng)用方式,迅速成為了業(yè)界與學(xué)術(shù)界爭相努力的研究方向,該如何建立一個(gè)高效普適的分類模型這一問題開始顯得意義重大起來。此外,由于計(jì)算機(jī)處理能力的限制,分布式的并行計(jì)算框架(Distributed Parallel Computing Framework)也開始逐漸進(jìn)入人們的視線,針對不同的算法搭建出最合理的并行計(jì)算框架也逐漸成為一個(gè)新興的研究課題。為順應(yīng)這些技術(shù)需求,本文提出了從設(shè)計(jì)機(jī)器學(xué)習(xí)改進(jìn)模型、使用高效率優(yōu)化方法,到應(yīng)用優(yōu)化算法于并行計(jì)算的整套完整流程。本文的主要研究是基于機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)多分類問題。即在有類標(biāo)的訓(xùn)練集合上建立分類模型,擬合出模型的參數(shù),用于預(yù)測未知類標(biāo)的測試集合上的標(biāo)簽的方法。本文首先提出了一種將類標(biāo)的量化取值設(shè)置為k-1維歐式空間上k個(gè)頂點(diǎn)的坐標(biāo)來建模的方式,并在模型中加入降噪函數(shù)與合適的懲罰...
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 引言
1.2 國內(nèi)外研究現(xiàn)狀及分析
1.3 本文主要研究內(nèi)容
第2章 建立基于VDA方法的多類標(biāo)模型
2.1 引言
2.2 建模方法概述
2.2.1 判別分析法(DA)
2.2.2 頂點(diǎn)判別分析法(VDA)
2.2.3 本文模型設(shè)置
2.2.4 模型優(yōu)勢分析
2.2.5 懲罰項(xiàng)介紹
第3章 基于若干算法的優(yōu)化方法推導(dǎo)
3.1 引言
3.2 基于Forward-backward splitting算法的優(yōu)化方法
3.2.1 使用? -F 范數(shù)作為懲罰項(xiàng)
3.2.2 使用? -L 范數(shù)作為懲罰項(xiàng)
3.3 基于FISTA算法的優(yōu)化方法
3.3.1 使用? -F 范數(shù)作為懲罰項(xiàng)
3.3.2 使用? -L 范數(shù)作為懲罰項(xiàng)
3.4 基于ADMM算法的優(yōu)化方法
3.4.1 使用ε -不敏感函數(shù)模型
3.4.2 使用ε -不敏感函數(shù)平方模型
3.5 一些對比算法
3.5.1 構(gòu)造簡單的MSE優(yōu)化方法
3.5.2 使用固定函數(shù)產(chǎn)生替代函數(shù)
3.5.3 使用MM算法產(chǎn)生替代函數(shù)
第4章 基于divide and conquer思想的數(shù)據(jù)分割與并行計(jì)算策略
4.1 引言
4.2 divide and conquer思想概述
4.3 基于MPI與openMP的混合并行編程環(huán)境
4.3.1 網(wǎng)路連接下的MPI消息傳遞接口
4.3.2 共享內(nèi)存下的openMP編程環(huán)境
4.4 建立基于divide and conquer思想的并行策略
4.4.1 MPI多機(jī)集群上的并行階段
4.4.2 openMP上的多線程并行階段
4.4.3 參數(shù)合并階段
第5章 數(shù)值實(shí)驗(yàn)
5.1 引言
5.2 模型優(yōu)越性檢驗(yàn)
5.2.1 評價(jià)指標(biāo)簡介
5.2.2 ε -不敏感函數(shù)模型優(yōu)越性檢驗(yàn)
5.2.3 VDA的模型優(yōu)越性檢驗(yàn)
5.2.4 模型收斂速度分析
5.3 優(yōu)化方法的優(yōu)越性檢驗(yàn)
5.4 模型分類效果測試
5.5 大規(guī)模數(shù)據(jù)下并行算法實(shí)現(xiàn)與測評
5.5.1 評價(jià)指標(biāo)簡介
5.5.2 百萬曲庫數(shù)據(jù)上的并行計(jì)算
結(jié)論
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于滑動門中心點(diǎn)計(jì)算的K均值聚類并行算法研究[J]. 龔運(yùn)鴻,周新志,雷印杰. 計(jì)算機(jī)測量與控制. 2018(02)
[2]大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J]. 孟小峰,慈祥. 計(jì)算機(jī)研究與發(fā)展. 2013(01)
[3]大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J]. 李國杰,程學(xué)旗. 中國科學(xué)院院刊. 2012(06)
[4]支持向量機(jī)多類分類方法[J]. 茍博,黃賢武. 數(shù)據(jù)采集與處理. 2006(03)
本文編號:3730825
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 引言
1.2 國內(nèi)外研究現(xiàn)狀及分析
1.3 本文主要研究內(nèi)容
第2章 建立基于VDA方法的多類標(biāo)模型
2.1 引言
2.2 建模方法概述
2.2.1 判別分析法(DA)
2.2.2 頂點(diǎn)判別分析法(VDA)
2.2.3 本文模型設(shè)置
2.2.4 模型優(yōu)勢分析
2.2.5 懲罰項(xiàng)介紹
第3章 基于若干算法的優(yōu)化方法推導(dǎo)
3.1 引言
3.2 基于Forward-backward splitting算法的優(yōu)化方法
3.2.1 使用? -F 范數(shù)作為懲罰項(xiàng)
3.2.2 使用? -L 范數(shù)作為懲罰項(xiàng)
3.3 基于FISTA算法的優(yōu)化方法
3.3.1 使用? -F 范數(shù)作為懲罰項(xiàng)
3.3.2 使用? -L 范數(shù)作為懲罰項(xiàng)
3.4 基于ADMM算法的優(yōu)化方法
3.4.1 使用ε -不敏感函數(shù)模型
3.4.2 使用ε -不敏感函數(shù)平方模型
3.5 一些對比算法
3.5.1 構(gòu)造簡單的MSE優(yōu)化方法
3.5.2 使用固定函數(shù)產(chǎn)生替代函數(shù)
3.5.3 使用MM算法產(chǎn)生替代函數(shù)
第4章 基于divide and conquer思想的數(shù)據(jù)分割與并行計(jì)算策略
4.1 引言
4.2 divide and conquer思想概述
4.3 基于MPI與openMP的混合并行編程環(huán)境
4.3.1 網(wǎng)路連接下的MPI消息傳遞接口
4.3.2 共享內(nèi)存下的openMP編程環(huán)境
4.4 建立基于divide and conquer思想的并行策略
4.4.1 MPI多機(jī)集群上的并行階段
4.4.2 openMP上的多線程并行階段
4.4.3 參數(shù)合并階段
第5章 數(shù)值實(shí)驗(yàn)
5.1 引言
5.2 模型優(yōu)越性檢驗(yàn)
5.2.1 評價(jià)指標(biāo)簡介
5.2.2 ε -不敏感函數(shù)模型優(yōu)越性檢驗(yàn)
5.2.3 VDA的模型優(yōu)越性檢驗(yàn)
5.2.4 模型收斂速度分析
5.3 優(yōu)化方法的優(yōu)越性檢驗(yàn)
5.4 模型分類效果測試
5.5 大規(guī)模數(shù)據(jù)下并行算法實(shí)現(xiàn)與測評
5.5.1 評價(jià)指標(biāo)簡介
5.5.2 百萬曲庫數(shù)據(jù)上的并行計(jì)算
結(jié)論
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于滑動門中心點(diǎn)計(jì)算的K均值聚類并行算法研究[J]. 龔運(yùn)鴻,周新志,雷印杰. 計(jì)算機(jī)測量與控制. 2018(02)
[2]大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J]. 孟小峰,慈祥. 計(jì)算機(jī)研究與發(fā)展. 2013(01)
[3]大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J]. 李國杰,程學(xué)旗. 中國科學(xué)院院刊. 2012(06)
[4]支持向量機(jī)多類分類方法[J]. 茍博,黃賢武. 數(shù)據(jù)采集與處理. 2006(03)
本文編號:3730825
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3730825.html
最近更新
教材專著