基于深度學(xué)習(xí)的短視頻內(nèi)容分析算法研究
發(fā)布時(shí)間:2025-01-01 09:34
隨著互聯(lián)網(wǎng)的迅速發(fā)展,智能手機(jī)技術(shù)的迅速提高,每分鐘有大量的短視頻通過社交平臺(tái)進(jìn)行分享,所以視頻內(nèi)容分析是目前機(jī)器學(xué)習(xí)和人工智能非常重要和熱門的工作。針對(duì)大規(guī)模的用戶原創(chuàng)生產(chǎn)的視頻內(nèi)容,如何進(jìn)行全方面分析是難度非常高的事情,如何從大量用戶發(fā)布的短視頻中篩選掉不良違法內(nèi)容,選出優(yōu)質(zhì)視頻分享給其他用戶,提高整個(gè)用戶分布平臺(tái)視頻的質(zhì)量也是重中之重。本文從視頻,音頻,發(fā)布者頭像的角度,從用戶的視覺,聽覺角度對(duì)視頻進(jìn)行視覺方面分析與聽覺方面分析,運(yùn)用了多個(gè)深度學(xué)習(xí)模型對(duì)這三個(gè)領(lǐng)域進(jìn)行建模,建立多套深度學(xué)習(xí)模型對(duì)視頻進(jìn)行全方位分析。首先,提出基于OPENNSFW網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行建模,改良,對(duì)發(fā)布者頭像進(jìn)行判別是否涉及色情,提升判別精準(zhǔn)率,降低判別誤殺率。然后,對(duì)視頻內(nèi)容進(jìn)行分析,首先用1)inception-v3模型結(jié)構(gòu)對(duì)視頻提取出各幀的視覺特征表達(dá);2)分別建立全連接網(wǎng)絡(luò)結(jié)構(gòu),支持向量機(jī)SVM模型,長(zhǎng)短時(shí)遞歸神經(jīng)網(wǎng)絡(luò)(LSTM)對(duì)該特征序列進(jìn)行學(xué)習(xí),并表達(dá)為相應(yīng)的視頻類別,為達(dá)到更高的準(zhǔn)確率與精準(zhǔn)率,在長(zhǎng)短時(shí)神經(jīng)網(wǎng)絡(luò)LSTM結(jié)構(gòu)基礎(chǔ)上,建立了多層LSTM,多層LSTM加Dropo...
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 與本課題有關(guān)的國(guó)內(nèi)外研究狀況
1.3 本文的主要研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 短視頻內(nèi)容分析算法研究需求分析
2.1 業(yè)務(wù)用例說明
2.2 算法設(shè)計(jì)需求分析
2.2.1 算法框架的功能性描述
2.2.2 算法框架的非功能性需求
2.3 算法架構(gòu)設(shè)計(jì)
第3章 色情判斷優(yōu)化算法
3.1 當(dāng)前的問題
3.2 數(shù)據(jù)集說明
3.3 使用原始模型OPEN-NSFW說明
3.3.1 OPEN-NSFW來歷
3.3.2 色情指數(shù)
3.4 色情計(jì)算模型再訓(xùn)練優(yōu)化FINE-TUNE
3.4.1 標(biāo)注數(shù)據(jù)推送功能設(shè)計(jì)
3.4.2 數(shù)據(jù)預(yù)處理功能
3.4.3 深度學(xué)習(xí)計(jì)算模型再訓(xùn)練優(yōu)化fine-tune
3.5 本章小結(jié)
第4章 視頻優(yōu)質(zhì)分類算法
4.1 引言
4.2 數(shù)據(jù)獲取和數(shù)據(jù)和數(shù)據(jù)預(yù)處理
4.3 模型設(shè)計(jì)
4.3.1 短視頻特征提取階段
4.3.2 全連接模型實(shí)現(xiàn)優(yōu)質(zhì)分類
4.3.3 支持向量機(jī)SVM實(shí)現(xiàn)優(yōu)質(zhì)分類
4.3.4 長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM實(shí)現(xiàn)優(yōu)質(zhì)分類
4.3.5 不同分類模型下特征組合實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
第5章 語(yǔ)音三分類算法
5.1 引言
5.2 目標(biāo)
5.3 語(yǔ)音三分類算法組成
5.4 數(shù)據(jù)
5.5 特征提取
5.6 模型構(gòu)造與遷移學(xué)習(xí)
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷
本文編號(hào):4022393
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 與本課題有關(guān)的國(guó)內(nèi)外研究狀況
1.3 本文的主要研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 短視頻內(nèi)容分析算法研究需求分析
2.1 業(yè)務(wù)用例說明
2.2 算法設(shè)計(jì)需求分析
2.2.1 算法框架的功能性描述
2.2.2 算法框架的非功能性需求
2.3 算法架構(gòu)設(shè)計(jì)
第3章 色情判斷優(yōu)化算法
3.1 當(dāng)前的問題
3.2 數(shù)據(jù)集說明
3.3 使用原始模型OPEN-NSFW說明
3.3.1 OPEN-NSFW來歷
3.3.2 色情指數(shù)
3.4 色情計(jì)算模型再訓(xùn)練優(yōu)化FINE-TUNE
3.4.1 標(biāo)注數(shù)據(jù)推送功能設(shè)計(jì)
3.4.2 數(shù)據(jù)預(yù)處理功能
3.4.3 深度學(xué)習(xí)計(jì)算模型再訓(xùn)練優(yōu)化fine-tune
3.5 本章小結(jié)
第4章 視頻優(yōu)質(zhì)分類算法
4.1 引言
4.2 數(shù)據(jù)獲取和數(shù)據(jù)和數(shù)據(jù)預(yù)處理
4.3 模型設(shè)計(jì)
4.3.1 短視頻特征提取階段
4.3.2 全連接模型實(shí)現(xiàn)優(yōu)質(zhì)分類
4.3.3 支持向量機(jī)SVM實(shí)現(xiàn)優(yōu)質(zhì)分類
4.3.4 長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM實(shí)現(xiàn)優(yōu)質(zhì)分類
4.3.5 不同分類模型下特征組合實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
第5章 語(yǔ)音三分類算法
5.1 引言
5.2 目標(biāo)
5.3 語(yǔ)音三分類算法組成
5.4 數(shù)據(jù)
5.5 特征提取
5.6 模型構(gòu)造與遷移學(xué)習(xí)
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷
本文編號(hào):4022393
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/4022393.html
最近更新
教材專著