基于深度學(xué)習(xí)的視頻UCL自動標(biāo)引及智能化推薦研究
發(fā)布時間:2021-07-04 12:16
隨著互聯(lián)網(wǎng)中視頻資源量的快速增長,信息過載問題日益突出,雖然各大視頻門戶會利用視頻特征與用戶數(shù)據(jù)特征向用戶推薦視頻,但仍存在以下兩個問題:第一,缺乏完備且規(guī)范的視頻語義特征標(biāo)引標(biāo)準(zhǔn),且常用的特征自動提取算法對視頻的語義特征提取不夠充分,導(dǎo)致視頻推薦效果不佳;第二,傳統(tǒng)單一的視頻推薦算法難以結(jié)合視頻特征和用戶特征,雖然深度學(xué)習(xí)算法可以部分解決該問題,但是在分析上述兩種特征的隱式關(guān)系方面仍存不足。針對上述問題,本文借助具有豐富語義特征的統(tǒng)一內(nèi)容標(biāo)簽(Uniform Content Label,UCL),對視頻UCL自動標(biāo)引及智能化推薦技術(shù)進(jìn)行研究,提出基于特征靈活采樣與注意力機(jī)制的視頻UCL自動標(biāo)引方法AUIMV-FFSA(Automatic UCL Indexing Method for Video based on Flexible Feature Sampling and Attention mechanism)和基于自注意力機(jī)制與模型融合的視頻推薦算法RAV-SAMF(Recommendation Algorithm for Video based on Self-Attentio...
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【部分圖文】:
012-2018網(wǎng)絡(luò)視頻、手機(jī)網(wǎng)絡(luò)視頻用戶規(guī)模使用率
東南大學(xué)碩士學(xué)位論文2故將語義特征作為視頻標(biāo)引中一部分至關(guān)重要。如果通過人工的方式抽取視頻高層語義特征,不僅費時費力,而且受人的主觀影響較大;現(xiàn)有的算法對視頻進(jìn)行高級語義特征提取,其準(zhǔn)確度仍有待提高。UCL是一種標(biāo)引互聯(lián)網(wǎng)資源語義信息的元數(shù)據(jù),由國家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》(GB/T35304-2017)所定義[3]。其結(jié)構(gòu)如圖1-2所示,它包含UCL代碼部分和UCL屬性部分,代碼部分為面向讀者的內(nèi)容導(dǎo)引,屬性部分為被標(biāo)引內(nèi)容的語義信息和管理信息。UCL具有以下三個特點:第一,UCL具有規(guī)范性,被標(biāo)引的各類、各級信息嚴(yán)格遵從UCL格式規(guī)范,存放在標(biāo)引的指定位置中。第二,UCL具有結(jié)構(gòu)靈活的特點,雖然代碼部分為固定的32字節(jié),但屬性部分除了目前所定義的一些域之外,也可以根據(jù)具體的領(lǐng)域和應(yīng)用場景自由地擴(kuò)展。第三,UCL能夠標(biāo)引豐富語義信息,包括被標(biāo)引資源的關(guān)鍵詞、作者等;诖耍琔CL被應(yīng)用在現(xiàn)行的互聯(lián)網(wǎng)結(jié)構(gòu)中,為產(chǎn)品溯源系統(tǒng)、內(nèi)容治理系統(tǒng)等應(yīng)用場景提供資源標(biāo)引,同時也能夠支持音視頻的各層次特征標(biāo)引。圖1-2統(tǒng)一內(nèi)容標(biāo)簽UCL格式示意圖[3]推薦系統(tǒng)能夠關(guān)聯(lián)用戶和信息,解決互聯(lián)網(wǎng)中信息過載的問題,使用戶發(fā)現(xiàn)自己感興趣信息的同時,也能夠使信息展現(xiàn)在對它感興趣的用戶面前。相較于搜索引擎需要用戶明確地輸入信息,被動地向用戶反饋信息,推薦系統(tǒng)無需用戶對自己的需求進(jìn)行描述,依賴用戶的歷史行為數(shù)據(jù),主動地向用戶推薦信息,同時會根據(jù)不同時間階段用戶的喜好以及被推薦資源的更新實時更換。對于海量的視頻資源,推薦系統(tǒng)的重要性不言而喻,對于YouTube視頻網(wǎng)站,個性化推薦視頻的點擊率為熱門視頻點擊率的2.07倍,個性化推薦能夠為互聯(lián)網(wǎng)的各種網(wǎng)站帶來巨大的經(jīng)濟(jì)效益;诖,如圖1-3所示,根據(jù)對中國知?
第一章緒論3的統(tǒng)計,國內(nèi)外對“個性化推薦”的關(guān)注度逐年提高。圖1-3“個性化推薦”的學(xué)術(shù)關(guān)注趨勢目前推薦常用的推薦方式有基于內(nèi)容的推薦、協(xié)同過濾推薦、基于規(guī)則的推薦以及混合模型推薦[4]。基于內(nèi)容的推薦是最早被使用的推薦算法,它首先分析物品的相似性,然后將用戶喜歡的相似商品推薦給用戶,因此需要對商品進(jìn)行完整和全面的建模以分析商品的相似性,并且存在新用戶的冷啟動問題[5];趨f(xié)同過濾的推薦方式,根據(jù)用戶與物體之間的關(guān)系,在不考慮用戶或者物品自身屬性的前提下分析商品或者用戶的相似性,進(jìn)而為用戶推薦商品,雖然不需要對商品進(jìn)行建模,能夠處理非結(jié)構(gòu)化的數(shù)據(jù),但是存在數(shù)據(jù)稀疏性和冷啟動的問題。基于規(guī)則的推薦通過分析用戶購買商品的行為,得到不同商品之間的聯(lián)系規(guī)則,進(jìn)而向用戶推薦相關(guān)的商品,不存在用戶冷啟動問題,但隨著規(guī)則的增加,存在時效性不高的問題[6];诨旌夏P偷耐扑]的原理是建立多個推薦算法模型,通過投票法確定最后的推薦結(jié)果,雖然理論上混合模型的最終效果不會比單一模型的效果差,但是其算法的復(fù)雜度要高于單個模型[7]。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個分支,得益于GPU等硬件水平的快速發(fā)展,近些年一直是學(xué)術(shù)界的研究熱點。深度學(xué)習(xí)算法是對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的發(fā)展,含有多個隱藏層的非線性網(wǎng)絡(luò)結(jié)構(gòu),無需手動構(gòu)造特征,能夠自動抽取數(shù)據(jù)更抽象和更本質(zhì)的特征描述。2006年,圖靈獎獲得者Hinton及其團(tuán)隊第一次提出了深度學(xué)習(xí)的思想和深度學(xué)習(xí)的訓(xùn)練方法,并于2012年與學(xué)生提出基于卷積神經(jīng)網(wǎng)絡(luò)的AlexNet模型[8],在imageNet競賽中取得了優(yōu)異的成績,引起了學(xué)術(shù)界的廣泛關(guān)注。除了在圖像處理領(lǐng)域,近些年深度學(xué)習(xí)在語音識別、自然語言處理和個性化推薦等領(lǐng)域取得了突破性的進(jìn)展,也被應(yīng)用于推薦?
【參考文獻(xiàn)】:
期刊論文
[1]基于用戶的協(xié)同過濾(UserCF)新聞推薦算法研究[J]. 潘麗芳,張大龍,李慧. 山西師范大學(xué)學(xué)報(自然科學(xué)版). 2018(04)
[2]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機(jī)學(xué)報. 2018(07)
[3]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機(jī)學(xué)報. 2017(06)
[4]顏色紋理形狀特征分層融合圖像檢索方法研究[J]. 李冰. 西南師范大學(xué)學(xué)報(自然科學(xué)版). 2017(01)
[5]優(yōu)化稀疏數(shù)據(jù)集提高協(xié)同過濾推薦系統(tǒng)質(zhì)量的方法[J]. 劉慶鵬,陳明銳. 計算機(jī)應(yīng)用. 2012(04)
碩士論文
[1]視頻語義標(biāo)注研究及原型實現(xiàn)[D]. 鞠峰.山東大學(xué) 2012
本文編號:3264772
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【部分圖文】:
012-2018網(wǎng)絡(luò)視頻、手機(jī)網(wǎng)絡(luò)視頻用戶規(guī)模使用率
東南大學(xué)碩士學(xué)位論文2故將語義特征作為視頻標(biāo)引中一部分至關(guān)重要。如果通過人工的方式抽取視頻高層語義特征,不僅費時費力,而且受人的主觀影響較大;現(xiàn)有的算法對視頻進(jìn)行高級語義特征提取,其準(zhǔn)確度仍有待提高。UCL是一種標(biāo)引互聯(lián)網(wǎng)資源語義信息的元數(shù)據(jù),由國家標(biāo)準(zhǔn)《統(tǒng)一內(nèi)容標(biāo)簽格式規(guī)范》(GB/T35304-2017)所定義[3]。其結(jié)構(gòu)如圖1-2所示,它包含UCL代碼部分和UCL屬性部分,代碼部分為面向讀者的內(nèi)容導(dǎo)引,屬性部分為被標(biāo)引內(nèi)容的語義信息和管理信息。UCL具有以下三個特點:第一,UCL具有規(guī)范性,被標(biāo)引的各類、各級信息嚴(yán)格遵從UCL格式規(guī)范,存放在標(biāo)引的指定位置中。第二,UCL具有結(jié)構(gòu)靈活的特點,雖然代碼部分為固定的32字節(jié),但屬性部分除了目前所定義的一些域之外,也可以根據(jù)具體的領(lǐng)域和應(yīng)用場景自由地擴(kuò)展。第三,UCL能夠標(biāo)引豐富語義信息,包括被標(biāo)引資源的關(guān)鍵詞、作者等;诖耍琔CL被應(yīng)用在現(xiàn)行的互聯(lián)網(wǎng)結(jié)構(gòu)中,為產(chǎn)品溯源系統(tǒng)、內(nèi)容治理系統(tǒng)等應(yīng)用場景提供資源標(biāo)引,同時也能夠支持音視頻的各層次特征標(biāo)引。圖1-2統(tǒng)一內(nèi)容標(biāo)簽UCL格式示意圖[3]推薦系統(tǒng)能夠關(guān)聯(lián)用戶和信息,解決互聯(lián)網(wǎng)中信息過載的問題,使用戶發(fā)現(xiàn)自己感興趣信息的同時,也能夠使信息展現(xiàn)在對它感興趣的用戶面前。相較于搜索引擎需要用戶明確地輸入信息,被動地向用戶反饋信息,推薦系統(tǒng)無需用戶對自己的需求進(jìn)行描述,依賴用戶的歷史行為數(shù)據(jù),主動地向用戶推薦信息,同時會根據(jù)不同時間階段用戶的喜好以及被推薦資源的更新實時更換。對于海量的視頻資源,推薦系統(tǒng)的重要性不言而喻,對于YouTube視頻網(wǎng)站,個性化推薦視頻的點擊率為熱門視頻點擊率的2.07倍,個性化推薦能夠為互聯(lián)網(wǎng)的各種網(wǎng)站帶來巨大的經(jīng)濟(jì)效益;诖,如圖1-3所示,根據(jù)對中國知?
第一章緒論3的統(tǒng)計,國內(nèi)外對“個性化推薦”的關(guān)注度逐年提高。圖1-3“個性化推薦”的學(xué)術(shù)關(guān)注趨勢目前推薦常用的推薦方式有基于內(nèi)容的推薦、協(xié)同過濾推薦、基于規(guī)則的推薦以及混合模型推薦[4]。基于內(nèi)容的推薦是最早被使用的推薦算法,它首先分析物品的相似性,然后將用戶喜歡的相似商品推薦給用戶,因此需要對商品進(jìn)行完整和全面的建模以分析商品的相似性,并且存在新用戶的冷啟動問題[5];趨f(xié)同過濾的推薦方式,根據(jù)用戶與物體之間的關(guān)系,在不考慮用戶或者物品自身屬性的前提下分析商品或者用戶的相似性,進(jìn)而為用戶推薦商品,雖然不需要對商品進(jìn)行建模,能夠處理非結(jié)構(gòu)化的數(shù)據(jù),但是存在數(shù)據(jù)稀疏性和冷啟動的問題。基于規(guī)則的推薦通過分析用戶購買商品的行為,得到不同商品之間的聯(lián)系規(guī)則,進(jìn)而向用戶推薦相關(guān)的商品,不存在用戶冷啟動問題,但隨著規(guī)則的增加,存在時效性不高的問題[6];诨旌夏P偷耐扑]的原理是建立多個推薦算法模型,通過投票法確定最后的推薦結(jié)果,雖然理論上混合模型的最終效果不會比單一模型的效果差,但是其算法的復(fù)雜度要高于單個模型[7]。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個分支,得益于GPU等硬件水平的快速發(fā)展,近些年一直是學(xué)術(shù)界的研究熱點。深度學(xué)習(xí)算法是對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的發(fā)展,含有多個隱藏層的非線性網(wǎng)絡(luò)結(jié)構(gòu),無需手動構(gòu)造特征,能夠自動抽取數(shù)據(jù)更抽象和更本質(zhì)的特征描述。2006年,圖靈獎獲得者Hinton及其團(tuán)隊第一次提出了深度學(xué)習(xí)的思想和深度學(xué)習(xí)的訓(xùn)練方法,并于2012年與學(xué)生提出基于卷積神經(jīng)網(wǎng)絡(luò)的AlexNet模型[8],在imageNet競賽中取得了優(yōu)異的成績,引起了學(xué)術(shù)界的廣泛關(guān)注。除了在圖像處理領(lǐng)域,近些年深度學(xué)習(xí)在語音識別、自然語言處理和個性化推薦等領(lǐng)域取得了突破性的進(jìn)展,也被應(yīng)用于推薦?
【參考文獻(xiàn)】:
期刊論文
[1]基于用戶的協(xié)同過濾(UserCF)新聞推薦算法研究[J]. 潘麗芳,張大龍,李慧. 山西師范大學(xué)學(xué)報(自然科學(xué)版). 2018(04)
[2]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機(jī)學(xué)報. 2018(07)
[3]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機(jī)學(xué)報. 2017(06)
[4]顏色紋理形狀特征分層融合圖像檢索方法研究[J]. 李冰. 西南師范大學(xué)學(xué)報(自然科學(xué)版). 2017(01)
[5]優(yōu)化稀疏數(shù)據(jù)集提高協(xié)同過濾推薦系統(tǒng)質(zhì)量的方法[J]. 劉慶鵬,陳明銳. 計算機(jī)應(yīng)用. 2012(04)
碩士論文
[1]視頻語義標(biāo)注研究及原型實現(xiàn)[D]. 鞠峰.山東大學(xué) 2012
本文編號:3264772
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3264772.html
最近更新
教材專著