天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

面向用戶生成數(shù)據(jù)的深度語義表征技術(shù)與應(yīng)用

發(fā)布時間:2020-11-21 21:07
   隨著技術(shù)的進(jìn)步與國家的大力推動,互聯(lián)網(wǎng)逐步走向每一處角落和每一個人,各種網(wǎng)絡(luò)服務(wù)也深入了人們生活的方方面面。網(wǎng)絡(luò)用戶已從單純的信息消費(fèi)者變成了生產(chǎn)者,并產(chǎn)生了大量的用戶生成數(shù)據(jù)。而其中,實(shí)時評論與產(chǎn)品評論作為兩種最具影響力的用戶生成數(shù)據(jù),倍受業(yè)界關(guān)注。實(shí)時評論也叫彈幕,引領(lǐng)了一種新興的、允許用戶針對在線視頻發(fā)送實(shí)時評論的互動模式,這種模式大大提升了用戶的活躍程度與用戶體驗(yàn),對于在線娛樂產(chǎn)業(yè)來說蘊(yùn)含著誘人的發(fā)展前景。產(chǎn)品評論是用戶在線購買產(chǎn)品后針對產(chǎn)品的評價(jià),對其他消費(fèi)者的購買決策有重大的可量化的影響,對于企業(yè)提升競爭力和實(shí)施市場營銷一直發(fā)揮著不可替代的作用。很顯然,無論是彈幕還是產(chǎn)品評論,用戶生成數(shù)據(jù)的分析對于企業(yè)營銷、提升競爭力等方面都具有很高的應(yīng)用價(jià)值,然而它們所具有的非正式表達(dá)、主觀性與多樣性以及動態(tài)演化的領(lǐng)域?qū)I(yè)性也給其應(yīng)用帶來了巨大挑戰(zhàn),即如何表示非正式表達(dá)的語義,如何建模多樣化語義之間的關(guān)聯(lián),和如何持續(xù)性地對領(lǐng)域數(shù)據(jù)進(jìn)行有效建模?而這些挑戰(zhàn)的最根本問題就在于如何有效地進(jìn)行語義表示,即將不規(guī)整的、難以直接處理的內(nèi)容,通過表征技術(shù)轉(zhuǎn)化為低維、連續(xù)空間中的語義向量,使其更加規(guī)整且易進(jìn)行端到端建模。鑒于深度學(xué)習(xí)技術(shù)在語義表征方面的突破性成果,本文從語義層面出發(fā),研究用戶評論數(shù)據(jù)的深度語義表征技術(shù),并以此為基礎(chǔ),分別從空間層面與時間層面切人,針對用戶生成數(shù)據(jù)的“主觀性、多樣性”與“動態(tài)演化的領(lǐng)域?qū)I(yè)性”帶來的挑戰(zhàn),研究多表征空間的映射和終身表征學(xué)習(xí)技術(shù)。其具體內(nèi)容及其對應(yīng)的應(yīng)用如下:首先,針對在線視頻平臺在視頻管理中面臨的現(xiàn)實(shí)問題,以及彈幕評論的非正式表達(dá)帶來的挑戰(zhàn),提出了基于彈幕深度語義表征技術(shù)的在線視頻時序標(biāo)注方法。具體來講,為了更好地理解彈幕語義,本文設(shè)計(jì)了基于深度神經(jīng)網(wǎng)絡(luò)的時序深度語義模型,利用彈幕“時序粘滯性”假設(shè)學(xué)習(xí)彈幕的語義向量,進(jìn)而基于彈幕的語義向量構(gòu)建視頻片段的語義特征,最后使用有監(jiān)督的方法對片段的高潮類型進(jìn)行標(biāo)注。通過在真實(shí)彈幕數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),證實(shí)了基于彈幕語義表征進(jìn)行視頻時序標(biāo)注的有效性。其次,針對視頻分享平臺提升用戶體驗(yàn)的實(shí)際需求,以及彈幕所擁有的針對視頻內(nèi)容“吐槽”的特性,研究了基于表征空間映射的視頻實(shí)時評論生成方法。該方法分為多空間語義表征和表征空間映射兩部分。對于多空間語義表征,一方面要求語義向量準(zhǔn)確刻畫圖像以及文本的語義,另一方面又需要通過文本語義向量解碼出具有多樣化語義表達(dá)的彈幕,因此本文設(shè)計(jì)了針對圖像和彈幕的變分自編碼器,提出控制其表征能力與生成能力之間平衡的方法。在表征空間映射方面,為了體現(xiàn)出彈幕語義的多樣性,本文進(jìn)一步提出基于生成對抗網(wǎng)絡(luò)的表征空間映射方法,從而最終實(shí)現(xiàn)多樣化彈幕的生成。最后,在真實(shí)數(shù)據(jù)集上結(jié)合人工評測等多種指標(biāo),客觀地評估模型效果。最后,針對用戶商品評論所具有的領(lǐng)域?qū)I(yè)性,及其領(lǐng)域動態(tài)演化帶來的挑戰(zhàn),研究了基于終身表征學(xué)習(xí)的情感分類問題。在終身情感分類的應(yīng)用場景中,模型會隨著時間的推移連續(xù)執(zhí)行一系列的分類任務(wù),其目標(biāo)是把從歷史任務(wù)中獲得的知識用于新任務(wù),使其在新任務(wù)上的表現(xiàn)比不使用任何知識更好,F(xiàn)有的終身情感分類方法主要基于樸素貝葉斯,由于其基礎(chǔ)模型的限制,其效果仍有一定提升空間,因此,本文提出了使用循環(huán)神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ)模型的終身情感分類方法,該方法強(qiáng)調(diào)短期知識與長期知識的融合。需要強(qiáng)調(diào)的是,針對神經(jīng)網(wǎng)絡(luò)類模型在增量學(xué)習(xí)的過程中出現(xiàn)的災(zāi)難性遺忘問題,本文基于神經(jīng)元激活的稀疏性與知識積累的關(guān)系,設(shè)計(jì)了參數(shù)部分更新機(jī)制,緩解了災(zāi)難性遺忘。最后經(jīng)真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)驗(yàn)證,證實(shí)了本文提出模型的有效性與穩(wěn)定性。
【學(xué)位單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2019
【中圖分類】:TP391.1;TP181
【部分圖文】:

網(wǎng)絡(luò)應(yīng)用,用戶使用,時段,互聯(lián)網(wǎng)


?第1章緒?論???第1章緒?論??1.1研究背景及意義??互聯(lián)網(wǎng)是人類智慧的結(jié)晶、20世紀(jì)的重大科技發(fā)明、當(dāng)代先進(jìn)生產(chǎn)力的重??要標(biāo)志[1]。隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,人類進(jìn)入了連接一切的網(wǎng)絡(luò)時代。在我??國政府推進(jìn)互聯(lián)網(wǎng)發(fā)展與普及、促進(jìn)互聯(lián)網(wǎng)廣泛應(yīng)用等方面的不懈努力下,網(wǎng)絡(luò)??早已走進(jìn)千家萬戶。中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的第43次《中國互??聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》(后簡稱《報(bào)告》)顯示,2018年互聯(lián)網(wǎng)覆蓋范圍進(jìn)??一步擴(kuò)大。隨著貧困地區(qū)網(wǎng)絡(luò)基礎(chǔ)設(shè)施“最后一公里”逐步打通,流量資費(fèi)大幅??下降,居民人網(wǎng)門檻進(jìn)一步降低。截至2018年12月,我國網(wǎng)民規(guī)模達(dá)8.29億,??普及率接近60%。在互聯(lián)網(wǎng)逐步走向每一處角落和每一個人的同時,各種網(wǎng)絡(luò)??服務(wù)更是深入了人們生活的方方面面,如圖1.1所示,幾乎每時每刻都有人在與??各類網(wǎng)絡(luò)應(yīng)用打交道。??

彈幕,時間位,跳轉(zhuǎn)


但主題模型較難建模彈幕語言所具有的非正規(guī)表達(dá)。例如,“2333”用來??表示大笑,而“高能”表示高潮內(nèi)容,這些表達(dá)都和正常語言不同,很難從字面??上理解。為此,本章提出了一種基于彈幕深度語義表征的視頻理解框架,來更好??地借助彈幕信息刻畫視頻內(nèi)容,并用以為視頻的高潮片段標(biāo)注時序標(biāo)簽。??特別地,針對彈幕中普遍存在的非正式表達(dá),設(shè)計(jì)了一種將彈幕表征為語義??向量的時序深度語義模型(Temporal-Deep?Semantic?Structured?Model,T-DSSM),??該模型建立在彈幕視頻中存在的“時序粘滯性”假設(shè)上,即:出現(xiàn)在相近時間段??內(nèi)的彈幕都是用戶根據(jù)當(dāng)前視頻情節(jié)發(fā)送的,因此假設(shè)它們之間具有更高的語??義相關(guān)性。立足于該假設(shè),便可構(gòu)建彈幕兩兩之間的語義關(guān)聯(lián),進(jìn)而通過對比學(xué)??習(xí)(Contrast?Learning)算法對模型進(jìn)行訓(xùn)練。在此基礎(chǔ)上,本章進(jìn)一步探索通過??彈幕語義理解視頻內(nèi)容,借助T-DSSM表征彈幕得到的語義向量描述視頻片段??的語義,從而實(shí)現(xiàn)高潮片段的識別與內(nèi)容的時序標(biāo)注。本章>紹的工作,可以算??作是第一批探索通過使用彈幕以有監(jiān)督的方式對視頻進(jìn)行標(biāo)注。??最后,在來自bilibili平臺的真實(shí)數(shù)據(jù)集上進(jìn)行大量實(shí)驗(yàn)表明,結(jié)合T-DSSM??

數(shù)量分布,彈幕,文本長度,數(shù)據(jù)集中


數(shù)量分布??幕的相關(guān)統(tǒng)計(jì)內(nèi)容有很多,其中包括在不同類別的視頻中條長度隨視頻播放的分布變化。圖2.2展示了不同的彈幕長播放時間的分布,從圖中可以看出彈幕的長度主要集中在3個長度一般也是一個單句的字符長度?紤]到彈幕的形式以認(rèn)為觀眾一般一次只會發(fā)一個單句,而且這些彈幕句子現(xiàn)象與傳統(tǒng)的評論模式很不一樣,可以看出短句子占了很持彈幕的視頻的形式也密切相關(guān),由于觀眾會在觀看視頻此短句子能夠更好地表達(dá)用戶在觀看視頻時的感受;此外,彈幕不是短句子,而是會超過40個字符的長句子,這種彈文字,在仔細(xì)檢查完這類長彈幕之后發(fā)現(xiàn),絕大多數(shù)的長句意義句子的最后一個字的形式出現(xiàn),比如用戶會在輸入“23個“3”,以此來表達(dá)與“Id”相同含義的意思,從而能夠更段視頻十分有趣。??800000-p?■?'?'?■?—:??????
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 趙秀;;彈幕電影的受眾心理分析[J];新聞研究導(dǎo)刊;2019年10期

2 計(jì)春一;;網(wǎng)絡(luò)時代下的影視彈幕傳播簡述[J];西部廣播電視;2019年11期

3 李爍文;;2018年十大彈幕詞語言特點(diǎn)分析[J];新余學(xué)院學(xué)報(bào);2019年04期

4 張曜多;;彈幕視頻的流行研究[J];傳媒國際評論;2015年00期

5 熊曉慶;高尚;;經(jīng)典影視劇的淪陷:彈幕狂歡下的審美嬗變及倫理反思[J];電影文學(xué);2018年22期

6 高沛?zhèn)?;彈幕視頻特性與受眾互動行為探析[J];傳播與版權(quán);2018年11期

7 賀成;;別讓彈幕把熒屏搞得烏煙瘴氣[J];聲屏世界;2018年11期

8 孫振虎;趙甜;;參與式文化視角下的彈幕視頻分析[J];當(dāng)代傳播;2018年06期

9 劉莎莎;劉坤;;探析彈幕視頻的發(fā)展優(yōu)勢及問題[J];傳媒論壇;2018年22期

10 楊希;;大學(xué)生彈幕族亞文化現(xiàn)象檢視[J];高校輔導(dǎo)員學(xué)刊;2019年01期


相關(guān)博士學(xué)位論文 前3條

1 呂廣奕;面向用戶生成數(shù)據(jù)的深度語義表征技術(shù)與應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2019年

2 段朝輝;活動理論視角下在線視頻學(xué)習(xí)中不同學(xué)習(xí)風(fēng)格者的交互活動模式及作用機(jī)制[D];華中師范大學(xué);2018年

3 何明;面向在線視頻彈幕數(shù)據(jù)的挖掘方法研究[D];中國科學(xué)技術(shù)大學(xué);2018年


相關(guān)碩士學(xué)位論文 前10條

1 皇甫旭梅;狂歡理論視域下的彈幕視頻研究[D];武漢大學(xué);2017年

2 楊晨;網(wǎng)絡(luò)視頻平臺的彈幕用語現(xiàn)狀調(diào)查研究[D];沈陽師范大學(xué);2019年

3 葛欣怡;彈幕在不同場景中的傳播效果探究[D];北京郵電大學(xué);2019年

4 梁晨;彈幕與評論對網(wǎng)絡(luò)視頻流行度的影響差異研究[D];北京郵電大學(xué);2019年

5 宣一鳴;基于人物角色的視頻彈幕多維度分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2019年

6 曾婧;面向“一起看”直播類型的直播助手設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2019年

7 孫瑋潔;彈幕視頻中的互動儀式鏈模型研究及情感能量模型探究[D];廈門大學(xué);2018年

8 管憲任;基于使用與滿足理論的彈幕使用動機(jī)研究[D];武漢理工大學(xué);2018年

9 朱鈺涵;在線視頻社區(qū)中彈幕信息交互群體的用戶畫像研究[D];南京大學(xué);2019年

10 李茹欣;視頻彈幕的語言學(xué)研究[D];陜西師范大學(xué);2018年



本文編號:2893599

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2893599.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2fdf5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com