天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于貝葉斯算法的垃圾彈幕過(guò)濾方法的研究

發(fā)布時(shí)間:2020-06-13 21:12
【摘要】:近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,觀看直播的休閑娛樂方式廣受青少年歡迎。直播最吸引人的地方在于其超強(qiáng)的實(shí)時(shí)性和互動(dòng)性,在直播間的用戶可以通過(guò)發(fā)送彈幕的方式和直播間其他用戶進(jìn)行交流。所謂“彈幕”是一種新型的用戶評(píng)論展示方式,它不像原始的評(píng)論均放在討論區(qū)展示,彈幕評(píng)論會(huì)從直播畫面上劃過(guò),使用戶具有很強(qiáng)的參與感。正是因?yàn)閺椖晃谋镜膶?shí)時(shí)性,一條彈幕文本信息可以快速地傳遞給直播間所有的用戶。所以,如果直播彈幕中存在大量包含侮辱性語(yǔ)言和不良信息的垃圾彈幕,則會(huì)影響用戶的觀看體驗(yàn),造成用戶流失。傳統(tǒng)的處理垃圾彈幕問題的方法主要是設(shè)置關(guān)鍵字和人工審閱兩種,效率和正確率很難得到保障。因此,考慮將文本分類算法運(yùn)用到彈幕文本的分類上,使得服務(wù)器能夠自動(dòng)分類出垃圾彈幕并進(jìn)行過(guò)濾,避免推向直播間所有用戶,以此提高直播間彈幕質(zhì)量,達(dá)到提高直播觀看體驗(yàn)的目的。樸素貝葉斯算法是一種常見的文本分類算法,是通過(guò)計(jì)算先驗(yàn)概率和條件概率,再利用貝葉斯定理轉(zhuǎn)換求解后驗(yàn)概率的過(guò)程。基于貝葉斯的垃圾彈幕過(guò)濾算法在貝葉斯算法的基礎(chǔ)上,結(jié)合彈幕文本所具有的平臺(tái)相關(guān)性特點(diǎn),利用用戶平臺(tái)等級(jí)特征來(lái)輔助后驗(yàn)概率對(duì)彈幕文本進(jìn)行分類。另外,結(jié)合彈幕文本所具有的連續(xù)相似性特點(diǎn),設(shè)計(jì)了一種基于LRU的彈幕分詞和分類結(jié)果的鍵值對(duì)緩存,減少算法對(duì)于連續(xù)幾條相似彈幕的重復(fù)分類計(jì)算問題,優(yōu)化算法過(guò)程。最后本文通過(guò)爬蟲算法爬取直播平臺(tái)真實(shí)的彈幕數(shù)據(jù),并利用該數(shù)據(jù)設(shè)計(jì)測(cè)試。進(jìn)行實(shí)現(xiàn)和測(cè)試后,通過(guò)選定的算法評(píng)價(jià)指標(biāo),驗(yàn)證了本文所提到的基于貝葉斯算法的垃圾彈幕過(guò)濾方法的有效性。
【圖文】:

流程圖,文本分類,彈幕,流程


華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文垃圾彈幕過(guò)濾問題的核心是要區(qū)分開正常彈幕和垃圾彈幕,彈幕同郵件和短信,也是由漢子,字母,,符號(hào),數(shù)字等組合而成的具有一定意義的文本對(duì)象,所以彈幕的判斷問題歸根到底還是文本分類的問題。文本分類是由計(jì)算機(jī)按照一定類體系或標(biāo)準(zhǔn),對(duì)文本內(nèi)容所屬類別進(jìn)行自動(dòng)預(yù)測(cè)的方法[32]。想要判斷一條彈否是垃圾彈幕,首先要對(duì)該條彈幕去除所有與文本內(nèi)容無(wú)關(guān)的無(wú)效標(biāo)記,如一些符號(hào),數(shù)字和特殊符號(hào),留下彈幕文本中的純文字?jǐn)?shù)據(jù)。然后進(jìn)行中文分詞,由幕中可能會(huì)出現(xiàn)一些如“的”“啊”等一些虛詞或是連詞,所以對(duì)分出來(lái)的詞要停用詞過(guò)濾,留下一些和語(yǔ)義關(guān)聯(lián)較大的詞。最后通過(guò)剩下的詞所表現(xiàn)的特征,分類算法對(duì)該條彈幕進(jìn)行分類,判斷其是屬于正常彈幕還是垃圾彈幕。文本分類程圖如圖 2-1 所示。

近鄰算法,特征距離


arest Neighbor)是一種采用測(cè)量不同特征之間在一個(gè)已經(jīng)訓(xùn)練好的樣本數(shù)據(jù)集合,并且該樣本新輸入一個(gè)未知類別的對(duì)象時(shí),將新數(shù)據(jù)所有的比較,然后提取出樣本中與新數(shù)據(jù)特征距離最多數(shù)屬于哪一類則把新數(shù)據(jù)分到該類[33]。類場(chǎng)景如圖 2-2 所示,已經(jīng)有一個(gè)樣本數(shù)據(jù)集在有一個(gè)新的圓形數(shù)據(jù)想要判斷其是屬于三角本集合里的其他數(shù)據(jù)的特征距離用兩個(gè)數(shù)據(jù)之形特征距離最近的是 2 個(gè)三角形和 1 個(gè)矩形, k 選擇 5 的話,與圓形特征距離最近的是 2 個(gè)三類成矩形。因此可以看出 k 近鄰算法對(duì) k 值非果。另外,每當(dāng)有一個(gè)新數(shù)據(jù)需要進(jìn)行分類時(shí)的特征距離,計(jì)算量較大。
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.3;TP18

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張曜多;;彈幕視頻的流行研究[J];傳媒國(guó)際評(píng)論;2015年00期

2 王宗楚;;試論彈幕語(yǔ)言對(duì)網(wǎng)絡(luò)劇和電視劇的影響[J];蘭州教育學(xué)院學(xué)報(bào);2019年12期

3 朱士蓉;薛趙紅;;網(wǎng)絡(luò)學(xué)習(xí)視域下彈幕用戶的動(dòng)機(jī)及其行為研究[J];宿州學(xué)院學(xué)報(bào);2019年11期

4 葛承志;;鑒定好劇,請(qǐng)看第三集“彈幕”[J];上海廣播電視研究;2019年03期

5 周曉輝;;好彈幕軟件在形勢(shì)與政策課堂教學(xué)中的應(yīng)用研究[J];當(dāng)代教育實(shí)踐與教學(xué)研究;2020年02期

6 柯雪;趙楠;彭韌;;移動(dòng)閱讀應(yīng)用中“文本彈幕”的交互體驗(yàn)研究[J];科技傳播;2020年02期

7 熊曉慶;高尚;;經(jīng)典影視劇的淪陷:彈幕狂歡下的審美嬗變及倫理反思[J];電影文學(xué);2018年22期

8 高沛?zhèn)?;彈幕視頻特性與受眾互動(dòng)行為探析[J];傳播與版權(quán);2018年11期

9 賀成;;別讓彈幕把熒屏搞得烏煙瘴氣[J];聲屏世界;2018年11期

10 孫振虎;趙甜;;參與式文化視角下的彈幕視頻分析[J];當(dāng)代傳播;2018年06期

相關(guān)會(huì)議論文 前9條

1 孫佳山;林品;高寒凝;;彈幕——數(shù)碼時(shí)代的文化消費(fèi)與媒介使用[A];青年文藝論壇(第五十九期):彈幕:數(shù)碼時(shí)代的文化消費(fèi)與媒介使用[C];2016年

2 劉nrnr;張德勝;黃元汛;;網(wǎng)絡(luò)體育彈幕手的參與特征及平臺(tái)管理研究[A];第十一屆全國(guó)體育科學(xué)大會(huì)論文摘要匯編[C];2019年

3 劉靈豫;王軍鋒;;彈幕視頻觀看體驗(yàn)要素設(shè)計(jì)研究[A];工業(yè)設(shè)計(jì)研究(第六輯)[C];2018年

4 楊芬霞;賀薈蓉;;彈幕視頻網(wǎng)站侵權(quán)問題思考——以嗶哩嗶哩網(wǎng)為例[A];傳媒法與法治新聞研究[C];2016年

5 許新芝;黃冠;;“互聯(lián)網(wǎng)+”視閾下的高校課堂參與模式構(gòu)建——以彈幕為手段的課堂參與模式研究[A];傳媒法與法治新聞研究[C];2016年

6 段朝輝;陳瑩瑩;羅Z^梅;洪建中;;在線視頻課程學(xué)習(xí)中的互動(dòng)模式與個(gè)性化研究(2):彈幕、彈題與反饋和論壇研究[A];第二十屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議--心理學(xué)與國(guó)民心理健康摘要集[C];2017年

7 吳年繼;;從嗶哩嗶哩彈幕評(píng)論看天文科學(xué)傳播的三種視頻形態(tài)[A];中國(guó)科普理論與實(shí)踐探索——第二十三屆全國(guó)科普理論研討會(huì)論文集[C];2016年

8 ;2018年世界杯盤點(diǎn)——球迷的理性與狂歡 2018年[A];艾瑞咨詢系列研究報(bào)告(2018年第7期)[C];2018年

9 雷靜;;不忘初心 走好新時(shí)代長(zhǎng)征路[A];中國(guó)教育干部網(wǎng)絡(luò)學(xué)院——高校學(xué)生黨支部書記培訓(xùn)成果匯編(2019)[C];2019年

相關(guān)重要報(bào)紙文章 前10條

1 北京外國(guó)語(yǔ)大學(xué)漢語(yǔ)言文字學(xué)專業(yè)碩士研究生 劉美麗;“彈幕”來(lái)襲[N];語(yǔ)言文字報(bào);2020年

2 子知;對(duì)彈幕“先審后播”不能小視[N];中國(guó)文化報(bào);2019年

3 本報(bào)記者 韓丹東 本報(bào)實(shí)習(xí)生 李戀潔;先審后播有利于規(guī)范彈幕內(nèi)容[N];法制日?qǐng)?bào);2019年

4 記者 徐顥哲;短視頻彈幕將實(shí)行“先審后播”[N];北京日?qǐng)?bào);2019年

5 本報(bào)記者 徐佩玉;彈幕語(yǔ)言,多元也要有規(guī)范[N];人民日?qǐng)?bào)海外版;2019年

6 記者 魏蔚;B站、A站、斗魚、虎牙暫停彈幕功能[N];北京商報(bào);2019年

7 本報(bào)記者 鐘菡;“彈幕”透露爆款?讀影評(píng)成為普遍興趣[N];解放日?qǐng)?bào);2019年

8 IT時(shí)報(bào)記者 李蘊(yùn)坤;在彈幕“大佬”B站上玩游戲[N];IT時(shí)報(bào);2019年

9 陳曦;彈幕教學(xué)讓學(xué)生成為課堂的主人[N];科技日?qǐng)?bào);2019年

10 蔣威;我看學(xué)生發(fā)“彈幕”[N];兵團(tuán)日?qǐng)?bào)(漢);2019年

相關(guān)博士學(xué)位論文 前3條

1 段朝輝;活動(dòng)理論視角下在線視頻學(xué)習(xí)中不同學(xué)習(xí)風(fēng)格者的交互活動(dòng)模式及作用機(jī)制[D];華中師范大學(xué);2018年

2 呂廣奕;面向用戶生成數(shù)據(jù)的深度語(yǔ)義表征技術(shù)與應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2019年

3 何明;面向在線視頻彈幕數(shù)據(jù)的挖掘方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2018年

相關(guān)碩士學(xué)位論文 前10條

1 武曉玲;娛樂類網(wǎng)絡(luò)脫口秀彈幕研究[D];黑龍江大學(xué);2019年

2 鄭展;基于貝葉斯算法的垃圾彈幕過(guò)濾方法的研究[D];華中科技大學(xué);2019年

3 郭絲;嗶哩嗶哩網(wǎng)站特色研究[D];黑龍江大學(xué);2019年

4 胡興;青年亞文化視角下的彈幕研究[D];江西師范大學(xué);2019年

5 潘天敏;彈幕在旅游社交服務(wù)中的應(yīng)用與設(shè)計(jì)[D];上海交通大學(xué);2016年

6 羅驍;基于分布式爬蟲的用戶評(píng)論分析系統(tǒng)[D];南京郵電大學(xué);2018年

7 陳格;青年亞文化視角下的彈幕視頻探析[D];北京印刷學(xué)院;2019年

8 張思渝;基于彈幕的翻轉(zhuǎn)課堂模式重構(gòu)研究[D];云南大學(xué);2018年

9 段煉;面向彈幕文本的情感分析研究[D];重慶郵電大學(xué);2019年

10 吳燕;互動(dòng)視角下彈幕視頻網(wǎng)站研究[D];遼寧大學(xué);2019年



本文編號(hào):2711750

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2711750.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1190a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国产精品久久三级精品| 精品欧美国产一二三区| 亚洲一区二区欧美激情| 加勒比东京热拍拍一区二区| 在线观看国产成人av天堂野外| 国产精品美女午夜福利| 亚洲第一视频少妇人妻系列| 久久国内午夜福利直播| 国产丝袜女优一区二区三区| 69老司机精品视频在线观看| 青青操日老女人的穴穴| 欧美亚洲另类久久久精品 | 大尺度激情福利视频在线观看 | 日韩一区二区三区在线欧洲| 亚洲一级在线免费观看| 亚洲淫片一区二区三区| 欧美日韩国产另类一区二区| 青青操视频在线播放免费| 99久只有精品免费视频播放| 国产又粗又长又爽又猛的视频| 欧美成人免费夜夜黄啪啪 | 综合久综合久综合久久| 国产精品丝袜美腿一区二区| 国内自拍偷拍福利视频| 国产不卡的视频在线观看| 日本一品道在线免费观看| 欧美字幕一区二区三区| 日韩一区二区免费在线观看| 国产91色综合久久高清| 中文字幕亚洲精品乱码加勒比| 日韩中文字幕有码午夜美女| 久久国产青偷人人妻潘金莲| 亚洲综合色在线视频香蕉视频| 太香蕉久久国产精品视频| 国产精品久久香蕉国产线| 九九热视频网在线观看| 黄色污污在线免费观看| 中文字幕久久精品亚洲乱码| 婷婷基地五月激情五月| 超薄肉色丝袜脚一区二区| 太香蕉久久国产精品视频|