新聞文本侵權(quán)檢測關(guān)鍵技術(shù)研究
發(fā)布時(shí)間:2024-01-20 18:49
由于微博、微信和門戶網(wǎng)站等均是公開傳播媒介,所以極易導(dǎo)致新聞內(nèi)容被抄襲、篡改或非法擴(kuò)散,繼而給新聞內(nèi)容原創(chuàng)者造成經(jīng)濟(jì)損失。文本相似度檢測是用來解決新聞內(nèi)容侵權(quán)問題的關(guān)鍵技術(shù)之一。然而,傳統(tǒng)的文本相似度檢測算法在處理海量新聞文本時(shí)難以進(jìn)行高效的相似度檢測。除此之外,傳統(tǒng)方法一般是利用字符或詞頻來提取特征以實(shí)現(xiàn)文本相似度對比,難以解決因缺乏語義信息導(dǎo)致準(zhǔn)確率不高的問題。為此,本文對新聞文本侵權(quán)檢測方法進(jìn)行研究,提出一種基于語義指紋的相似新聞文本篩選方法SF-SNTSM(Similar News Text Screening Method Based on Semantic Fingerprint)和基于BERT模型和交互推理網(wǎng)絡(luò)的新聞文本相似度檢測算法BERT-IIN-TSDA(Text Similarity Detection Algorithm Based on BERT and Interactive Inference Network),在此基礎(chǔ)上設(shè)計(jì)了新聞版權(quán)保護(hù)原型系統(tǒng),以幫助用戶實(shí)現(xiàn)高效準(zhǔn)確的侵權(quán)檢測。本文主要工作包括以下幾個(gè)方面:(1)針對海量新聞文本的檢測效率問題,本文提...
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
本文編號:3881364
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
本文編號:3881364
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3881364.html
最近更新
教材專著