天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

SVM算法在聲音廣播內(nèi)容監(jiān)測分類中的應(yīng)用研究

發(fā)布時間:2021-12-09 19:16
  本文針對廣播內(nèi)容的智能監(jiān)測,介紹了智能聲音廣播監(jiān)測系統(tǒng)在廣播內(nèi)容識別監(jiān)測方面的設(shè)計思路,以及采用SVM文本分類的方式進(jìn)行廣播違規(guī)內(nèi)容識別和分類的實現(xiàn)方法。本文還介紹了對該方法和系統(tǒng)進(jìn)行的測試和實驗情況,經(jīng)分析證明了此方法可以進(jìn)一步提升對違規(guī)廣播內(nèi)容監(jiān)測的效率和準(zhǔn)確率。 

【文章來源】:廣播電視信息. 2020,27(10)

【文章頁數(shù)】:4 頁

【部分圖文】:

SVM算法在聲音廣播內(nèi)容監(jiān)測分類中的應(yīng)用研究


文本分類過程圖

數(shù)據(jù)處理流程,內(nèi)容,詞語,文本


TF-IDF公式是用來計算詞語的權(quán)值。在一個給定的文本中,詞頻(TF)具體指的是某個給定的詞語在該文本出現(xiàn)的頻率。對于在某個特定文件中的詞ti,它的重要性可以具體表示如圖2中的公式(1)[5]。逆向文件頻率(IDF)是指一個詞語普遍重要性的度量,某一特定詞語的IDF,是由總文件數(shù)量除以包含該詞語的文件的數(shù)量,再將這個商值取以10為底的對數(shù),具體計算如圖2中的公式(2)所示。其中,|D|是語料庫中的文件總數(shù),|{j:ti∈dj}|表示包含詞語ti的文本數(shù)量,即ni,j≠0的文本數(shù)目,如果文本不包含某詞語,則會出現(xiàn)分母為零的情況。因此,一般使用1+|{j:ti∈dj}|計算。

參數(shù),訓(xùn)練集,分類器,數(shù)據(jù)集


交互檢驗參數(shù)選取值


本文編號:3531164

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/3531164.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3a627***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com