SVM算法在聲音廣播內(nèi)容監(jiān)測分類中的應(yīng)用研究
發(fā)布時間:2021-12-09 19:16
本文針對廣播內(nèi)容的智能監(jiān)測,介紹了智能聲音廣播監(jiān)測系統(tǒng)在廣播內(nèi)容識別監(jiān)測方面的設(shè)計思路,以及采用SVM文本分類的方式進(jìn)行廣播違規(guī)內(nèi)容識別和分類的實現(xiàn)方法。本文還介紹了對該方法和系統(tǒng)進(jìn)行的測試和實驗情況,經(jīng)分析證明了此方法可以進(jìn)一步提升對違規(guī)廣播內(nèi)容監(jiān)測的效率和準(zhǔn)確率。
【文章來源】:廣播電視信息. 2020,27(10)
【文章頁數(shù)】:4 頁
【部分圖文】:
文本分類過程圖
TF-IDF公式是用來計算詞語的權(quán)值。在一個給定的文本中,詞頻(TF)具體指的是某個給定的詞語在該文本出現(xiàn)的頻率。對于在某個特定文件中的詞ti,它的重要性可以具體表示如圖2中的公式(1)[5]。逆向文件頻率(IDF)是指一個詞語普遍重要性的度量,某一特定詞語的IDF,是由總文件數(shù)量除以包含該詞語的文件的數(shù)量,再將這個商值取以10為底的對數(shù),具體計算如圖2中的公式(2)所示。其中,|D|是語料庫中的文件總數(shù),|{j:ti∈dj}|表示包含詞語ti的文本數(shù)量,即ni,j≠0的文本數(shù)目,如果文本不包含某詞語,則會出現(xiàn)分母為零的情況。因此,一般使用1+|{j:ti∈dj}|計算。
交互檢驗參數(shù)選取值
本文編號:3531164
【文章來源】:廣播電視信息. 2020,27(10)
【文章頁數(shù)】:4 頁
【部分圖文】:
文本分類過程圖
TF-IDF公式是用來計算詞語的權(quán)值。在一個給定的文本中,詞頻(TF)具體指的是某個給定的詞語在該文本出現(xiàn)的頻率。對于在某個特定文件中的詞ti,它的重要性可以具體表示如圖2中的公式(1)[5]。逆向文件頻率(IDF)是指一個詞語普遍重要性的度量,某一特定詞語的IDF,是由總文件數(shù)量除以包含該詞語的文件的數(shù)量,再將這個商值取以10為底的對數(shù),具體計算如圖2中的公式(2)所示。其中,|D|是語料庫中的文件總數(shù),|{j:ti∈dj}|表示包含詞語ti的文本數(shù)量,即ni,j≠0的文本數(shù)目,如果文本不包含某詞語,則會出現(xiàn)分母為零的情況。因此,一般使用1+|{j:ti∈dj}|計算。
交互檢驗參數(shù)選取值
本文編號:3531164
本文鏈接:http://sikaile.net/kejilunwen/wltx/3531164.html
最近更新
教材專著