三網(wǎng)融合下廣電文本信息的分類技術(shù)研究
本文選題:三網(wǎng)融合 + 內(nèi)容監(jiān)管; 參考:《華中科技大學(xué)》2013年碩士論文
【摘要】:三網(wǎng)融合已逐漸成為我們信息技術(shù)發(fā)展的大趨勢。在三網(wǎng)融合的大背景下,信息的傳播途徑將更加豐富、傳播時間將更短、覆蓋面將更大。由此會帶來一系列的問題:大量的色情、暴力、血腥、反動、迷信的信息會得到更廣泛、快速的傳播,產(chǎn)生更大的危害;知識產(chǎn)權(quán)難以得到保護(hù);垃圾信息充斥網(wǎng)絡(luò)。因此需要一個強(qiáng)有力的內(nèi)容監(jiān)管系統(tǒng)對整個網(wǎng)絡(luò)進(jìn)行監(jiān)管,屏蔽不良信息,過濾垃圾信息,打擊盜版,凈化網(wǎng)絡(luò)環(huán)境,為全網(wǎng)內(nèi)容可管、可控提供保障。 隨著網(wǎng)絡(luò)文字媒體的不斷涌現(xiàn)翻新,在三網(wǎng)融合的大前提下,文本信息監(jiān)管愈發(fā)顯的重要。文字內(nèi)容監(jiān)管系統(tǒng)是內(nèi)容監(jiān)管系統(tǒng)下的一個子系統(tǒng),承擔(dān)著對網(wǎng)絡(luò)中一切文字信息的監(jiān)管責(zé)任。文字監(jiān)管系統(tǒng)通過對網(wǎng)絡(luò)中的文字信息內(nèi)容進(jìn)行分析,對文本進(jìn)行自動分類,自動識別,自動處理。面對海量的文字信息,要高效的進(jìn)行處理,需要進(jìn)行文本分類。運(yùn)用文本分類方法能夠屏蔽不良信息、過濾垃圾信息、保護(hù)知識產(chǎn)權(quán)。文本分類的效率會直接影響到文字內(nèi)容監(jiān)管系統(tǒng)的工作效率,因此,改進(jìn)文本分類的算法是研究的重點(diǎn)。 特征權(quán)重計算和分類模型是影響文本分類的關(guān)鍵因素。改進(jìn)特征權(quán)重算法,使得更能表征文本類別的特征項獲得更高的權(quán)重值;改進(jìn)分類模型,使得分類的時間開銷大幅降低。通過實驗驗證,改進(jìn)后的方法準(zhǔn)確度更高,速度更快,更加適合文字內(nèi)容監(jiān)管系統(tǒng)。
[Abstract]:The integration of three networks has gradually become the major trend of our information technology development. Under the background of three-network convergence, the information dissemination way will be richer, the dissemination time will be shorter, the coverage will be bigger. This will lead to a series of problems: a lot of pornography, violence, bloody, reactionary, superstitious information will be more widespread, rapid dissemination, causing greater harm; intellectual property rights are difficult to protect; spam information flooded the Internet. Therefore, we need a strong content supervision system to supervise the whole network, screen bad information, filter garbage information, crack down on piracy, purify the network environment, and provide security for the whole network content can be managed and controllable. With the continuous emergence and renovation of network text media, text information supervision becomes more and more important under the premise of the integration of three networks. The text content supervision system is a subsystem under the content supervision system, which is responsible for the supervision of all the text information in the network. By analyzing the content of the text information in the network, the text supervision system carries on the automatic classification, the automatic recognition, the automatic processing to the text. In the face of massive text information, text classification is needed to deal with it efficiently. Text classification method can screen bad information, filter garbage information and protect intellectual property rights. The efficiency of text classification will directly affect the efficiency of text content monitoring system, so improving the algorithm of text classification is the focus of research. Feature weight calculation and classification model are the key factors affecting text classification. By improving the feature weight algorithm, the feature items of text classification can be represented more efficiently, and the classification model can be improved to reduce the time cost of classification. Experimental results show that the improved method is more accurate, faster and more suitable for text content monitoring system.
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 臺德藝;王俊;;文本分類特征權(quán)重改進(jìn)算法[J];計算機(jī)工程;2010年09期
2 孟春艷;;用于文本分類和文本聚類的特征抽取方法的研究[J];微計算機(jī)信息;2009年09期
3 彭昱忠;元昌安;王艷;覃曉;;基于內(nèi)容理解的不良信息過濾技術(shù)研究[J];計算機(jī)應(yīng)用研究;2009年02期
4 熊回香;夏立新;;漢語分詞技術(shù)綜述[J];圖書情報工作;2008年04期
5 蒲筱哥;;自動文本分類方法研究述評[J];情報科學(xué);2008年03期
6 董小國;甘立國;;基于句子重要度的特征項權(quán)重計算方法[J];計算機(jī)與數(shù)字工程;2006年08期
7 鄧宏濤;中文自動分詞系統(tǒng)的設(shè)計模型[J];計算機(jī)與數(shù)字工程;2005年04期
8 李榮陸,王建會,陳曉云,陶曉鵬,胡運(yùn)發(fā);使用最大熵模型進(jìn)行中文文本分類[J];計算機(jī)研究與發(fā)展;2005年01期
9 代六玲,黃河燕,陳肇雄;中文文本分類中特征抽取方法的比較研究[J];中文信息學(xué)報;2004年01期
10 陸玉昌,魯明羽,李凡,周立柱;向量空間法中單詞權(quán)重函數(shù)的分析和構(gòu)造[J];計算機(jī)研究與發(fā)展;2002年10期
,本文編號:1926635
本文鏈接:http://sikaile.net/falvlunwen/zhishichanquanfa/1926635.html