天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 公安論文 >

微博敏感信息追蹤溯源關(guān)鍵技術(shù)研究

發(fā)布時間:2020-07-22 11:30
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展以及人們觀念的更新,各種在線社交媒體深刻地影響著人們的日常生活,尤其是微博已經(jīng)成為一種重要的輿論傳播途徑。但任何事物都是雙刃劍,微博產(chǎn)生的一些敏感信息也會嚴(yán)重危害網(wǎng)絡(luò)及社會秩序。當(dāng)一條微博敏感信息發(fā)布后,經(jīng)過一些“大V”用戶的引導(dǎo)以及大量普通微博水軍用戶的轉(zhuǎn)發(fā)評論,往往會誤導(dǎo)普通公眾以及擾亂正常網(wǎng)絡(luò)環(huán)境。要想削弱甚至徹底消除這種影響,就需要確定敏感信息的源頭以及其傳播路徑。所以只有掌握微博信息的傳播特點以及研究微博信息追蹤溯源技術(shù),才能有效地控制微博輿情信息并最大限度地發(fā)揮微博的積極作用。在微博信息追蹤溯源技術(shù)方面,本文首先通過WEB爬蟲程序爬取特定關(guān)鍵詞下的相關(guān)敏感微博,并對爬取到的微博博文進(jìn)行分詞、去燥等預(yù)處理操作。接下來本文的核心內(nèi)容是將針對微博敏感信息的溯源技術(shù)研究分為鏈接轉(zhuǎn)發(fā)溯源研究、完全復(fù)制后轉(zhuǎn)發(fā)溯源研究和隱含轉(zhuǎn)發(fā)溯源研究三種類型進(jìn)行分類溯源,其中隱含轉(zhuǎn)發(fā)溯源研究是本文的研究重點也是研究難點,因為根據(jù)微博的傳播規(guī)律及特點,鏈接轉(zhuǎn)發(fā)和完全復(fù)制后轉(zhuǎn)發(fā)的微博信息傳播路徑比較容易構(gòu)建,而隱含轉(zhuǎn)發(fā)關(guān)系由于存在主觀更改微博信息的現(xiàn)象,從而造成了微博源頭難以發(fā)現(xiàn)并且傳播路徑較難構(gòu)建的現(xiàn)象。在隱含轉(zhuǎn)發(fā)溯源研究中,本文提出了一種漢語框架網(wǎng)和語義依存關(guān)系相結(jié)合的短文本相似度算法。首先通過識別特定語句的目標(biāo)詞并獲取語句的框架,然后進(jìn)一步從單個詞義和語句整體兩個角度分析語句內(nèi)核心框架元素中存在的語義依存關(guān)系,從而對兩個語句的相似度進(jìn)行度量。并且將改進(jìn)的語句相似度算法應(yīng)用到對微博短文本的相似度判斷中去,結(jié)合微博博文的發(fā)布時間和引入微博傳播概率這一概念對隱含轉(zhuǎn)發(fā)關(guān)系下的微博敏感信息進(jìn)行源頭發(fā)現(xiàn)和傳播路徑還原。實驗結(jié)果表明,本文提出的分類溯源方法對微博敏感信息的追蹤溯源效果較為理想,并且可以為公安網(wǎng)警部門處置微博敏感信息案件提供一種新的思路。
【學(xué)位授予單位】:中國人民公安大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:D631.1
【圖文】:

模型圖,向量表示,坐標(biāo)系,模型


文本的向量表示模型

框架,示例,漢語


Chinese FrameNet,CFN)[31]-[32]是以Fillmore 的框架克利 FrameNet[34]為參照,以漢語真實語料為依據(jù)元、框架關(guān)系、例句及篇章。其核心思想是人們對?蚣苷Z義分析是基于漢語框架網(wǎng)的語義表示與標(biāo)對其所激起的框架分析,結(jié)合對上下文核心框架元一個具體的語句中能夠激起框架的詞;框架[35]是指疇,它是儲存在人類認(rèn)知經(jīng)驗中的圖式化情境,是指能夠體現(xiàn)一個框架語義的參與者,包括核心與非示的是區(qū)別于其它框架的特有特性,而非核心框架助性語義成分,如時間、方式和方法等;詞元是指利用漢語語句框架語義角色標(biāo)注工具對例句“乞果。

語義,示例,例句


依存分析的目標(biāo)是跨越句子表層句法結(jié)構(gòu)的束縛,直接獲取深層的語義信息。表 3.1 給出了語義依存分析中主要的十一種語義依存關(guān)系及相應(yīng)例句。圖3.3 所示為例句“他聽到爆炸聲”的語義依存分析結(jié)果。表 3.1 十一種語義依存關(guān)系及例句關(guān)系類型 標(biāo)簽 詳細(xì)描述 例句施事關(guān)系 Agt Agent 他給我一本書(他 <-- 給)當(dāng)事關(guān)系 Exp Experiencer 她走得慢 (走 --> 她)感事關(guān)系 Aft Affection 小明想念母親(小明 --> 我)領(lǐng)事關(guān)系 Poss Possessor 我有兩個蘋果(我 <-- 有)受事關(guān)系 Pat Patient 我追趕小李(追趕 --> 小李)客事關(guān)系 Cont Content 他聽到鞭炮聲(聽 --> 鞭炮聲)成事關(guān)系 Prod Product 他寫了本小說(寫 --> 小說)源事關(guān)系 Orig Origin 我軍繳獲敵人四輛坦克(繳獲 --> 坦克)涉事關(guān)系 Datv Dative 他告訴我個秘密(告訴 --> 我)屬事角色 Belg Belongings 老王有三個兒子(老王 <-- 有)類事角色 Clas Classification 我是程序員(是 --> 程序員)圖 3.3 語義依存分析示例上圖例句中存在的主要依存關(guān)系是Aft(感事關(guān)系),即“聽到→他”和 Cont(客事關(guān)系),即“聽→爆炸聲”。

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊靜;董圓;張健沛;;一種基于話題影響力的微博話題溯源方法[J];小型微型計算機系統(tǒng);2015年09期

2 李宇成;田震;游加;;一種新的字符特征向量相似度函數(shù)[J];計算機工程與科學(xué);2013年05期

3 王秀紅;鞠時光;;用于文本相似度計算的新核函數(shù)[J];通信學(xué)報;2012年12期

4 廖濤;劉宗田;王先傳;;基于事件的文本表示方法研究[J];計算機科學(xué);2012年12期

5 鄭誠;夏青松;孫昌年;;一種基于成分的句子相似度計算[J];計算機技術(shù)與發(fā)展;2012年12期

6 時國華;周斌;韓毅;;一種微博事件源頭發(fā)現(xiàn)的方法[J];信息網(wǎng)絡(luò)安全;2012年08期

7 楊松;樓新遠(yuǎn);;基于向量空間模型附加詞義特征的句子相似度研究[J];成都信息工程學(xué)院學(xué)報;2012年03期

8 程傳鵬;吳志剛;;一種基于知網(wǎng)的句子相似度計算方法[J];計算機工程與科學(xué);2012年02期

9 李連;朱愛紅;蘇濤;;一種改進(jìn)的基于向量空間文本相似度算法的研究與實現(xiàn)[J];計算機應(yīng)用與軟件;2012年02期

10 常鵬;馮楠;;基于詞共現(xiàn)的文檔表示模型[J];中文信息學(xué)報;2012年01期



本文編號:2765755

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shekelunwen/gongan/2765755.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶400ab***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com