基于文本語料的涉恐事件實體屬性抽取
發(fā)布時間:2021-07-28 14:51
基于語義角色分析,提出了一種三元組涉恐事件實體屬性抽取方法,為網(wǎng)絡(luò)空間涉恐活動的監(jiān)測及預(yù)警提供技術(shù)支持.首先,基于西北政法大學(xué)"反恐怖主義信息網(wǎng)"文本語料數(shù)據(jù)進行數(shù)據(jù)采集和清洗等預(yù)處理工作,采用樸素貝葉斯文本分類算法識別涉恐事件文本,并采用關(guān)鍵詞提取算法TF-IDF(Term frequency-inverse document frequency,詞頻-逆文檔頻率)構(gòu)建涉恐專有詞庫,結(jié)合自然語言處理技術(shù)構(gòu)建帶詞性的涉恐專有詞庫.然后通過語義角色分析、句法依存分析,提取了主語謂語賓語關(guān)系、定語后置動賓關(guān)系、人名//地名//機構(gòu)和介賓關(guān)系主謂動補4類涉恐三元組結(jié)構(gòu).最后,利用正則表達式及帶詞性的涉恐專有名詞分析,在4類三元組短文本中提取出恐怖事件發(fā)生時間、發(fā)生地點、傷亡情況、攻擊方式、武器類型和恐怖組織6類實體屬性.對采集的4221篇文章數(shù)據(jù)進行實驗分析,6類實體屬性抽取的測評結(jié)果 F1值均超過80%,對網(wǎng)絡(luò)空間的涉恐事件監(jiān)測及預(yù)警,維護社會公共安全具有重要現(xiàn)實意義.
【文章來源】:工程科學(xué)學(xué)報. 2020,42(04)北大核心EICSCD
【文章頁數(shù)】:9 頁
【參考文獻】:
期刊論文
[1]基于語境概念核心詞提取算法研究[J]. 石進,韓進,趙小柯,劉千里. 情報學(xué)報. 2019(11)
[2]基于多特征自注意力BLSTM的中文實體關(guān)系抽取[J]. 李衛(wèi)疆,李濤,漆芳. 中文信息學(xué)報. 2019(10)
[3]基于jsoup爬取圖書網(wǎng)頁信息的網(wǎng)絡(luò)爬蟲技術(shù)[J]. 熊艷秋,嚴(yán)碧波. 電腦與信息技術(shù). 2019(04)
[4]基于PCA-SVM算法的酒店評論文本情感分析研究[J]. 王大偉,周志瑋,曹紅根. 現(xiàn)代計算機. 2019(21)
[5]基于多任務(wù)學(xué)習(xí)的中文事件抽取聯(lián)合模型[J]. 賀瑞芳,段紹楊. 軟件學(xué)報. 2019(04)
[6]基于三元組文檔表示的文本分類[J]. 馮雪. 計算機工程與設(shè)計. 2019(02)
[7]面向?qū)S眯畔@取的用戶定制主題網(wǎng)絡(luò)爬蟲技術(shù)探究[J]. 蒲文瑩. 電腦編程技巧與維護. 2019(01)
[8]基于改進樸素貝葉斯算法實現(xiàn)評教評語情感分析[J]. 張俊飛. 現(xiàn)代計算機(專業(yè)版). 2018(32)
[9]基于N-Gram語言模型的并行自適應(yīng)新聞話題追蹤算法[J]. 屈慶濤,劉其成,牟春曉. 山東大學(xué)學(xué)報(工學(xué)版). 2018(06)
[10]N-gram模型綜述[J]. 尹陳,吳敏. 計算機系統(tǒng)應(yīng)用. 2018(10)
本文編號:3308115
【文章來源】:工程科學(xué)學(xué)報. 2020,42(04)北大核心EICSCD
【文章頁數(shù)】:9 頁
【參考文獻】:
期刊論文
[1]基于語境概念核心詞提取算法研究[J]. 石進,韓進,趙小柯,劉千里. 情報學(xué)報. 2019(11)
[2]基于多特征自注意力BLSTM的中文實體關(guān)系抽取[J]. 李衛(wèi)疆,李濤,漆芳. 中文信息學(xué)報. 2019(10)
[3]基于jsoup爬取圖書網(wǎng)頁信息的網(wǎng)絡(luò)爬蟲技術(shù)[J]. 熊艷秋,嚴(yán)碧波. 電腦與信息技術(shù). 2019(04)
[4]基于PCA-SVM算法的酒店評論文本情感分析研究[J]. 王大偉,周志瑋,曹紅根. 現(xiàn)代計算機. 2019(21)
[5]基于多任務(wù)學(xué)習(xí)的中文事件抽取聯(lián)合模型[J]. 賀瑞芳,段紹楊. 軟件學(xué)報. 2019(04)
[6]基于三元組文檔表示的文本分類[J]. 馮雪. 計算機工程與設(shè)計. 2019(02)
[7]面向?qū)S眯畔@取的用戶定制主題網(wǎng)絡(luò)爬蟲技術(shù)探究[J]. 蒲文瑩. 電腦編程技巧與維護. 2019(01)
[8]基于改進樸素貝葉斯算法實現(xiàn)評教評語情感分析[J]. 張俊飛. 現(xiàn)代計算機(專業(yè)版). 2018(32)
[9]基于N-Gram語言模型的并行自適應(yīng)新聞話題追蹤算法[J]. 屈慶濤,劉其成,牟春曉. 山東大學(xué)學(xué)報(工學(xué)版). 2018(06)
[10]N-gram模型綜述[J]. 尹陳,吳敏. 計算機系統(tǒng)應(yīng)用. 2018(10)
本文編號:3308115
本文鏈接:http://sikaile.net/falvlunwen/fanzuizhian/3308115.html
教材專著