動態(tài)熱門話題的“特征詞條本體”自動構(gòu)建與進化研究
發(fā)布時間:2017-12-20 19:12
本文關(guān)鍵詞:動態(tài)熱門話題的“特征詞條本體”自動構(gòu)建與進化研究 出處:《現(xiàn)代圖書情報技術(shù)》2016年10期 論文類型:期刊論文
更多相關(guān)文章: 特征詞條 本體生成 本體進化 話題跟蹤
【摘要】:【目的】設(shè)計一種"特征詞條本體"的自動構(gòu)建及進化算法!緫(yīng)用背景】熱門話題產(chǎn)生的時間和話題演化往往是快速的,且涉及領(lǐng)域廣泛,而現(xiàn)有的本體自動構(gòu)建研究局限于具體領(lǐng)域的知識表達,無法有效地對這種動態(tài)熱門話題進行本體語義支持,也不能進行有效跟蹤與優(yōu)化!痉椒ā客ㄟ^對熱門話題中關(guān)鍵事件的內(nèi)容分析并由特征詞組合而成的"特征詞條本體"來描述熱門話題的方法,設(shè)計一種快速自動生成"特征詞條本體"的算法;在初始本體指導下,利用話題跟蹤結(jié)果進行"特征詞條本體"進化算法的設(shè)計,以滿足不斷更新的話題語義表述需求!窘Y(jié)果】針對熱門話題"魏則西百度推廣事件",使用爬蟲工具采集11 174條新浪微博作為語料庫進行實驗,抽取生成擁有7 421個特征詞條、39個特征詞節(jié)點、781個特征詞關(guān)系的初始本體,基于話題跟蹤結(jié)果進化為擁有24 564個特征詞條,67個特征詞節(jié)點,1 818個特征詞關(guān)系的進化本體,其漏報率、誤報率、損耗代價分別為0.1261,0.0964,0.5985,優(yōu)于TF-IDF算法!窘Y(jié)論】"特征詞條本體"的表述方式明顯比單個詞匯的本體表述準確率高,且語義相似度更容易計算,比較符合動態(tài)熱門話題的快速語義處理。
【作者單位】: 南京航空航天大學經(jīng)濟與管理學院;
【基金】:國家自然科學基金面上項目“基于演化本體的網(wǎng)絡(luò)輿情自適應(yīng)話題跟蹤方法研究”(項目編號:71373123) 江蘇高校哲學社會科學研究重點項目“基于超網(wǎng)絡(luò)的江蘇教育微博輿情多元意見演化模型及應(yīng)用研究”(項目編號:2015ZDIXM007) 高校重大項目培育基金“基于‘模型 數(shù)據(jù)雙驅(qū)動’的復雜社會網(wǎng)絡(luò)行為大數(shù)據(jù)分析方法研究”(項目編號:NP201630X)的研究成果之一
【分類號】:TP391.1
【正文快照】: 1引言 隨著互聯(lián)網(wǎng)信息的爆炸,海量文本的語義識別與表達成為主要難點。本體作為表達現(xiàn)實世界知識的重要方法得到研究者的極大關(guān)注[1]。本體被引入計算機科學中作為知識表示的方法并被廣泛使用,包括:知識工程、智能信息處理、軟件工程、自然語言處理等諸多領(lǐng)域,并將成為語義網(wǎng)
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 翟東海;杜佳;崔靜靜;聶洪玉;;基于雙粒度模型的中文情感特征詞提取研究[J];重慶郵電大學學報(自然科學版);2014年03期
2 李德容;干靜;張s,
本文編號:1313088
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1313088.html
最近更新
教材專著