天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于領域知識圖譜的網(wǎng)絡信息可信度測度

發(fā)布時間:2020-05-17 07:14
【摘要】:網(wǎng)絡信息的可信度關乎決策的有效性程度。社交媒體、移動互聯(lián)及大數(shù)據(jù)環(huán)境下的網(wǎng)絡信息具有用戶主動參與、信息多源異構及海量動態(tài)等新的特征。在新型的網(wǎng)絡環(huán)境下,信息交互過程越來越紛繁復雜,信息的真實性或可信度日漸受到人們的關注,特別是針對網(wǎng)絡信息可信度評估及測度的研究越來越多。本文嘗試以知識圖譜為工具,通過構建知識圖譜來測度網(wǎng)絡信息的可信度,便于直觀的了解和感受網(wǎng)絡信息可信度測度的具體過程。知識圖譜是一種圖譜組織形式,通過語義關聯(lián)將各種實體關聯(lián)起來,將基于語義網(wǎng)的知識庫可視化展示出來,重在抽取關系,便于展示高關聯(lián)性,高結(jié)構化的結(jié)果。語義網(wǎng)實際上是讓計算機理解人的意思,因而圖形結(jié)構就為推理提供了很好的依托。知識圖譜把結(jié)構化以及非結(jié)構化的數(shù)據(jù)通過數(shù)據(jù)抽取融合在一起,揭示了數(shù)據(jù)治理、語義連接的思想,從而有利于大規(guī)模數(shù)據(jù)的利用和遷移。知識圖譜作為如今大數(shù)據(jù)時代下興起的知識組織與檢索技術,其知識組織和展示的優(yōu)勢逐漸體現(xiàn)出來,受到了眾多領域的關注,應用前景非常廣闊。但是當前知識圖譜的發(fā)展還處于初級階段,面臨著許多挑戰(zhàn)和難題,譬如知識庫的自動擴展,異構知識的處理,推理規(guī)則的學習等。雖然相關研究針對不同問題提出了處理辦法和改進模型,但仍然要對其進行更深入的研究。本文基于專家性用戶經(jīng)驗以及社交媒體平臺中大眾性用戶體驗從文本聚類、社會網(wǎng)絡分析以及文本分類三個方面對知識圖譜的構建進行了研究。針對知識圖譜構建過程中的難題以及相關研究的不足,本文做了一些探討研究,主要包括以下幾個方面:(1)本文嘗試基于領域范圍內(nèi)專家性用戶經(jīng)驗構建領域知識圖譜,作為領域內(nèi)參照標準。數(shù)據(jù)來源于多個專業(yè)網(wǎng)站的不同專家經(jīng)驗知識,既能體現(xiàn)不同專家經(jīng)驗的交叉驗證,又能使得領域知識的維度更加全面,防止單一網(wǎng)站或者專家經(jīng)驗的不同傾向?qū)е碌钠嫘;趯哟尉垲?構建了同質(zhì)網(wǎng)絡聚類的知識圖譜,揭示了同類型節(jié)點之間的相似程度和關聯(lián)關系;基于社會網(wǎng)絡分析,構建了異質(zhì)網(wǎng)絡聚類的知識圖譜,揭示了兩種不同類型節(jié)點之間的關聯(lián)關系,彌補了傳統(tǒng)多維尺度分析方法的不足。(2)以專家性用戶經(jīng)驗為參照標準,基于社交媒體平臺中大眾性用戶體驗構建知識圖譜。由于大眾性用戶對領域知識缺乏系統(tǒng)全面的認知,導致交互數(shù)據(jù)非常稀、碎片化,因此將專家經(jīng)驗作為參照標準是很有必要的。對社交媒體平臺中的用戶交互數(shù)據(jù)進行自然語言處理,以專家詞典作為中文分詞詞典,使得處理結(jié)果更加規(guī)范化。同樣基于層次聚類以及社會網(wǎng)絡分析,構建同質(zhì)網(wǎng)絡聚類以及異質(zhì)網(wǎng)絡聚類的知識圖譜,揭示節(jié)點之間的關聯(lián)關系,便于兩者之間的分析比較。(3)將社交媒體平臺中大眾性用戶體驗和專家性用戶經(jīng)驗進行比較分析,測度大眾性用戶體驗的可信度;贙L散度計算詞語之間的相似度,相似度越高,可信程度越大。然后對KL值從小到大進行排列,設置閾值并且通過交叉驗證的方法對不同閾值設定進行評價,選取指標值最高的閾值設定作為保證分類結(jié)果最穩(wěn)健分類閾值。
【圖文】:

框架圖,模型構建,框架圖,詞語


圖 3.1 模型構建框架圖Fig.3.1 Model building frame diagram3.1.1 文本預處理由于文本聚類或者分類處理的是大量非結(jié)構化的利用自然語言描述的非統(tǒng)一結(jié)構的文本數(shù)據(jù),因此對文本進行特征提取前,需要先對這些文本數(shù)據(jù)進行預處理,這會影響文本聚類或者分類的準確率、效率以及最終模式的有效性。由于中文文本的詞語之間沒有空格,那么分詞就是一個必須要處理的問題。本文基于醫(yī)療詞典利用爬蟲軟件對獲取的文本進行分詞。中文分詞后文本就變成了單個的詞語,這些詞語就是文本的特征項,如果直接用分詞后的詞語集合進行建模的話,一來詞語空間比較大,導致性能比較低;二來詞語集合中有很多低頻詞、無意義詞等噪音,也會降低聚類和分類的效果,,所以要通過特征項提取選出最能代表文本的特征項和最能區(qū)分文本的特征項。本文建立在 TF-IDF 計算簡潔、速度快的基礎上,采用 TF-IDF 值來度量每個詞語的重要程度,通過 TF-IDF 值排序及語義分析選取特征詞語。

癥狀,碎石,知識圖,治療方案


高血壓癥狀和高血壓治療方案的專家性經(jīng)驗內(nèi)容并整合成文本集然。先分別對高血壓癥狀及治療方案分別進行同質(zhì)網(wǎng)絡聚類,以此構將癥狀詞頻矩陣和治療詞頻矩陣個相乘得到癥狀-治療方案 2-mode質(zhì)網(wǎng)絡聚類并構建知識圖譜,將癥狀-治療方案之間的關聯(lián)關系可同質(zhì)網(wǎng)絡聚類知識圖譜構建可視化血壓癥狀樣本數(shù)據(jù)知識圖譜方便分析與觀測,本文從實驗數(shù)據(jù)中選取 80 個對于癥狀判斷重要程樣本數(shù)據(jù)進行分析。首先用 R 畫出這個樣本的碎石圖[73],可以確定可以方便提取出其中的幾個小類具體展示。
【學位授予單位】:江蘇科技大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:G353.1

【參考文獻】

相關期刊論文 前10條

1 李保珍;王亞;;社交媒體環(huán)境下網(wǎng)絡信息可信度評估研究綜述[J];情報學報;2015年12期

2 錢揚;張金波;吳一陽;;大型無線網(wǎng)絡入侵安全風險等級評估[J];計算機仿真;2015年12期

3 曹倩;趙一鳴;;知識圖譜的技術實現(xiàn)流程及相關應用[J];情報理論與實踐;2015年12期

4 劉春年;陳通;;基于共詞聚類的我國檔案信息化研究結(jié)構、趨勢分析[J];檔案管理;2015年06期

5 王艷博;;圖書館學知識圖譜分析[J];科技情報開發(fā)與經(jīng)濟;2015年21期

6 彭云;萬常選;江騰蛟;劉德喜;劉喜平;;一種詞聚類LDA的商品特征提取算法[J];小型微型計算機系統(tǒng);2015年07期

7 馮偉偉;秦長江;;國內(nèi)機構知識庫研究現(xiàn)狀分析——基于知識圖譜的視角[J];現(xiàn)代情報;2015年06期

8 高學東;黃月;;異質(zhì)對象協(xié)同實體解析的聯(lián)合聚類算法[J];系統(tǒng)工程理論與實踐;2015年04期

9 賈紅雨;趙雪燕;邱晨子;;基于復雜網(wǎng)絡的微博網(wǎng)絡輿情圖譜分析方法研究[J];現(xiàn)代情報;2015年03期

10 許德山;張運良;李芳;;中文本體三元組的單字索引與更新方法研究[J];圖書情報工作;2014年22期

相關碩士學位論文 前4條

1 付茜;維基百科知識的層次化體系構建[D];華中科技大學;2016年

2 劉彥含;語義物聯(lián)網(wǎng)中基于統(tǒng)一知識圖譜的語義協(xié)同方法[D];大連海事大學;2016年

3 范永東;模型選擇中的交叉驗證方法綜述[D];山西大學;2013年

4 吳啟南;一種改進的基于層次的聚類和異常檢測算法及其在數(shù)據(jù)挖掘平臺上的應用[D];新疆大學;2002年



本文編號:2668140

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2668140.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶d9790***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com