基于隱馬爾可夫模型的多真值發(fā)現(xiàn)研究
發(fā)布時間:2023-11-03 20:04
互聯(lián)網(wǎng)是人類獲取數(shù)據(jù)的重要來源,因此,如何從互聯(lián)網(wǎng)上的海量數(shù)據(jù)中獲取準(zhǔn)確可用的數(shù)據(jù),成為了一個研究熱點,信息集成、問答系統(tǒng)、知識發(fā)現(xiàn)等都與互聯(lián)網(wǎng)的信息獲取技術(shù)息息相關(guān)。隨著人類社會進入互聯(lián)網(wǎng)時代,人類在互聯(lián)網(wǎng)上留下了包括社交、購物、交易、娛樂等多種多樣的數(shù)據(jù),數(shù)據(jù)的獲得顯得簡單而便捷。但是,數(shù)據(jù)的爆炸式增長也為信息的獲取增加了難度,在大量的數(shù)據(jù)中篩選出有價值的信息是一件費時費力的事情。同時,由于互聯(lián)網(wǎng)上的數(shù)據(jù)來源很多,不可避免的存在有一部分的數(shù)據(jù)源在提供信息時有錯誤、遺漏或者是過期的情況,因而對于同一對象的描述并不能保證完全一致,這也使得對數(shù)據(jù)的利用較為困惑。在Deep Web方面,很多數(shù)據(jù)提供商均會提供對同一對象的描述,并且均存在一定程度的加工,如何挖掘數(shù)據(jù)中的真值是個值得研究的問題。在大數(shù)據(jù)時代,數(shù)據(jù)是極有價值的東西,如何利用數(shù)據(jù)始終是一個熱門的話題,而怎樣保證數(shù)據(jù)正確性,并消除數(shù)據(jù)間的不一致導(dǎo)致的歧義,則是數(shù)據(jù)在使用過程中至為關(guān)鍵的問題。圖模型與真值發(fā)現(xiàn)問題的研究已經(jīng)經(jīng)歷了很長時間的發(fā)展,將圖模型合理應(yīng)用于真值發(fā)現(xiàn)中將有助于模型結(jié)果的優(yōu)化,得到較好的真值預(yù)測效果。本文進行了基于圖...
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
緒論
第一節(jié) 研究背景及意義
第二節(jié) 國內(nèi)外研究現(xiàn)狀
第三節(jié) 研究內(nèi)容與基本方法
一、研究內(nèi)容
二、研究方法
三、主要創(chuàng)新
第一章 相關(guān)技術(shù)與理論
第一節(jié) 概率圖模型簡介
第二節(jié) 真值發(fā)現(xiàn)的定義
第三節(jié) 真值發(fā)現(xiàn)的研究方法
一、基于迭代的方法
二、基于概率的方法
三、基于圖模型的方法
第四節(jié) 本章小結(jié)
第二章 基于隱馬爾可夫的GraphTD模型
第一節(jié) 真值發(fā)現(xiàn)圖模型GraphTD設(shè)計
一、真值發(fā)現(xiàn)圖模型概述
二、GraphTD多真值發(fā)現(xiàn)模型構(gòu)建
第二節(jié) 多真值發(fā)現(xiàn)算法CVote
一、CVote算法描述
二、CVote算法分析
第三節(jié) GraphTD真值計算
一、數(shù)據(jù)向量化
二、相似度計算
三、描述初始置信度與相互支持度計算
四、GraphTD算法總體描述
五、真值發(fā)現(xiàn)算法示例
第四節(jié) 算法效果的衡量
第五節(jié) 本章小結(jié)
第三章 實驗構(gòu)建及分析
第一節(jié) 數(shù)據(jù)集獲取
一、爬蟲的基本原理
二、書籍作者信息爬取
三、數(shù)據(jù)集中存在的問題
第二節(jié) 數(shù)據(jù)預(yù)處理
一、基本預(yù)處理
二、數(shù)據(jù)表示
第三節(jié) 實驗過程
一、實驗設(shè)計
二、實驗結(jié)果
總結(jié)與展望
第一節(jié) 本文總結(jié)
第二節(jié) 研究展望
參考文獻
在讀期間科研成果
致謝
本文編號:3859811
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
緒論
第一節(jié) 研究背景及意義
第二節(jié) 國內(nèi)外研究現(xiàn)狀
第三節(jié) 研究內(nèi)容與基本方法
一、研究內(nèi)容
二、研究方法
三、主要創(chuàng)新
第一章 相關(guān)技術(shù)與理論
第一節(jié) 概率圖模型簡介
第二節(jié) 真值發(fā)現(xiàn)的定義
第三節(jié) 真值發(fā)現(xiàn)的研究方法
一、基于迭代的方法
二、基于概率的方法
三、基于圖模型的方法
第四節(jié) 本章小結(jié)
第二章 基于隱馬爾可夫的GraphTD模型
第一節(jié) 真值發(fā)現(xiàn)圖模型GraphTD設(shè)計
一、真值發(fā)現(xiàn)圖模型概述
二、GraphTD多真值發(fā)現(xiàn)模型構(gòu)建
第二節(jié) 多真值發(fā)現(xiàn)算法CVote
一、CVote算法描述
二、CVote算法分析
第三節(jié) GraphTD真值計算
一、數(shù)據(jù)向量化
二、相似度計算
三、描述初始置信度與相互支持度計算
四、GraphTD算法總體描述
五、真值發(fā)現(xiàn)算法示例
第四節(jié) 算法效果的衡量
第五節(jié) 本章小結(jié)
第三章 實驗構(gòu)建及分析
第一節(jié) 數(shù)據(jù)集獲取
一、爬蟲的基本原理
二、書籍作者信息爬取
三、數(shù)據(jù)集中存在的問題
第二節(jié) 數(shù)據(jù)預(yù)處理
一、基本預(yù)處理
二、數(shù)據(jù)表示
第三節(jié) 實驗過程
一、實驗設(shè)計
二、實驗結(jié)果
總結(jié)與展望
第一節(jié) 本文總結(jié)
第二節(jié) 研究展望
參考文獻
在讀期間科研成果
致謝
本文編號:3859811
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3859811.html
最近更新
教材專著