天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

面向?qū)嶓w識別的聚類算法

發(fā)布時間:2017-08-17 01:11

  本文關鍵詞:面向?qū)嶓w識別的聚類算法


  更多相關文章: 實體識別 聚類 隨機游走模型 簇點相似度 數(shù)據(jù)對象排序


【摘要】:實體識別是數(shù)據(jù)質(zhì)量的一個重要方面,對于大數(shù)據(jù)處理不可或缺.已有的實體識別研究工作聚焦于數(shù)據(jù)對象相似度算法、分塊技術和監(jiān)督的實體識別技術,而非監(jiān)督的實體識別中匹配決定的問題很少被涉及.提出一種面向?qū)嶓w識別的聚類算法來彌補這個缺失.利用數(shù)據(jù)對象及其相似度構建帶權重的數(shù)據(jù)對象相似圖.聚類過程中,利用相似圖上重啟式隨機游走來動態(tài)地計算類簇與結(jié)點的相似度.聚類的基本邏輯是,類簇迭代地吸收離它最近的結(jié)點.提出數(shù)據(jù)對象排序方法來優(yōu)化聚類的順序,提高聚類精確性;提出了優(yōu)化的隨機游走平穩(wěn)概率分布計算方法,降低聚類算法開銷.通過在真實數(shù)據(jù)集和生成數(shù)據(jù)集上的對比實驗,驗證了該算法的有效性.
【作者單位】: 東北大學計算機科學與工程學院;
【關鍵詞】實體識別 聚類 隨機游走模型 簇點相似度 數(shù)據(jù)對象排序
【基金】:國家自然科學基金(61472070,61402213) 國家重點基礎研究發(fā)展計劃(973)(2012CB316201) 教育部基本科研業(yè)務費項目(N110404010)~~
【分類號】:TP311.13
【正文快照】: 大數(shù)據(jù)時代,數(shù)據(jù)的一個重要特點是多樣性(variety)[1],描述現(xiàn)實世界同一實體的數(shù)據(jù)對象在單個或多個數(shù)據(jù)源中可能以不同的形式重復地出現(xiàn),由此導致了數(shù)據(jù)質(zhì)量的低質(zhì)化,成為大數(shù)據(jù)集成、處理、分析和挖掘的瓶頸.實體識別(entity resolution,簡稱ER)作為數(shù)據(jù)質(zhì)量的一個重要方面,

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 韓毅;蔡建湖;李延來;周利升;;進化算法的計算結(jié)果呈現(xiàn)方式[J];計算機工程與應用;2012年05期

2 李美安,劉心松,王征;一種基于循環(huán)編碼的高性能分布式互斥算法[J];電子學報;2005年08期

3 馬亞偉;魏金萍;;并行磁共振成像GRAPPA算法的C++語言實現(xiàn)[J];數(shù)字技術與應用;2011年11期

4 黃敏;汪超;;基于C~(++)語言的GRAPPA算法實現(xiàn)[J];軟件導刊;2012年04期

5 羅亞中,唐國金;基于面向?qū)ο蠹夹g的優(yōu)化算法類庫分析與設計[J];航空計算技術;2003年01期

6 杜玉蘭;趙磊;;基于C#的HASH算法探析[J];計算機安全;2007年08期

7 王慧,劉寶坤,曹明,劉勇;用C++語言實現(xiàn)神經(jīng)網(wǎng)絡的算法類庫[J];微型機與應用;1998年12期

8 何增有,鄧勝春,徐曉飛,宋玉福;一種基于垂直分布的非數(shù)值數(shù)據(jù)聚類算法[J];小型微型計算機系統(tǒng);2003年12期

9 陳湘驥;徐東風;方鳳美;;算法類程序設計課程多層次實踐教學體系的構建[J];實驗室研究與探索;2012年08期

10 于永彥,趙建洋;位圖的轉(zhuǎn)向算法及其實現(xiàn)[J];微型電腦應用;2002年02期

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 金彤;李元香;王瓏;劉海峰;;智能算法平臺中設計模式的應用[A];全國第20屆計算機技術與應用學術會議(CACIS·2009)暨全國第1屆安全關鍵技術與應用學術會議論文集(上冊)[C];2009年

中國博士學位論文全文數(shù)據(jù)庫 前2條

1 李海波;頻繁子結(jié)構挖掘算法研究與應用[D];華中科技大學;2011年

2 任間;SSS選星算法研究及小系統(tǒng)軟件設計與實現(xiàn)[D];中國科學技術大學;2007年

中國碩士學位論文全文數(shù)據(jù)庫 前8條

1 黃維;操作系統(tǒng)課程微詞典及微題庫設計與實現(xiàn)[D];長春工業(yè)大學;2016年

2 趙智寶;儲層算法類庫的研究與實現(xiàn)[D];西安石油大學;2010年

3 曾雪;海量數(shù)據(jù)的快速查詢算法研究[D];南京郵電大學;2012年

4 倪棟君;分布式關聯(lián)規(guī)則挖掘若干算法研究與實現(xiàn)[D];浙江工商大學;2009年

5 朱明陽;一種算法類功能的COSMIC度量方法的研究與應用[D];國防科學技術大學;2014年

6 蔡頌梅;語義增強的關系相似度度量算法研究[D];華東師范大學;2011年

7 施晨駿;甚高頻RFID的本振設計和反碰撞算法研究[D];上海交通大學;2008年

8 蔣宇志;話務中心排班問題分階段優(yōu)化算法及框架設計[D];吉林大學;2008年

,

本文編號:686408

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/686408.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶64476***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com