基于隨機點積圖理論的模式識別方法研究
本文選題:模式識別 + 隨機點積圖; 參考:《安徽大學》2012年博士論文
【摘要】:隨著計算機技術與人工智能理論的發(fā)展,模式識別的理論與方法研究已經(jīng)取得很大進展,并已廣泛應用于聲音和語言識別、文字識別、指紋識別、圖像分析等領域。近年來,網(wǎng)絡數(shù)據(jù)的分析和處理成為模式識別的重要研究內容。面對網(wǎng)絡這種新型、動態(tài)的大規(guī)模關系數(shù)據(jù),隨機圖及其所衍生出的復雜網(wǎng)絡理論受到越來越多的關注。 研究表明,隨機圖可以更好地模擬現(xiàn)實的關系數(shù)據(jù),在分類、聚類、匹配等模式識別經(jīng)典問題中都顯示出明顯優(yōu)勢與發(fā)展?jié)摿。本文立足于一種重要的隨機圖模型——隨機點積圖,重點研究了隨機點積圖在自動圖像標注、多社團屬性關系傳播、網(wǎng)絡攻擊檢測等多個模式識別新興熱點問題中的應用,并從理論上對隨機點積圖在保持模長歸一化的約束下進行了進一步的推廣。 隨機點積圖是近年來新提出的一種點-邊隨機圖模型,它通過對節(jié)點的隨機賦值,依照點積規(guī)則計算節(jié)點之間的連接概率,從而通過節(jié)點的隨機性體現(xiàn)出邊的隨機性,形成隨機圖。隨機點積圖具有聚類性、傳遞性、度冪律性等多種重要性質,可以很好地擬合現(xiàn)實存在的各種圖結構和網(wǎng)絡。本文從概率期望的角度證明了隨機點積圖的傳遞性,將在一維空間中的證明過程推廣到高維空間中;傳統(tǒng)的傳遞性質只涉及節(jié)點連通時的情況,本文提出了在隨機點積圖中節(jié)點不連通時邊概率的傳遞性,并給予證明。對于隨機點積圖的求解問題,本文研究了隨機點積圖對關聯(lián)圖的模擬,并給出求解方法。該解法從關聯(lián)圖的加權鄰接矩陣出發(fā),將關聯(lián)圖的隨機點積化問題轉化成了矩陣范數(shù)逼近問題,通過對加權鄰接矩陣的譜分解得到節(jié)點的賦值。 圖像標注是基于內容的圖像檢索的重要和具有挑戰(zhàn)性的課題。隨著數(shù)字圖像數(shù)據(jù)量呈爆炸性增長,如何有效檢索海量的圖像數(shù)據(jù)是個人與商業(yè)搜索引擎都迫切需要考慮的問題。自動圖像標注能提供更符合人類檢索習慣的文本輸入查詢方式,是圖像檢索中的一項關鍵技術。本文提出了一種基于隨機點積圖的圖像標注算法,該算法首先構造了一個融合了底層特征間、標注詞間以及圖像與標注詞間的相似關系的關聯(lián)圖,再利用隨機點積圖對該關聯(lián)圖進行重構,挖據(jù)出圖像的底層特征間和標注詞間隱藏的相似關系,并形成狀態(tài)轉移概率,結合重啟式隨機游走,最終實現(xiàn)自動圖像標注;陔S機點積圖的圖像標注算法將基本標注階段與標注改善階段結合起來,從整體進行關聯(lián)圖的隨機點積重構,并實現(xiàn)自動標注。在多個通用圖像庫上的實驗證明,該方法可以有效提高圖像標注精度,尤其在圖像庫較小時,具有明顯優(yōu)勢。 近年來社會網(wǎng)絡的研究取得了高速發(fā)展,其應用也越來越普及。與傳統(tǒng)的模式識別不同,網(wǎng)絡分析側重個體之間相互聯(lián)系的分析和挖掘,所以從模式識別的角度來看,網(wǎng)絡分析也稱為“鏈接識別”(Link recognition)或者“鏈接分析”(Link analysis)。在網(wǎng)絡中,個體與個體之間圍繞共同的興趣和話題相互聯(lián)系形成不同的社團。當前,社團已經(jīng)成為了解網(wǎng)絡結構、功能和增長機制的重要工具。由于不同社團中存在的數(shù)據(jù)關系大不相同,社團之間屬性關系的傳播已成模式識別中一個挑戰(zhàn)性的問題。本文提出了一種基于隨機點積圖的多社團屬性關系傳播算法。該方法從已知屬性關系的社團入手,結合目標社團中的個體特征,用隨機點積圖對當前屬性關系不斷演化,挖掘出目標社團中隱藏的屬性關系。該方法可以同時實現(xiàn)對社團中成員的劃分與屬性關系的跨社團傳遞。通過在多個實際社會網(wǎng)絡數(shù)據(jù)庫的實驗表明,該方法可以準確揭示社團中隱藏的屬性關系。 數(shù)據(jù)降維與嵌入是模式識別中的重要研究問題。對于關系數(shù)據(jù),隨機點積圖可以將圖中的節(jié)點嵌入到向量空間中。關系數(shù)據(jù)經(jīng)過核函數(shù)形成的相似矩陣往往具有相同的對角元,基于這一重要性質,本文提出一種改進的隨機點積圖模型——保持模長歸一化的隨機點積圖,它可以將圖嵌入到一個球面空間中。此外,對于歸一化的特征數(shù)據(jù),現(xiàn)有的降維方法都沒有考慮數(shù)據(jù)的歸一化性質,將保持模長歸一化的隨機點積圖模型用于這類數(shù)據(jù)的降維中,則降維后的特征數(shù)據(jù)依然是模長歸一化的。在這種隨機點積圖模型的解空間中,歐氏距離與夾角余弦是等價的。本文從理論上給出了該模型的求解方法與收斂性分析。在多個真實數(shù)據(jù)庫上的聚類實驗表明,該模型可以得到更具可分性的節(jié)點嵌入結果。 隨著互聯(lián)網(wǎng)技術的發(fā)展,大規(guī)模的動態(tài)網(wǎng)絡通過計算機和其他設備將人類連接起來,這種大規(guī)模網(wǎng)絡已經(jīng)成為人們獲取信息和知識的重要來源。為增強網(wǎng)絡用戶的安全性,網(wǎng)絡攻擊行為檢測成為模式識別在網(wǎng)絡分析中亟待解決的新問題。本文提出了一種新的基于保持模長歸一化隨機點積圖的網(wǎng)絡攻擊檢測方法,根據(jù)待測網(wǎng)絡拓撲結構的隨機點積圖譜空間坐標識別欺騙或攻擊。本文從理論上證明了攻擊者與普通節(jié)點分別落在譜空間的不同區(qū)域中。保持模長歸一化隨機點積圖將節(jié)點的譜坐標合理分布于球面空間中,并在該球面空間中識別攻擊行為,尤其可以探測出在原始網(wǎng)絡拓撲結構中難以識別的協(xié)同攻擊。與現(xiàn)有基于拓撲的攻擊檢測方法相比較,對于各種形式的協(xié)同攻擊,本文方法可以顯著提高攻擊檢測的有效性及效率。
[Abstract]:With the development of computer technology and artificial intelligence theory, the research of pattern recognition theory and method has made great progress, and has been widely used in the fields of voice and language recognition, word recognition, fingerprint recognition, image analysis and so on. In recent years, the analysis and management of network data has become an important research content of pattern recognition. A new type of dynamic large-scale relational data, random graph and the complex network theory derived from it have attracted more and more attention.
The research shows that the random graph can better simulate the real relational data and show obvious advantages and development potential in the classification, clustering, matching and other classic problems. This paper is based on an important random graph model, random dot product graph, and focuses on the automatic image annotation and multi community attribute relationship. The applications of many new hot issues such as propagation, network attack detection and so on are identified, and the stochastic point product graph is further extended under the constraint of maintaining the normalization of the model length.
Random dot product graph (random dot product graph) is a new model of point edge random graph in recent years. Through the random assignment of nodes, it calculates the connection probability between nodes according to the rule of point product. By the randomness of nodes, it embodies the randomness of the edges and forms random graphs. The random dot product graphs have many important properties, such as clustering, transitivity, power law and so on. In this paper, the transitivity of random dot product graphs is proved from the perspective of probability expectation, and the proof process in one dimension space is extended to the high dimensional space. The traditional transitive property only involves the case of node connectivity. This paper proposes the node disconnection in the random dot product graph. In order to solve the problem of the random dot product graph, this paper studies the simulation of the random dot product graph and gives the solution method. From the weighted adjacency matrix of the association graph, the problem of the random point accumulation of the correlation graph is transformed into the approximation problem of the matrix norm, and the weighted adjacency moment is used. The spectral decomposition of the matrix results in the assignment of the nodes.
Image annotation is an important and challenging topic in content based image retrieval. With the explosive growth of digital image data, how to effectively retrieve massive image data is an urgent problem for both individual and commercial search engines. Automatic image annotation can provide text input which is more in line with human retrieval habits. It is a key technology in image retrieval. In this paper, an image annotation algorithm based on random dot product graph is proposed. The algorithm first constructs an association graph which combines the underlying features, annotated words, and the similarity relation between the image and the annotation words, and then reconstructs the association graph by random dot product graph. The similarity relation between the underlying feature and the annotation of the image is hidden, and the state transfer probability is formed, and the automatic image annotation is achieved by combining the restart random walk. The image annotation algorithm based on the random dot product graph combines the basic annotation stage with the annotation improvement stage, and reconstructs the random point product of the association graph from the whole, and it is real. This method can effectively improve the accuracy of the image annotation, especially in the small image library, which has obvious advantages.
In recent years, the research of social network has been developing rapidly and its application is becoming more and more popular. Unlike traditional pattern recognition, network analysis focuses on the analysis and mining of interrelationships among individuals, so from the perspective of pattern recognition, network analysis is also called "Link recognition" or "Link ana". Lysis). In the network, individuals and individuals are connected around common interests and topics to form different associations. At present, the community has become an important tool to understand the structure, function and growth mechanism of the network. Because the data relations in different societies are very different, the propagation of attribute relations among groups has become one of the pattern recognition. This paper proposes a multi community attribute relation propagation algorithm based on random dot product graph. This method starts with the community of the known attribute relations and combines the individual characteristics of the target community, and evolves the current attribute relation with the random dot product graph, and excavates the hidden attribute relation in the target community. At the same time, the relationship between the division and property of the members of the community is transferred across societies. Through the experiments in a number of real social network databases, it is shown that this method can accurately reveal the hidden attribute relationship in the community.
The data reduction and embedding of data is an important research problem in pattern recognition. For relational data, random dot product graphs can be embedded into the vector space. The similarity matrix formed by the relational data through kernel function often has the same diagonal element. Based on this important property, an improved random dot product graph model is proposed in this paper. In addition, for the normalized feature data, the existing dimensionality reduction methods do not take into account the normalization of the data, and the random dot product graph model, which maintains the normalization of the model length, is used in the dimensionality reduction of this kind of data, and the feature data after the dimensionality reduction is dependent. In the solution space of this random dot product graph model, the Euclidean distance is equivalent to the angle cosine. In this paper, the solution method and convergence analysis of the model are given in theory. The clustering experiments on multiple real databases show that the model can get more separable node embedding results.
With the development of Internet technology, large scale dynamic networks connect people through computers and other devices. This large-scale network has become an important source for people to obtain information and knowledge. In order to enhance the security of network users, network attack behavior detection has become a new question to be solved in network analysis. In this paper, a new network attack detection method based on the maintenance model length normalized random dot product graph is proposed, which identifies the deception or attack according to the spatial coordinates of the random dot product Atlas of the network topology. This paper theoretically proves that the attacker and the common node fall in the different regions of the spectral space respectively. The random point product graph distributes the spectral coordinates of the nodes in the spherical space reasonably and identifies the attack behavior in the spherical space, especially the cooperative attack which is difficult to identify in the original network topology. Compared with the existing topology based attack detection methods, this method can be significant for various forms of cooperative attack. Improve the effectiveness and efficiency of attack detection.
【學位授予單位】:安徽大學
【學位級別】:博士
【學位授予年份】:2012
【分類號】:TP391.41
【相似文獻】
相關期刊論文 前10條
1 張文娜;秦國軍;胡蔦慶;;人工嗅覺系統(tǒng)關鍵技術研究進展[J];傳感器與微系統(tǒng);2011年08期
2 王煥靈;尤波;黃玲;楊大鵬;;基于肌電信號的手部動作模式識別新思路[J];計算機工程與應用;2011年21期
3 潘承恩;;改進的小腦控制神經(jīng)網(wǎng)絡算法研究[J];計算機仿真;2011年07期
4 段美軍;梁貴芹;余碩;;一種基于BP網(wǎng)絡的雷達信號模糊模式識別方法[J];信息技術;2011年08期
5 江潔;王昊予;張廣軍;;虛擬擴展成像在大視場姿態(tài)角測量中的應用[J];北京航空航天大學學報;2011年06期
6 劉紹輝;孫建超;姚鴻勛;;一種改進的基于馬爾科夫鏈的擴頻圖像隱寫分析方法[J];中國科學院研究生院學報;2011年05期
7 王濤春;古奮飛;左開中;;不同坐標系下空間兩球體關系的安全判定協(xié)議[J];計算機應用;2011年09期
8 鄒修國;;基于計算機視覺的農作物病蟲害識別研究現(xiàn)狀[J];計算機系統(tǒng)應用;2011年06期
9 ;[J];;年期
10 ;[J];;年期
相關會議論文 前10條
1 曾銳;王潤秋;胡天躍;;地震資料解釋中模式識別方法的應用研究[A];2000年中國地球物理學會年刊——中國地球物理學會第十六屆年會論文集[C];2000年
2 趙舉孝;王碩儒;;神經(jīng)網(wǎng)絡模式識別在成礦預測中的試驗研究[A];1995年中國地球物理學會第十一屆學術年會論文集[C];1995年
3 劉冬娥;黃婧芝;吳國平;;基于GR-SVM儲層油氣、水模式識別[A];中國地球物理學會第二十四屆年會論文集[C];2008年
4 鄧少平;田師一;;電子舌:技術背景與研究進展[A];提高全民科學素質、建設創(chuàng)新型國家——2006中國科協(xié)年會論文集[C];2006年
5 鄧少平;田師一;;電子舌:技術背景與研究進展[A];食品感官科學前沿與發(fā)展——首屆中國食品感官科學學術研討會暨《食品感官科學》課程建設研討會論文集[C];2006年
6 劉曉;徐榮軍;顧文兵;楊寶權;王軍;;基于模式識別和神經(jīng)網(wǎng)絡的VD溫度預報模型[A];加入WTO和中國科技與可持續(xù)發(fā)展——挑戰(zhàn)與機遇、責任和對策(下冊)[C];2002年
7 馬超;方劍青;李紅軍;雷玉錦;周陸軍;趙燁;;聲學共振譜信號模式識別方法[A];泛在信息社會中的聲學——中國聲學學會2010年全國會員代表大會暨學術會議論文集[C];2010年
8 劉潤廣;;模糊模式識別方法用于水工樞紐設計智能系統(tǒng)的初步研究[A];中國土木工程學會計算機應用學會第六屆年會土木工程計算機應用文集[C];1995年
9 蔣力培;黃軍芬;殷樹言;;基于二維小波變換及模式識別的焊縫坡口識別[A];第十一次全國焊接會議論文集(第2冊)[C];2005年
10 張二華;楊靜宇;費琪;;用神經(jīng)網(wǎng)絡進行測井相模式識別[A];新世紀 新機遇 新挑戰(zhàn)——知識創(chuàng)新和高新技術產業(yè)發(fā)展(上冊)[C];2001年
相關重要報紙文章 前10條
1 本報記者 張婷婷 陳兆平 賴曉莉;圍繞熱點重點難點積極履職[N];成都日報;2005年
2 邊紅星;謹防“仇智”心理[N];甘肅經(jīng)濟日報;2005年
3 李光天;生活中的“一二三四五”[N];人民政協(xié)報;2000年
4 每文;健康果汁功效榜[N];保健時報;2003年
5 海暄;六項禁令成為海關企業(yè)的雙重盾牌[N];國際商報;2004年
6 徐華;勿以利小而不為[N];中國鄉(xiāng)鎮(zhèn)企業(yè)報;2004年
7 新華社記者 高淑華 崔峰;一個上崗嫂的“黃金周”[N];新華每日電訊;2003年
8 晨明;范寶俊 一顆慈善的心[N];中華工商時報;2004年
9 袁軒;灑向草河全是愛[N];宜春日報;2006年
10 劉漢清 宋長征;長沙收獲遍地“黃金”[N];中國旅游報;2003年
相關博士學位論文 前10條
1 孫登第;基于隨機點積圖理論的模式識別方法研究[D];安徽大學;2012年
2 呂蓬;旋轉機械故障模式識別方法研究[D];華北電力大學(北京);2010年
3 謝洪平;三維數(shù)據(jù)分析與模式識別方法及其在藥學研究中的應用[D];湖南大學;2002年
4 陸文聰;三元金屬間化合物形成規(guī)律及若干二元系物性的計算機預報研究[D];中國科學院上海冶金研究所;2000年
5 陳燕清;化學計量學在食品分類鑒別及防腐劑含量分析中的應用[D];南昌大學;2010年
6 楊威;基于模式識別方法的多光譜遙感圖像分類研究[D];東北師范大學;2011年
7 許芬;保護私有信息的線性代數(shù)問題及擴展模型的研究[D];北京郵電大學;2011年
8 付海燕;化學模式識別和多維校正方法及其在復雜體系分析中的應用研究[D];湖南大學;2010年
9 朱友文;分布式環(huán)境下的隱私保護技術及其應用研究[D];中國科學技術大學;2012年
10 許高峰;全封閉組合電器局部放電信號內置傳感檢測和分形特征提取的研究[D];重慶大學;2003年
相關碩士學位論文 前10條
1 馮春輝;基于腦電節(jié)律的模式識別方法研究[D];燕山大學;2011年
2 侯書明;基于模式識別方法的葡萄酒質量預測研究[D];上海交通大學;2012年
3 鄭鑫;基于表面肌電信號的手臂運動模式識別方法研究[D];吉林大學;2012年
4 郭宙;流動軸承故障模式識別方法研究[D];北京化工大學;2011年
5 張寧仙;基于模式識別方法的果蠅振翅聲分類研究[D];陜西師范大學;2011年
6 古繼成;基于模式識別方法的天氣雷達數(shù)字產品的監(jiān)控與分析[D];南京理工大學;2012年
7 李博金;農村生態(tài)型社區(qū)建設模式研究[D];清華大學;2008年
8 韋秋華;基于局部結構特征空間拓撲關系建模的模式識別方法研究[D];哈爾濱工業(yè)大學;2011年
9 劉美潔;腦磁共振成像數(shù)據(jù)的多類模式分析[D];國防科學技術大學;2011年
10 白永強;面向多媒體的粗粒度可重構處理單元的結構研究[D];西北工業(yè)大學;2006年
,本文編號:1832768
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1832768.html