熵選擇多重二進制編碼
[Abstract]:In order to solve the problem of high cost Euclidean distance and high memory occupancy, the high-dimensional floating-point data is mapped to low-dimensional binary code by hash mapping function. The normalized distance of the same sample point in two kinds of space satisfies the similarity. In order to reduce the retrieval complexity, the lower cost hamming distance can be used to replace the Euclidean distance. In order to ensure that the binary code generated by the hash function has better nearest neighbor retrieval performance, the binary label of the data set adapted to spatial distribution is obtained based on the lookup mechanism. Then the classification plane of binary label is obtained by SVM algorithm, and the plane function with maximum entropy is selected as the final hash mapping function. In order to further improve the performance of nearest neighbor retrieval, in the training stage, many different coding centers are initialized to generate multiple binary tags, and corresponding multiple hash functions and multiple binary codes are obtained. In the retrieval process, the nearest neighbor retrieval system based on multiplex binary coding is established, and the sample point with small average hamming distance is returned as the final retrieval result. The experimental results show that the proposed algorithm can transform floating-point data into binary code quickly and effectively, and the performance of nearest neighbor retrieval based on these binary codes is better.
【作者單位】: 吉林大學計算機科學與技術學院;吉林大學符號計算與知識工程教育部重點實驗室;華東師范大學計算機科學與軟件工程學院;
【基金】:國家自然科學基金項目(61101155) 吉林省自然科學基金項目(20140101184JC;20150520063JH) 吉林大學研究生創(chuàng)新基金項目(2015051)
【分類號】:TP391.41
【相似文獻】
相關期刊論文 前10條
1 孟祥萍,梁志珊,張化光;一種基于二進制編碼的優(yōu)化方法[J];控制與決策;1998年S1期
2 吳俊杰;;信息的編碼:四位二進制編碼[J];中國信息技術教育;2014年05期
3 劉鵬林;淺談計算機采用二進制編碼的合理性[J];三明高等?茖W校學報;2003年04期
4 張東陽;李戰(zhàn);李文彬;;一種新型的二進制編碼理論的研究[J];微計算機信息;2010年12期
5 李良敏;溫廣瑞;王生昌;;基于二進制編碼的改進雜交策略[J];蘭州理工大學學報;2008年05期
6 孟祥萍,張化光,何巍;一種基于二進制編碼的改進遺傳算法[J];吉林工業(yè)大學自然科學學報;1999年03期
7 黃偉力;焦嬌;;基于題號二進制編碼的遺傳組卷算法[J];科技信息;2009年21期
8 王智永;;基于二進制編碼ERP數據質量研究[J];現代電子技術;2010年08期
9 張國富;周鵬;蔣建國;蘇兆品;田敬北;劉揚;;基于虛擬聯(lián)盟的重疊聯(lián)盟形成算法[J];電子學報;2012年01期
10 陳云;周武雷;;基于二進制編碼尺的水位測量儀設計[J];吉首大學學報(自然科學版);2014年01期
相關會議論文 前2條
1 安斌;嚴衛(wèi)東;鄭江玲;陳華;;兩種基于光譜形狀描述的二進制編碼分類新方法[A];中國航空學會信號與信息處理專業(yè)全國第八屆學術會議論文集[C];2004年
2 繆亞林;卞正中;;基于最佳二進制編碼的醫(yī)學B超信號研究[A];2009中國儀器儀表與測控技術大會論文集[C];2009年
相關重要報紙文章 前1條
1 ;XML“減肥”記[N];網絡世界;2005年
,本文編號:2121332
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2121332.html