天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

熵選擇多重二進制編碼

發(fā)布時間:2018-07-14 10:17
【摘要】:為了解決查詢高維浮點型數據的近鄰點需要計算代價昂貴的歐式距離,內存占用率較高的問題,將高維浮點型數據通過哈希映射函數映射為低維二進制編碼,并保證同一樣本點在兩種空間內的歸一化距離滿足相似性。從而在實現近鄰檢索任務時,可使用代價較低的漢明距離替換歐式距離,達到降低檢索復雜度的目的。為保證由哈希函數生成的二進制編碼具有較優(yōu)的近鄰檢索性能,本文首先基于查找機制得到數據集適應空間分布特性的二進制標簽,然后利用SVM算法得到二進制標簽的分類平面,并選擇其中具有最大熵值的平面函數作為最終的哈希映射函數。為了進一步提高近鄰檢索性能,在訓練階段,初始化多種不同的編碼中心點用以生成多重二進制標簽,并得到與此相應的多重哈希函數和多重二進制編碼。在檢索過程中,建立了基于多重二進制編碼的近鄰檢索體系,返回具有較小平均漢明距離的樣本點作為最終檢索結果。實驗結果表明:與其他現存優(yōu)秀算法相比,本文算法可以快速、有效地將浮點型數據轉化為二進制編碼,而且基于這些二進制編碼的近鄰檢索性能較優(yōu)。
[Abstract]:In order to solve the problem of high cost Euclidean distance and high memory occupancy, the high-dimensional floating-point data is mapped to low-dimensional binary code by hash mapping function. The normalized distance of the same sample point in two kinds of space satisfies the similarity. In order to reduce the retrieval complexity, the lower cost hamming distance can be used to replace the Euclidean distance. In order to ensure that the binary code generated by the hash function has better nearest neighbor retrieval performance, the binary label of the data set adapted to spatial distribution is obtained based on the lookup mechanism. Then the classification plane of binary label is obtained by SVM algorithm, and the plane function with maximum entropy is selected as the final hash mapping function. In order to further improve the performance of nearest neighbor retrieval, in the training stage, many different coding centers are initialized to generate multiple binary tags, and corresponding multiple hash functions and multiple binary codes are obtained. In the retrieval process, the nearest neighbor retrieval system based on multiplex binary coding is established, and the sample point with small average hamming distance is returned as the final retrieval result. The experimental results show that the proposed algorithm can transform floating-point data into binary code quickly and effectively, and the performance of nearest neighbor retrieval based on these binary codes is better.
【作者單位】: 吉林大學計算機科學與技術學院;吉林大學符號計算與知識工程教育部重點實驗室;華東師范大學計算機科學與軟件工程學院;
【基金】:國家自然科學基金項目(61101155) 吉林省自然科學基金項目(20140101184JC;20150520063JH) 吉林大學研究生創(chuàng)新基金項目(2015051)
【分類號】:TP391.41

【相似文獻】

相關期刊論文 前10條

1 孟祥萍,梁志珊,張化光;一種基于二進制編碼的優(yōu)化方法[J];控制與決策;1998年S1期

2 吳俊杰;;信息的編碼:四位二進制編碼[J];中國信息技術教育;2014年05期

3 劉鵬林;淺談計算機采用二進制編碼的合理性[J];三明高等?茖W校學報;2003年04期

4 張東陽;李戰(zhàn);李文彬;;一種新型的二進制編碼理論的研究[J];微計算機信息;2010年12期

5 李良敏;溫廣瑞;王生昌;;基于二進制編碼的改進雜交策略[J];蘭州理工大學學報;2008年05期

6 孟祥萍,張化光,何巍;一種基于二進制編碼的改進遺傳算法[J];吉林工業(yè)大學自然科學學報;1999年03期

7 黃偉力;焦嬌;;基于題號二進制編碼的遺傳組卷算法[J];科技信息;2009年21期

8 王智永;;基于二進制編碼ERP數據質量研究[J];現代電子技術;2010年08期

9 張國富;周鵬;蔣建國;蘇兆品;田敬北;劉揚;;基于虛擬聯(lián)盟的重疊聯(lián)盟形成算法[J];電子學報;2012年01期

10 陳云;周武雷;;基于二進制編碼尺的水位測量儀設計[J];吉首大學學報(自然科學版);2014年01期

相關會議論文 前2條

1 安斌;嚴衛(wèi)東;鄭江玲;陳華;;兩種基于光譜形狀描述的二進制編碼分類新方法[A];中國航空學會信號與信息處理專業(yè)全國第八屆學術會議論文集[C];2004年

2 繆亞林;卞正中;;基于最佳二進制編碼的醫(yī)學B超信號研究[A];2009中國儀器儀表與測控技術大會論文集[C];2009年

相關重要報紙文章 前1條

1 ;XML“減肥”記[N];網絡世界;2005年



本文編號:2121332

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2121332.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶6915a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com