天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于網(wǎng)格點密度估計的聚類算法研究

發(fā)布時間:2020-05-16 03:27
【摘要】:機器學習算法的研究是人工智能領域中的一個重要分支,它涉及到眾多學科的交叉融合。機器學習算法的研究對象是怎樣模擬人類的行為以學習新的知識從而更新知識結構、改善自身的性能。機器學習領域的研究在近些年來已經(jīng)取得了很大的進展,各種各樣的機器學習算法也被提了出來。機器學習算法通常情況下可以被分為三大類:有監(jiān)督學習算法、無監(jiān)督學習算法和半監(jiān)督學習算法。聚類分析算法是其中最具有代表性的一種無監(jiān)督機器學習算法。該類算法依據(jù)數(shù)據(jù)點的某種屬性將數(shù)據(jù)集中相似的數(shù)據(jù)點劃分到同一個類簇中而把非相似的數(shù)據(jù)點劃分到不同的類簇。盡管各種各樣的聚類算法已經(jīng)被提出,但是大多數(shù)傳統(tǒng)的聚類方法只能適用于球形類簇的聚類并且算法的聚類結果可能會受到參數(shù)設置和初始化的影響。此外,當數(shù)據(jù)集中數(shù)據(jù)點數(shù)量和數(shù)據(jù)維度的規(guī)模變得非常大時,聚類算法的效率將受到時間復雜性和空間復雜性的限制。因此,本論文中提出了一種快速穩(wěn)定基于網(wǎng)格的能夠識別任意形狀類簇的聚類方法,該算法還能夠穩(wěn)定地應對大數(shù)據(jù)集的聚類。改進的方法中,首先該方法運用給定的公式自動化確定網(wǎng)格的劃分區(qū)間數(shù)目,然后算法計算劃分網(wǎng)格中網(wǎng)格節(jié)點處的密度值而非傳統(tǒng)方法中的網(wǎng)格密度。最后,算法依據(jù)網(wǎng)格節(jié)點的密度值采用經(jīng)典的廣度優(yōu)先搜索算法進行聚類操作。在多個人工數(shù)據(jù)集和真實數(shù)據(jù)集上的實驗結果表明,該方法比傳統(tǒng)的聚類方法更加有效。此外,聚類算法結果的評價通常需要計算聚類評價指標的值,傳統(tǒng)的點對比較方法對于大數(shù)據(jù)集的評價指標計算效率比較低。本論文中給出了利用混淆矩陣計算聚類結果評價指標的方法,實驗結果表明該方法能夠明顯地提高獲取評價指標值的效率。
【圖文】:

標簽,數(shù)據(jù)集,聚類,實驗結果


蘭州大學碩士學位論文 基于網(wǎng)格點密度估計的聚類算法研究n 為數(shù)據(jù)點的總數(shù)目。 √ (3-1)該公式中還有一個值得注意的地方是數(shù)據(jù)集所有維度的 K 值之乘積為 n,,這與文章[33]中所提出的思想有類似之處。實驗過程中由于 K-means 算法的結果具有一定的波動性,故而進行了多次實驗取其結果的均值以增強結果的可靠性。實驗過程中運用了幾個真實的公開數(shù)據(jù)集進行驗證,數(shù)據(jù)集的詳細介紹將在第四章中詳細說明。該方法得到的實驗結果如圖 3-1 所示。

示意圖,網(wǎng)格節(jié)點,網(wǎng)格,示意圖


如圖3-2 所示:圖 3-2 網(wǎng)格與網(wǎng)格節(jié)點示意圖傳統(tǒng)的方法中,網(wǎng)格里面包含的數(shù)據(jù)點個數(shù)即為該網(wǎng)格的密度值。而在改進的聚類算法中,密度值的計算不是統(tǒng)計網(wǎng)格中數(shù)據(jù)點的個數(shù)而是計算如上圖所示網(wǎng)格節(jié)點的密度值。首先,該方法中的數(shù)據(jù)集需要進行歸一化處理,該方法對數(shù)據(jù)集進行變換使得其結果的值域位于[0,1]之間。其歸一化處理的函數(shù)如 3-2 所示: (3-2)其中 X 代表原始數(shù)據(jù)集的值,MIN 和 MAX 分別代表數(shù)據(jù)集中該維度的數(shù)據(jù)點值的最小值和最大值,經(jīng)過該函數(shù)的變化可以得到歸一化處理的結果[36]。歸一化處理完成后,數(shù)據(jù)點需要被劃分到網(wǎng)格中。設算法中劃分網(wǎng)格的數(shù)目大小為 k,則可以運用式子 3-3 對數(shù)據(jù)點進行劃分操作。
【學位授予單位】:蘭州大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP311.13

【相似文獻】

相關期刊論文 前10條

1 王曉東;解非線性0-1規(guī)劃的一個算法及其在結構優(yōu)化中的應用[J];數(shù)值計算與計算機應用;1988年01期

2 章淑貞;;算法“雙刃劍”[J];新聞與寫作;2018年09期

3 王天宇;孫宇軍;;智能情報算法體系的構建[J];中華醫(yī)學圖書情報雜志;2018年07期

4 林耿;;一種求解厭惡型p-中位問題的混合進化算法[J];浙江大學學報(理學版);2018年01期

5 馬慧;吳彥鴻;王宏艷;;基于貪婪搜索的RC-LDPC編碼序列打孔算法研究[J];通信技術;2018年05期

6 陳樹;袁欣琪;;一種改進的基于PEG算法構造QC-LDPC碼的方法[J];科技展望;2015年22期

7 汪靖;劉桂元;;基于動態(tài)步長變化的螢火蟲算法[J];計算機工程與設計;2019年04期

8 段丹青;衛(wèi)宏儒;;對MIBS算法的碰撞攻擊[J];計算機科學;2018年02期

9 吳尚智;任小康;;用加速逃逸時間算法構造Julia集圖形[J];計算機應用與軟件;2006年05期

10 李卓;李文霞;巨玉祥;陳曉明;何曉平;;混合蟻群算法求解帶軟時間窗的車輛路徑問題[J];武漢理工大學學報(交通科學與工程版);2019年04期

相關會議論文 前1條

1 徐蔚然;張洪剛;郭軍;;基于語法、語義信息的銀行票據(jù)二值化算法的構造[A];2001年中國智能自動化會議論文集(下冊)[C];2001年

相關博士學位論文 前5條

1 楊遠;非線性狀態(tài)空間模型貝葉斯估計中的高效粒子MCMC算法[D];廈門大學;2017年

2 向函;復雜交通場景下車牌檢測算法的研究[D];貴州大學;2019年

3 康文潔;基于F-范數(shù)最小化的稀疏近似逆預處理方法[D];清華大學;2017年

4 李冬冬;基因組序列標注的算法與理論研究[D];國防科學技術大學;2004年

5 李睿智;基于局部搜索策略的若干組合優(yōu)化問題求解算法研究[D];東北師范大學;2017年

相關碩士學位論文 前10條

1 王磊;基于網(wǎng)格點密度估計的聚類算法研究[D];蘭州大學;2019年

2 宋明展;兩類保結構算法研究及其應用[D];國防科學技術大學;2016年

3 陳威;基于推薦窗口與關鍵點匹配的行人檢測算法研究[D];湖南大學;2016年

4 肖懷遠;基于Spark的高效用項集挖掘算法研究[D];河南大學;2018年

5 孔濤;基于改進細菌覓食算法的配電網(wǎng)故障定位研究[D];山東理工大學;2017年

6 朱騰云;基于密度的增量動態(tài)社區(qū)發(fā)現(xiàn)算法研究[D];福州大學;2017年

7 燕亞娟;有限維Hilbert空間中框架的構造及其算法[D];福州大學;2017年

8 林道玲;一類DC優(yōu)化的加速鄰近算法及其收斂性分析[D];暨南大學;2018年

9 唐偉聰;大規(guī)模MIMO系統(tǒng)中高效DOA算法的研究[D];廣東工業(yè)大學;2018年

10 張東;自適應抽樣算法及其R包開發(fā)[D];華東師范大學;2017年



本文編號:2666096

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2666096.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶89053***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com