天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于潛在語義的K-means++算法改進及搜索應(yīng)用的研究與實現(xiàn)

發(fā)布時間:2024-02-03 00:50
  隨著互聯(lián)網(wǎng)與信息技術(shù)的高速發(fā)展,網(wǎng)絡(luò)上的信息量也在快速增長。面對日益增長的信息量,如何在大量信息中快速準確地提取用戶搜索的關(guān)鍵信息與相關(guān)信息,提高搜索效率與搜索精度,成為近年來國內(nèi)外學(xué)者研究的熱點。然而傳統(tǒng)的搜索系統(tǒng)一般為基于關(guān)鍵字進行內(nèi)容匹配,相對較難根據(jù)用戶的搜索需求進行相關(guān)的潛在語義搜索。此外,K-means算法及其衍生算法K-means++算法由于其算法的實現(xiàn)相對簡單、收斂速度快等優(yōu)點,常用來對大規(guī)模數(shù)據(jù)進行聚類分析。然而由于傳統(tǒng)的K-means算法與其衍生算法K-means++由于初始聚類中心選擇的隨機性與聚類個數(shù)K值選取的問題,可能會導(dǎo)致聚類結(jié)果的不穩(wěn)定。因此,本論文提出了基于潛在語義分析的K-means++算法的改進,并將其應(yīng)用于搜索系統(tǒng)中。為此,本論文主要做了以下幾個方面的研究:首先,本論文進行潛在語義模型的研究與構(gòu)建。本論文通過對潛在語義分析技術(shù)的基本原理進行研究,使用文本預(yù)處理、文本分詞、同義詞合并、構(gòu)建詞-文檔矩陣并進行矩陣分解與降維等方法,最后計算文檔之間的語義相似度,從而構(gòu)建潛在語義模型。從語義層面理解與處理用戶的搜索請求,并構(gòu)建數(shù)據(jù)之間的語義聯(lián)系。其次,本論...

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖4.4噪音點去除前的數(shù)據(jù)分布圖

圖4.4噪音點去除前的數(shù)據(jù)分布圖

南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第四章基于潛在語義分析改進的K-means++算法c3…cj}與聚類數(shù)目K,根據(jù)本論文提出的改進的K-means++算法,檢測出聚類異常值與噪點,并將其排除,這里選擇其中三個數(shù)據(jù)集進行仿真圖演示,因為其數(shù)據(jù)集中的數(shù)據(jù)是二數(shù)據(jù),方便展....


圖4.5噪音點去除后的數(shù)據(jù)分布圖

圖4.5噪音點去除后的數(shù)據(jù)分布圖

南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第四章基于潛在語義分析改進的K-means++算法c3…cj}與聚類數(shù)目K,根據(jù)本論文提出的改進的K-means++算法,檢測出聚類異常值與噪點,并將其排除,這里選擇其中三個數(shù)據(jù)集進行仿真圖演示,因為其數(shù)據(jù)集中的數(shù)據(jù)是二數(shù)據(jù),方便展....


圖4.6K-means++算法數(shù)據(jù)的初始化與聚類中心的初始化圖

圖4.6K-means++算法數(shù)據(jù)的初始化與聚類中心的初始化圖

點去除前的數(shù)據(jù)分布圖圖4.5噪音點去除后的數(shù)據(jù)分布圖點去除后,我們對改進的K-means++的聚類中心的選取與聚類效果eans++算法數(shù)據(jù)的初始化與聚類中心的初始化如圖4.6所示,其聚類中心的選取與聚類過程如圖4.7所示。過對樣本數(shù)據(jù)集Pima與NYSK進....


圖4.7基于密度改進的K-means++算法的聚類中心的選取與聚類過程圖

圖4.7基于密度改進的K-means++算法的聚類中心的選取與聚類過程圖

圖4.7基于密度改進的K-means++算法的聚類中心的選取與聚類過程圖4.7中,我們可以看到改進的K-means++算法的聚類過程,在初始聚類中心選定不斷的計算與迭代,改變聚類中心的位置,從而使得聚類中心相聚盡可能遠,同類簇的中心點的位置,從而使聚類的效果更好。接下....



本文編號:3893425

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3893425.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a62fd***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com