天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于潛在語義的K-means++算法改進(jìn)及搜索應(yīng)用的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2024-02-03 00:50
  隨著互聯(lián)網(wǎng)與信息技術(shù)的高速發(fā)展,網(wǎng)絡(luò)上的信息量也在快速增長。面對(duì)日益增長的信息量,如何在大量信息中快速準(zhǔn)確地提取用戶搜索的關(guān)鍵信息與相關(guān)信息,提高搜索效率與搜索精度,成為近年來國內(nèi)外學(xué)者研究的熱點(diǎn)。然而傳統(tǒng)的搜索系統(tǒng)一般為基于關(guān)鍵字進(jìn)行內(nèi)容匹配,相對(duì)較難根據(jù)用戶的搜索需求進(jìn)行相關(guān)的潛在語義搜索。此外,K-means算法及其衍生算法K-means++算法由于其算法的實(shí)現(xiàn)相對(duì)簡單、收斂速度快等優(yōu)點(diǎn),常用來對(duì)大規(guī)模數(shù)據(jù)進(jìn)行聚類分析。然而由于傳統(tǒng)的K-means算法與其衍生算法K-means++由于初始聚類中心選擇的隨機(jī)性與聚類個(gè)數(shù)K值選取的問題,可能會(huì)導(dǎo)致聚類結(jié)果的不穩(wěn)定。因此,本論文提出了基于潛在語義分析的K-means++算法的改進(jìn),并將其應(yīng)用于搜索系統(tǒng)中。為此,本論文主要做了以下幾個(gè)方面的研究:首先,本論文進(jìn)行潛在語義模型的研究與構(gòu)建。本論文通過對(duì)潛在語義分析技術(shù)的基本原理進(jìn)行研究,使用文本預(yù)處理、文本分詞、同義詞合并、構(gòu)建詞-文檔矩陣并進(jìn)行矩陣分解與降維等方法,最后計(jì)算文檔之間的語義相似度,從而構(gòu)建潛在語義模型。從語義層面理解與處理用戶的搜索請(qǐng)求,并構(gòu)建數(shù)據(jù)之間的語義聯(lián)系。其次,本論...

【文章頁數(shù)】:70 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖4.4噪音點(diǎn)去除前的數(shù)據(jù)分布圖

圖4.4噪音點(diǎn)去除前的數(shù)據(jù)分布圖

南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第四章基于潛在語義分析改進(jìn)的K-means++算法c3…cj}與聚類數(shù)目K,根據(jù)本論文提出的改進(jìn)的K-means++算法,檢測(cè)出聚類異常值與噪點(diǎn),并將其排除,這里選擇其中三個(gè)數(shù)據(jù)集進(jìn)行仿真圖演示,因?yàn)槠鋽?shù)據(jù)集中的數(shù)據(jù)是二數(shù)據(jù),方便展....


圖4.5噪音點(diǎn)去除后的數(shù)據(jù)分布圖

圖4.5噪音點(diǎn)去除后的數(shù)據(jù)分布圖

南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第四章基于潛在語義分析改進(jìn)的K-means++算法c3…cj}與聚類數(shù)目K,根據(jù)本論文提出的改進(jìn)的K-means++算法,檢測(cè)出聚類異常值與噪點(diǎn),并將其排除,這里選擇其中三個(gè)數(shù)據(jù)集進(jìn)行仿真圖演示,因?yàn)槠鋽?shù)據(jù)集中的數(shù)據(jù)是二數(shù)據(jù),方便展....


圖4.6K-means++算法數(shù)據(jù)的初始化與聚類中心的初始化圖

圖4.6K-means++算法數(shù)據(jù)的初始化與聚類中心的初始化圖

點(diǎn)去除前的數(shù)據(jù)分布圖圖4.5噪音點(diǎn)去除后的數(shù)據(jù)分布圖點(diǎn)去除后,我們對(duì)改進(jìn)的K-means++的聚類中心的選取與聚類效果eans++算法數(shù)據(jù)的初始化與聚類中心的初始化如圖4.6所示,其聚類中心的選取與聚類過程如圖4.7所示。過對(duì)樣本數(shù)據(jù)集Pima與NYSK進(jìn)....


圖4.7基于密度改進(jìn)的K-means++算法的聚類中心的選取與聚類過程圖

圖4.7基于密度改進(jìn)的K-means++算法的聚類中心的選取與聚類過程圖

圖4.7基于密度改進(jìn)的K-means++算法的聚類中心的選取與聚類過程圖4.7中,我們可以看到改進(jìn)的K-means++算法的聚類過程,在初始聚類中心選定不斷的計(jì)算與迭代,改變聚類中心的位置,從而使得聚類中心相聚盡可能遠(yuǎn),同類簇的中心點(diǎn)的位置,從而使聚類的效果更好。接下....



本文編號(hào):3893425

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3893425.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a62fd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
伊人网免费在线观看高清版| 欧美日韩国产二三四区| 国产一区欧美一区日本道| 欧美国产日韩在线综合| 91天堂素人精品系列全集| 丰满的人妻一区二区三区| 欧美激情床戏一区二区三| 国产女性精品一区二区三区| 狠狠干狠狠操在线播放| 国产精品午夜福利免费在线| 久久99精品国产麻豆婷婷洗澡| 国产不卡一区二区四区| 国产永久免费高清在线精品| 玩弄人妻少妇一区二区桃花| 国产综合欧美日韩在线精品| 亚洲最新av在线观看| 成年人免费看国产视频| 97人摸人人澡人人人超碰| 成人精品网一区二区三区| 手机在线不卡国产视频| 免费精品一区二区三区| 欧美日韩国产成人高潮| 日韩精品一区二区三区av在线| 欧洲日本亚洲一区二区| 人妻一区二区三区多毛女| 国产精品午夜福利免费阅读| 日本本亚洲三级在线播放| 国产欧美韩日一区二区三区| 国产中文另类天堂二区| 亚洲欧美国产中文色妇| 高清一区二区三区大伊香蕉| 午夜福利直播在线视频| 视频在线播放你懂的一区| 好吊日在线视频免费观看| 视频在线免费观看你懂的| 亚洲欧美日韩在线中文字幕| 中文字幕一二区在线观看| 欧洲精品一区二区三区四区| 精品人妻少妇二区三区| 欧美日韩国产的另类视频| 国产精品亚洲综合天堂夜夜|