基于潛在語義索引和自組織映射網(wǎng)的檢索結(jié)果聚類方法
[Abstract]:With the continuous development of the Internet and the increasing amount of data, the role of search engines is becoming more and more obvious. Users rely more on search engines to find the needed information. Based on the (LSI) theory of latent semantic index and the (SOM) theory of self-organizing mapping neural network, a new method of text clustering, LSOM., is proposed. In this method, SOM network is used to realize text clustering of retrieval results, which does not need to give the number of categories in advance, and has the characteristics of flexible clustering and high accuracy. At the same time, the LSI theory is used to establish the vector space model, and the semantic relation is introduced into the weight of the entry. For the high-dimensional text feature vector, the noise contained in the original entry matrix is reduced. To improve the clustering speed, LSom uses a new category label extraction method, and uses the extracted label to solve the problem of SOM basic class partition. The algorithm is better than the existing algorithm in category label and clustering effect evaluation index.
【作者單位】: 哈爾濱工業(yè)大學(xué)計(jì)算機(jī)學(xué)院信息檢索研究室;
【基金】:國家自然科學(xué)基金項(xiàng)目(60675034) 國家“八六三”高技術(shù)研究發(fā)展計(jì)劃基金項(xiàng)目(2008AA01Z144)~~
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 張剛;劉悅;郭嘉豐;程學(xué)旗;;一種層次化的檢索結(jié)果聚類方法[J];計(jì)算機(jī)研究與發(fā)展;2008年03期
【共引文獻(xiàn)】
相關(guān)期刊論文 前6條
1 賈榮飛;金茂忠;王曉博;;基于用戶查詢?nèi)罩镜牟樵兙垲怺J];北京航空航天大學(xué)學(xué)報(bào);2010年04期
2 于洪;諶強(qiáng);;一種結(jié)合K-Means的層次化的搜索結(jié)果聚類方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年03期
3 靳宇倡;秦啟文;安俊秀;;網(wǎng)絡(luò)群體心理趨勢(shì)智能分析模型研究[J];計(jì)算機(jī)科學(xué);2010年06期
4 安俊秀;;基于服務(wù)器集群的云檢索系統(tǒng)的研究與示范[J];計(jì)算機(jī)科學(xué);2010年07期
5 龐觀松;張黎莎;蔣盛益;鄺麗敏;吳美玲;;一種基于名詞短語的檢索結(jié)果多層聚類方法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2010年07期
6 羅宏;陳黎;王亞強(qiáng);朱洪波;韓國輝;于中華;;基于查詢相關(guān)性分析的檢索結(jié)果聚類算法[J];小型微型計(jì)算機(jī)系統(tǒng);2011年10期
相關(guān)會(huì)議論文 前1條
1 秦鵬;李恒訓(xùn);張華平;劉金剛;;基于關(guān)鍵詞提取的搜索結(jié)果聚類研究[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
相關(guān)博士學(xué)位論文 前3條
1 周世兵;聚類分析中的最佳聚類數(shù)確定方法研究及應(yīng)用[D];江南大學(xué);2011年
2 李紅梅;智能元搜索引擎關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2009年
3 陳毅恒;文本檢索結(jié)果聚類及類別標(biāo)簽抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前7條
1 鄒浩;基于B/S+C/S結(jié)構(gòu)的高校圖書管理系統(tǒng)[D];電子科技大學(xué);2011年
2 劉龍海;基于成對(duì)約束的半監(jiān)督文本聚類算法研究[D];重慶大學(xué);2011年
3 史進(jìn)玲;基于粒計(jì)算的決策表屬性約簡(jiǎn)與規(guī)則提取研究[D];河南師范大學(xué);2009年
4 王平;基于自組織特征映射的檢索結(jié)果聚類研究[D];哈爾濱工業(yè)大學(xué);2009年
5 萬濤;圖書館管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2009年
6 李琳;基于粗糙集和遺傳算法的聚類方法研究[D];廣西師范大學(xué);2009年
7 吳夙慧;基于引用分析的學(xué)術(shù)檢索系統(tǒng)改進(jìn)研究[D];南京大學(xué);2012年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 王志梅,張俊林,李秋山;Web檢索結(jié)果快速聚類方法的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2004年12期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 蘇術(shù)鋒;Foxbase標(biāo)簽格式文件的改進(jìn)設(shè)計(jì)[J];軟件世界;1996年05期
2 程紅兵;Mac OS8快捷操作[J];桌面出版與設(shè)計(jì);1998年01期
3 陳有新;META標(biāo)簽的妙用[J];中國會(huì)計(jì)電算化;2001年08期
4 秋鳥;給MSN Messenger插上QQ的翅膀[J];電腦愛好者;2004年17期
5 ;Q博士考考你[J];電子質(zhì)量;2004年09期
6 張登銀,湯志云;采用主動(dòng)響應(yīng)的標(biāo)簽分發(fā)協(xié)議在衛(wèi)星網(wǎng)中的實(shí)現(xiàn)[J];南京郵電學(xué)院學(xué)報(bào);2005年01期
7 侯守禮,顧海英;轉(zhuǎn)基因食品標(biāo)簽管制與消費(fèi)者的知情選擇權(quán)[J];科學(xué)學(xué)研究;2005年04期
8 洪冬冬;群山;;千千高手我來當(dāng)[J];電腦迷;2005年16期
9 本刊編輯部;Kevin Ashton;Erik Michielsen;Rafael Moreno;Shahram Moradpour;Chantal Polsonetti;Thomas Ryan;Louis Sirico;;RFID的未來之路大有希望——眾多美國專家談RFID[J];金卡工程;2006年04期
10 本刊編輯部;;RFID讓無線無處不在[J];中國教育網(wǎng)絡(luò);2006年04期
相關(guān)會(huì)議論文 前10條
1 羅暉;;基于RFID的物業(yè)管理系統(tǒng)設(shè)計(jì)[A];第六屆全國信息獲取與處理學(xué)術(shù)會(huì)議論文集(3)[C];2008年
2 楊月欣;;食品營養(yǎng)標(biāo)簽的作用和意義[A];營養(yǎng)與保健食品研究及科學(xué)進(jìn)展學(xué)術(shù)資料匯編[C];2002年
3 李東;顧鵬;羅yN;汪錦邦;;食品的營養(yǎng)標(biāo)簽[A];未來五十年北京農(nóng)業(yè)與食品業(yè)的發(fā)展研討會(huì)論文集[C];2000年
4 楊曉強(qiáng);;500例外埠食品標(biāo)簽項(xiàng)目的調(diào)查報(bào)告[A];首屆全國衛(wèi)生法規(guī)、標(biāo)準(zhǔn)效益評(píng)價(jià)技術(shù)研討會(huì)暨講習(xí)班論文匯編[C];2000年
5 池剛毅;;RFID業(yè)務(wù)在移動(dòng)網(wǎng)絡(luò)中的實(shí)現(xiàn)[A];2007年中國通信學(xué)會(huì)“移動(dòng)增值業(yè)務(wù)與應(yīng)用”學(xué)術(shù)年會(huì)論文集[C];2007年
6 龍飛;;面向RFID標(biāo)簽芯片的天線設(shè)計(jì)[A];2008年中國西部青年通信學(xué)術(shù)會(huì)議論文集[C];2008年
7 晉松;林鴻飛;蘇綏;;基于標(biāo)簽共現(xiàn)的查詢擴(kuò)展研究[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
8 陳華媛;王淑艷;吳仁彪;;基于幀時(shí)隙ALOHA算法的標(biāo)簽估算數(shù)據(jù)分析[A];第十四屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
9 張陸;佐斌;;IAT在測(cè)量刻板印象中的屬性類別標(biāo)簽效應(yīng)[A];“改革開放與心理學(xué)”學(xué)術(shù)研討會(huì)——湖北省暨武漢心理學(xué)會(huì)2008年學(xué)術(shù)年會(huì)論文集[C];2008年
10 李欣;林代茂;;一種基于標(biāo)簽排序的Swf文件版權(quán)保護(hù)方法[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會(huì)湖南省計(jì)算機(jī)學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年
相關(guān)重要報(bào)紙文章 前10條
1 張珂;歐米特將創(chuàng)新技術(shù)帶到芝加哥國際標(biāo)簽展[N];中國包裝報(bào);2008年
2 本報(bào)記者 劉力源;看色別標(biāo)簽 知老人忌口[N];文匯報(bào);2010年
3 本報(bào)記者 成靜;“信任標(biāo)簽”讓不良網(wǎng)商無處藏身[N];中國經(jīng)濟(jì)導(dǎo)報(bào);2007年
4 本報(bào)記者 王巍;深圳標(biāo)簽護(hù)航協(xié)議供貨[N];政府采購信息報(bào);2008年
5 鐘品;貼了新標(biāo)簽就可網(wǎng)開一面?[N];中國改革報(bào);2009年
6 李松;賀歲熱:貼個(gè)標(biāo)簽就能熱賣?[N];新華每日電訊;2004年
7 本報(bào)記者 付麗麗 實(shí)習(xí)記者 吳瓊;自然標(biāo)簽揪住了問題食品的“尾巴”[N];大眾科技報(bào);2009年
8 張珂;防偽小標(biāo)簽 做出大生意[N];農(nóng)民日?qǐng)?bào);2008年
9 本報(bào)記者 李麗鈞;“高端”身份僅靠一紙標(biāo)簽明示[N];河北經(jīng)濟(jì)日?qǐng)?bào);2010年
10 譚俊嶠;標(biāo)簽市場(chǎng)機(jī)會(huì)不少[N];中國包裝報(bào);2008年
相關(guān)博士學(xué)位論文 前10條
1 龍麗坤;高壓誘導(dǎo)水稻發(fā)生可遺傳DNA甲基化變異和轉(zhuǎn)座子mPing及Pong的轉(zhuǎn)座激活[D];東北師范大學(xué);2006年
2 賴曉錚;UHF頻段射頻識(shí)別系統(tǒng)與天線研究[D];華南理工大學(xué);2006年
3 范志廣;超高頻射頻識(shí)別(RFID)中的若干問題研究[D];浙江大學(xué);2007年
4 高遠(yuǎn)艦;膜聯(lián)蛋白B1的功能研究及其在蛋白分離和純化中的應(yīng)用[D];第二軍醫(yī)大學(xué);2005年
5 劉丹;大成組技術(shù)中的若干關(guān)鍵技術(shù)研究[D];浙江大學(xué);2010年
6 李曉燕;海量圖像語義分析和檢索技術(shù)研究[D];浙江大學(xué);2009年
7 黃健華;基于SAGE技術(shù)的家蠶基因表達(dá)譜研究[D];中國科學(xué)院研究生院(上海生命科學(xué)研究院);2007年
8 管子玉;基于圖學(xué)習(xí)的Web信息檢索技術(shù)研究[D];浙江大學(xué);2010年
9 葉菊秀;傳染性法氏囊病毒粒子感染及其A節(jié)段編碼基因轉(zhuǎn)化細(xì)胞的轉(zhuǎn)錄本初步分析[D];浙江大學(xué);2006年
10 陳毅恒;文本檢索結(jié)果聚類及類別標(biāo)簽抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 張明濤;用于RFID系統(tǒng)的天線設(shè)計(jì)[D];西安電子科技大學(xué);2007年
2 吳海博;ForCES路由器中路由機(jī)制的研究與實(shí)現(xiàn)[D];清華大學(xué);2007年
3 張寧;UHF RFID系統(tǒng)標(biāo)簽天線快速設(shè)計(jì)與測(cè)量[D];北京郵電大學(xué);2011年
4 袁曉棟;蘇州健康網(wǎng)網(wǎng)站發(fā)布系統(tǒng)[D];吉林大學(xué);2005年
5 徐雪慧;射頻識(shí)別技術(shù)中防沖突算法研究[D];華中師范大學(xué);2006年
6 朱兆鷹;L公司中國戰(zhàn)略[D];復(fù)旦大學(xué);2008年
7 孟淑玲;射頻識(shí)別系統(tǒng)中防沖突算法的研究[D];天津大學(xué);2008年
8 夏標(biāo);新一代EAS系統(tǒng)的研究與實(shí)現(xiàn)[D];華東師范大學(xué);2009年
9 江岸;無線射頻識(shí)別系統(tǒng)中防碰撞問題的研究[D];湖南大學(xué);2009年
10 崔士津;RFID系統(tǒng)關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2008年
,本文編號(hào):2493050
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2493050.html