一種基于聚類技術(shù)的全文檢索與推介系統(tǒng)的構(gòu)建
本文關(guān)鍵詞:一種基于聚類技術(shù)的全文檢索與推介系統(tǒng)的構(gòu)建
更多相關(guān)文章: 搜索引擎 聚類 關(guān)鍵詞 推介
【摘要】:近年來(lái),搜索引擎的發(fā)展可謂突飛猛進(jìn),排序算法也日新月異,但相關(guān)搜索推介這項(xiàng)功能卻進(jìn)展緩慢,無(wú)法為用戶提供令人滿意的有價(jià)值的關(guān)鍵詞。本項(xiàng)目是專門(mén)為了解決這個(gè)問(wèn)題而進(jìn)行研究的,采用單詞到文檔,文檔到聚類,聚類再回歸單詞的語(yǔ)義檢索流程,完成了K-means聚類算法以及TFIDF權(quán)重算法的Java實(shí)現(xiàn)。通過(guò)此系統(tǒng),用戶不僅可以找到包含指定關(guān)鍵詞的網(wǎng)頁(yè),還會(huì)收到與該關(guān)鍵詞關(guān)聯(lián)最緊密的其他關(guān)鍵詞推介,協(xié)助用戶進(jìn)一步發(fā)掘信息。
【作者單位】: 北京電子科技學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系;西安電子科技大學(xué)計(jì)算機(jī)學(xué)院;
【關(guān)鍵詞】: 搜索引擎 聚類 關(guān)鍵詞 推介
【基金】:國(guó)家自然基金項(xiàng)目(61170037) 北京電子科技學(xué)院科研項(xiàng)目(2014GCYY09)資助
【分類號(hào)】:TP391.3
【正文快照】: 本文受?chē)?guó)家自然基金項(xiàng)目(61170037),北京電子科技學(xué)院科研項(xiàng)目(2014GCYY09)資助。1引言如今,互聯(lián)網(wǎng)已經(jīng)成為了世界上最重要的信息發(fā)布平臺(tái)之一,極低的門(mén)檻讓每個(gè)人都能成為信息的發(fā)布者。但隨之而來(lái)的就是信息的大爆炸,使得互聯(lián)網(wǎng)上的信息大大超過(guò)了一個(gè)普通人的記憶范疇,再也
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 谷照升;;RIA技術(shù)解析[J];長(zhǎng)春工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年01期
2 鄭廷;鄭誠(chéng);;基于Lucene的語(yǔ)義檢索系統(tǒng)[J];計(jì)算機(jī)工程;2008年16期
3 施聰鶯;徐朝軍;楊曉江;;TFIDF算法研究綜述[J];計(jì)算機(jī)應(yīng)用;2009年S1期
4 熊回香;陳姍;許穎穎;;基于Web 3.0的個(gè)性化信息聚合技術(shù)研究[J];情報(bào)理論與實(shí)踐;2011年08期
5 侯麗;;Web2.0的特性及對(duì)信息服務(wù)的創(chuàng)新性思考[J];圖書(shū)館建設(shè);2008年01期
6 吳潔明;冀單單;韓云輝;;基于Web的DCI垂直搜索引擎的研究與設(shè)計(jì)[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年04期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 翟延冬;基于WordNet的短文本語(yǔ)義網(wǎng)挖掘算法研究[D];吉林大學(xué);2012年
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王益明;崔莎;王婧文;;2011年我國(guó)情報(bào)學(xué)研究進(jìn)展[J];國(guó)家圖書(shū)館學(xué)刊;2012年03期
2 尚福華;韓開(kāi)旭;;基于相關(guān)術(shù)語(yǔ)群和同義詞的查詢擴(kuò)展研究[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2010年03期
3 李衛(wèi)峰;;基于Web2.0的學(xué)科知識(shí)服務(wù)模式及其平臺(tái)構(gòu)建[J];大學(xué)圖書(shū)情報(bào)學(xué)刊;2011年06期
4 李蓓;;政治博客及其信息過(guò)濾問(wèn)題研究[J];電子政務(wù);2009年12期
5 秦岳;毛征;孫樂(lè)公;齊南;彭超;;慢運(yùn)動(dòng)背景下的實(shí)時(shí)運(yùn)動(dòng)目標(biāo)檢測(cè)算法研究[J];國(guó)外電子測(cè)量技術(shù);2011年12期
6 寇小文;吳劍霞;;基于SNS的大學(xué)圖書(shū)館信息服務(wù)模式研究[J];高校圖書(shū)館工作;2010年03期
7 楊生舉;蒙杰;趙昕輝;杜雨璐;;基于文本挖掘的科研項(xiàng)目網(wǎng)上評(píng)審系統(tǒng)研究與實(shí)現(xiàn)[J];甘肅科技;2012年15期
8 宋艷;何嘉;舒紅平;鄭皎凌;梁繁榮;任玉蘭;文立玉;;基于文本挖掘詞頻反文檔頻率方法的疾病癥狀權(quán)重挖掘研究[J];成都信息工程學(xué)院學(xué)報(bào);2014年01期
9 熊志斌;朱劍鋒;王冬;;K-means聚類算法的研究和應(yīng)用[J];電腦編程技巧與維護(hù);2014年08期
10 阮成奇;謝輝;;面向網(wǎng)絡(luò)群體用戶的知識(shí)服務(wù)模型研究[J];電子商務(wù);2014年08期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 初蘇華;潘曉東;刑萍;鄭賀健;施健歡;解家蒂;;工商銀行審計(jì)信息化向信息化審計(jì)轉(zhuǎn)變的思考[A];全國(guó)內(nèi)部審計(jì)理論研討優(yōu)秀論文集(2013)[C];2014年
2 蔣志濱;樊巧玲;;關(guān)聯(lián)分析法在方劑配伍規(guī)律研究中的應(yīng)用與思考[A];中華中醫(yī)藥學(xué)會(huì)第十四次中醫(yī)方劑學(xué)學(xué)術(shù)年會(huì)論文集[C];2014年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 申文武;無(wú)結(jié)構(gòu)P2P網(wǎng)絡(luò)中基于語(yǔ)義和節(jié)點(diǎn)存儲(chǔ)能力的搜索關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2011年
2 張瑩;基于語(yǔ)義的分布式服務(wù)與資源一體化發(fā)現(xiàn)方法研究[D];北京交通大學(xué);2009年
3 彭菲菲;網(wǎng)絡(luò)熱點(diǎn)話題發(fā)現(xiàn)的關(guān)鍵技術(shù)研究[D];中國(guó)礦業(yè)大學(xué)(北京);2012年
4 劉文;食品安全指數(shù)的構(gòu)建及應(yīng)用研究[D];華中農(nóng)業(yè)大學(xué);2013年
5 歐陽(yáng)柳波;領(lǐng)域本體覆蓋度評(píng)價(jià)關(guān)鍵技術(shù)研究[D];中南大學(xué);2012年
6 張金松;基于引文上下文分析的文獻(xiàn)檢索技術(shù)研究[D];大連海事大學(xué);2013年
7 武慧娟;社會(huì)化標(biāo)注系統(tǒng)中個(gè)性化信息推薦模型研究[D];吉林大學(xué);2014年
8 張賽男;基于集體智慧的開(kāi)放學(xué)習(xí)資源聚合與分享研究[D];東北師范大學(xué);2014年
9 苑衛(wèi)國(guó);微博用戶行為分析和網(wǎng)絡(luò)結(jié)構(gòu)演化的研究[D];北京交通大學(xué);2014年
10 李書(shū)明;數(shù)字化學(xué)習(xí)中知識(shí)組織模型及應(yīng)用研究[D];華中師范大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王飛;基于蟻群優(yōu)化的模糊文本聚類算法研究[D];河南工業(yè)大學(xué);2010年
2 張曉艷;面向農(nóng)業(yè)信息服務(wù)平臺(tái)的挖掘技術(shù)研究[D];湖南工業(yè)大學(xué);2010年
3 丁林梟;多源監(jiān)視系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)地質(zhì)大學(xué)(北京);2011年
4 賈增朝;用于圖像檢索的視覺(jué)詞匯樹(shù)研究[D];西北大學(xué);2011年
5 張韋;基于語(yǔ)義的Web主題提取的研究[D];湖北工業(yè)大學(xué);2011年
6 丁若堯;基于博客的網(wǎng)絡(luò)話題發(fā)現(xiàn)及追蹤的研究[D];北京交通大學(xué);2011年
7 陳凱;搜索引擎有關(guān)排序算法研究[D];武漢理工大學(xué);2011年
8 齊尚海;基于JavaFX的富互聯(lián)網(wǎng)應(yīng)用技術(shù)的研究[D];武漢理工大學(xué);2011年
9 邱偉林;面向領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)[D];大連海事大學(xué);2011年
10 黎源;基于粗糙集的中文文本分類在郵件過(guò)濾中的研究[D];暨南大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年05期
2 牛琨;張舒博;陳俊亮;;融合網(wǎng)格密度的聚類中心初始化方案[J];北京郵電大學(xué)學(xué)報(bào);2007年02期
3 孫鐵利,楊鳳芹;根據(jù)用戶隱式反饋建立和更新用戶興趣模型[J];東北師大學(xué)報(bào)(自然科學(xué)版);2003年03期
4 景麗萍,黃厚寬,石洪波;用于文本挖掘的特征選擇方法TFIDF及其改進(jìn)[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期
5 許卓明,蘇文萍;關(guān)系數(shù)據(jù)庫(kù)模式信息的提取[J];河海大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年02期
6 提姆·奧萊理 ,玄偉劍;什么是Web2.0[J];互聯(lián)網(wǎng)周刊;2005年40期
7 譚晨輝;劉青炎;;OpenAPI出現(xiàn)、起源與現(xiàn)狀[J];程序員;2008年07期
8 張東娜;周春光;劉彥斌;郭東偉;;一種基于WordNet和Corpus Statistics的語(yǔ)義相似性計(jì)算方法[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2010年05期
9 劉立平,孟志青;一種選取初始聚類中心的方法[J];計(jì)算機(jī)工程與應(yīng)用;2004年08期
10 左雄輝,糜麒;個(gè)性化搜索引擎研究[J];計(jì)算機(jī)工程與應(yīng)用;2005年17期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 黃世國(guó);耿國(guó)華;;語(yǔ)義相似性測(cè)度方法研究[A];2006年全國(guó)理論計(jì)算機(jī)科學(xué)學(xué)術(shù)年會(huì)論文集[C];2006年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 王宇;基于TFIDF的文本分類算法研究[D];鄭州大學(xué);2006年
2 李媛媛;基于潛在語(yǔ)義索引的中文文本檢索研究[D];西南交通大學(xué);2008年
3 萬(wàn)紅波;語(yǔ)義網(wǎng)環(huán)境下本體映射的研究[D];重慶大學(xué);2008年
4 黃少林;基于用戶興趣分析的個(gè)性化搜索引擎研究[D];首都師范大學(xué);2009年
5 顧雅楓;基于用戶興趣模型的信息檢索研究[D];蘭州大學(xué);2009年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉凌云,章銀良,郭秀麗;多媒體全文檢索光盤(pán)的系統(tǒng)組成與檢索原理[J];鄭州輕工業(yè)學(xué)院學(xué)報(bào);2000年01期
2 ;全文檢索入佳境[J];微電腦世界;2000年37期
3 李衛(wèi)偉;全文數(shù)據(jù)光盤(pán)在校園網(wǎng)上的應(yīng)用實(shí)踐[J];情報(bào)雜志;2001年01期
4 曉月;;全文檢索原理及實(shí)現(xiàn)[J];程序員;2006年12期
5 吳澤彬;魏潔;李蔚清;吳慧中;;面向服務(wù)架構(gòu)的全文檢索研究[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年S1期
6 常征;;SQL Server 2000全文檢索的實(shí)現(xiàn)[J];科技信息(科學(xué)教研);2007年16期
7 符捷雯;;媒體資料庫(kù)的全文檢索效率提升[J];中國(guó)傳媒科技;2008年09期
8 陳福生;;全文檢索在網(wǎng)站搜索系統(tǒng)中的應(yīng)用[J];電腦編程技巧與維護(hù);2009年12期
9 謝正華;羅立芳;;基于多數(shù)據(jù)源的全文檢索設(shè)計(jì)方案[J];中國(guó)科技信息;2010年10期
10 蘭萍;;SQL Server 2005全文檢索在數(shù)據(jù)查詢中的應(yīng)用[J];電腦編程技巧與維護(hù);2010年20期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前7條
1 曾福萍;周定康;;基于索引服務(wù)器實(shí)現(xiàn)全文檢索[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年
2 史建斌;;軍控核查數(shù)據(jù)庫(kù)光盤(pán)全文檢索功能的原理及實(shí)現(xiàn)[A];中國(guó)工程物理研究院科技年報(bào)(2005)[C];2005年
3 范志新;王寧;陶曉鵬;施伯樂(lè);;開(kāi)放式圖書(shū)館漢語(yǔ)檢索結(jié)構(gòu)[A];數(shù)據(jù)庫(kù)研究進(jìn)展97——第十四屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(下)[C];1997年
4 朱虹;吳林;;DM4全文檢索機(jī)制的設(shè)計(jì)[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
5 朱虹;黃歡;;DM4全文檢索機(jī)制的改進(jìn)[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
6 張誼巖;張霞;;OpenBASE中BLOB型文本數(shù)據(jù)全文檢索的設(shè)計(jì)與實(shí)現(xiàn)[A];第十六屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集[C];1999年
7 王富強(qiáng);馬德濤;張立朝;王建明;;地方志數(shù)據(jù)庫(kù)全文信息檢索研究[A];中國(guó)地理信息系統(tǒng)協(xié)會(huì)第四次會(huì)員代表大會(huì)暨第十一屆年會(huì)論文集[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前8條
1 馮貝;“工”于全文檢索的數(shù)據(jù)庫(kù)系統(tǒng)[N];科技日?qǐng)?bào);2001年
2 寧夏數(shù)據(jù)通信局 劉君;SQL Server 2000中全文檢索的使用[N];計(jì)算機(jī)世界;2002年
3 陳玉榮;更多、更快、更新的檢索系統(tǒng)[N];中國(guó)企業(yè)報(bào);2000年
4 郭瑩;全文檢索市場(chǎng)空間大[N];中國(guó)計(jì)算機(jī)報(bào);2006年
5 寧夏 劉君;SQL Server中全文檢索的使用[N];電腦報(bào);2001年
6 朱艷;術(shù)語(yǔ)解釋[N];中國(guó)電腦教育報(bào);2000年
7 ;深度開(kāi)發(fā)利用 廣泛資源共享[N];中國(guó)財(cái)經(jīng)報(bào);2001年
8 溫蘇剛 姚大紅;在PB中實(shí)現(xiàn)全文檢索[N];計(jì)算機(jī)世界;2002年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 周科松;全文檢索與GIS一體化及在應(yīng)急管理中的應(yīng)用研究[D];華東師范大學(xué);2009年
2 溫延龍;XML信息檢索關(guān)鍵技術(shù)研究[D];南開(kāi)大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李帥;全文檢索在“2008奧運(yùn)多語(yǔ)言系統(tǒng)”中的應(yīng)用研究與實(shí)現(xiàn)[D];北京工業(yè)大學(xué);2009年
2 張翔;基于多核并行的全文檢索動(dòng)態(tài)后繼樹(shù)模型相關(guān)算法研究[D];廣西大學(xué);2013年
3 史杰;基于語(yǔ)義的全文檢索優(yōu)化和改進(jìn)[D];江蘇科技大學(xué);2014年
4 陳寧;Lucene全文檢索在網(wǎng)絡(luò)教學(xué)平臺(tái)中的應(yīng)用研究[D];大連海事大學(xué);2007年
5 林義明;全文檢索及相關(guān)技術(shù)研究[D];遼寧科技大學(xué);2012年
6 郭建榮;基于分布式計(jì)算的全文檢索關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2014年
7 朱書(shū)梅;開(kāi)放獲取期刊統(tǒng)一訪問(wèn)及全文檢索平臺(tái)研究[D];南京農(nóng)業(yè)大學(xué);2008年
8 盧光華;基于Lucene的全文檢索研究與應(yīng)用[D];吉林大學(xué);2009年
9 王忠義;基于XML的全文檢索方法及原型系統(tǒng)實(shí)現(xiàn)研究[D];華中師范大學(xué);2009年
10 楊娜;基于lucene的輕量級(jí)全文檢索系統(tǒng)模型研究[D];鄭州大學(xué);2009年
,本文編號(hào):667203
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/667203.html