基于文本分類(lèi)的網(wǎng)絡(luò)知識(shí)發(fā)現(xiàn)
本文關(guān)鍵詞:基于文本分類(lèi)的網(wǎng)絡(luò)知識(shí)發(fā)現(xiàn)
更多相關(guān)文章: 知識(shí)發(fā)現(xiàn) 文本分類(lèi) 搜索引擎 規(guī)則挖掘
【摘要】:研究基于網(wǎng)絡(luò)的文本知識(shí)發(fā)現(xiàn),根據(jù)搜索引擎分類(lèi)內(nèi)容的特點(diǎn),通過(guò)幾種常用搜索引擎的比較,結(jié)合文本分類(lèi)的特點(diǎn),發(fā)現(xiàn)單純搜索文本信息資源的引擎更適合于文本分類(lèi);進(jìn)而給出基于文本分類(lèi)的網(wǎng)絡(luò)信息獲取原型,提出基于元數(shù)據(jù)的用戶感興趣知識(shí)的提取模式,用戶可以根據(jù)實(shí)際情況在給定范圍內(nèi)提取自己感興趣的文本信息,從而提高文本信息挖掘的精準(zhǔn)性。
【作者單位】: 中國(guó)人民解放軍陸軍軍官學(xué)院;
【關(guān)鍵詞】: 知識(shí)發(fā)現(xiàn) 文本分類(lèi) 搜索引擎 規(guī)則挖掘
【分類(lèi)號(hào)】:TP391.1
【正文快照】: 0引言互聯(lián)網(wǎng)飛速發(fā)展,網(wǎng)絡(luò)成為了海量數(shù)據(jù)的一個(gè)載體,互聯(lián)網(wǎng)用戶可以借助Internet搜尋大量的數(shù)字化信息,這些數(shù)字化信息可以是文本、數(shù)字、圖形、圖像、地圖、聲音甚至可以是視頻。但這些信息大都是分散的、無(wú)結(jié)構(gòu)數(shù)據(jù),存在著大量無(wú)用或垃圾信息,只有小部分是有用的信息,這使
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 葉震,周兵斌;基于數(shù)據(jù)挖掘的NIDS日志分析系統(tǒng)[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年01期
2 潘正高;侯傳宇;談成訪;;基于命名實(shí)體的Web新聞文本分類(lèi)方法[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年08期
3 朱華宇,孫正興,張福炎;一個(gè)基于向量空間模型的中文文本自動(dòng)分類(lèi)系統(tǒng)[J];計(jì)算機(jī)工程;2001年02期
4 黃嘉滿;張冬茉;;基于文本的關(guān)聯(lián)規(guī)則提取方法的研究[J];計(jì)算機(jī)仿真;2008年01期
5 白曦;呂曉楓;孫吉貴;;基于加權(quán)向量空間模型的網(wǎng)絡(luò)搜索[J];計(jì)算機(jī)應(yīng)用研究;2007年02期
6 林永民;呂震宇;趙爽;朱衛(wèi)東;;向量空間模型中特征加權(quán)的研究[J];情報(bào)雜志;2008年03期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 羅長(zhǎng)壽;張峻峰;孫素芬;魏清鳳;;基于改進(jìn)VSM的農(nóng)業(yè)實(shí)用技術(shù)自動(dòng)問(wèn)答系統(tǒng)研究[J];安徽農(nóng)業(yè)科學(xué);2009年28期
2 許云,樊孝忠,張鋒;一種不需分詞的中文文本分類(lèi)方法[J];北京理工大學(xué)學(xué)報(bào);2005年09期
3 李興鵬;秦昌友;;垃圾郵件綜合過(guò)濾系統(tǒng)的研究與設(shè)計(jì)[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年19期
4 劉靜;;淺析Lucene的查詢技術(shù)[J];電腦知識(shí)與技術(shù);2012年11期
5 陳光;;優(yōu)化K-近鄰方法及其應(yīng)用[J];福建電腦;2009年02期
6 索紅光;楊濤;;基于互信息的Web文檔聚類(lèi)方法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
7 呂曹芳;侯智斌;;基于文本情報(bào)的數(shù)據(jù)挖掘[J];電腦與信息技術(shù);2012年06期
8 袁方,楊柳,張紅霞;基于k-近鄰方法的漸進(jìn)式中文文本分類(lèi)技術(shù)[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
9 李凡,林愛(ài)武,陳國(guó)社;一種基于VSM文本分類(lèi)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年03期
10 許勇,宋柔;基于HMM的百科辭典文本中句子的知識(shí)點(diǎn)分類(lèi)[J];計(jì)算機(jī)工程與應(yīng)用;2005年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 許勇;宋柔;;基于HMM的百科辭典文本中知識(shí)點(diǎn)劃分方法[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
2 胡蓉;唐常杰;陳敏敏;欒江;;關(guān)聯(lián)規(guī)則制導(dǎo)的遺傳算法在文本分類(lèi)中的應(yīng)用[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條
1 祝翠玲;基于類(lèi)別結(jié)構(gòu)的文本層次分類(lèi)方法研究[D];山東大學(xué);2011年
2 代勁;云模型在文本挖掘應(yīng)用中的關(guān)鍵問(wèn)題研究[D];重慶大學(xué);2011年
3 張友華;面向智能服務(wù)的Web內(nèi)容計(jì)算研究與應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年
4 柏宏權(quán);適應(yīng)性教學(xué)系統(tǒng)中個(gè)性化教學(xué)策略研究[D];南京師范大學(xué);2006年
5 宣照國(guó);文本挖掘算法及其在知識(shí)管理中的應(yīng)用研究[D];大連理工大學(xué);2008年
6 馬建斌;中文Web信息作者同一認(rèn)定技術(shù)研究[D];河北農(nóng)業(yè)大學(xué);2010年
7 陳圣兵;基于商空間理論的海量信息檢索模型的研究[D];安徽大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 劉偉麗;基于粒子群算法和支持向量機(jī)的中文文本分類(lèi)研究[D];河南工業(yè)大學(xué);2010年
2 張曉艷;面向農(nóng)業(yè)信息服務(wù)平臺(tái)的挖掘技術(shù)研究[D];湖南工業(yè)大學(xué);2010年
3 姜倫;模糊聚類(lèi)算法及其在中文文本聚類(lèi)中的研究與實(shí)現(xiàn)[D];哈爾濱理工大學(xué);2010年
4 鄧忠瑩;中文文本傾向性分類(lèi)系統(tǒng)研究[D];昆明理工大學(xué);2009年
5 吳惠雄;基于支持向量機(jī)與聚類(lèi)算法的中文文本分類(lèi)研究[D];中南林業(yè)科技大學(xué);2009年
6 郭凱;面向Web文本的數(shù)據(jù)清洗關(guān)鍵技術(shù)的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
7 王秀菲;基于特征加權(quán)支持向量機(jī)的復(fù)合材料粘接缺陷量化識(shí)別研究[D];內(nèi)蒙古大學(xué);2011年
8 匡巧艷;面向G2C交互平臺(tái)的Web文本挖掘模型和方法研究[D];湖南大學(xué);2009年
9 陳樂(lè);基于智能文本分類(lèi)技術(shù)的素材管理軟件的設(shè)計(jì)與開(kāi)發(fā)[D];南京師范大學(xué);2003年
10 姚松源;文本自動(dòng)分類(lèi)系統(tǒng)的研究與實(shí)現(xiàn)[D];北京工業(yè)大學(xué);2003年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 付艷;楊冬青;唐世渭;伍偉;王騰蛟;高軍;;基于實(shí)體識(shí)別的在線主題檢測(cè)方法[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年02期
2 張?bào)愕?胡學(xué)鋼;;基于向量空間模型的自動(dòng)摘要冗余處理研究[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年09期
3 陸玉昌,魯明羽,李凡,周立柱;向量空間法中單詞權(quán)重函數(shù)的分析和構(gòu)造[J];計(jì)算機(jī)研究與發(fā)展;2002年10期
4 范明,李川;在FP-樹(shù)中挖掘頻繁模式而不生成條件FP-樹(shù)[J];計(jì)算機(jī)研究與發(fā)展;2003年08期
5 尚文倩;黃厚寬;劉玉玲;林永民;瞿有利;董紅斌;;文本分類(lèi)中基于基尼指數(shù)的特征選擇算法研究[J];計(jì)算機(jī)研究與發(fā)展;2006年10期
6 劉乃麗,李玉忱,馬磊;一種有效且無(wú)冗余的快速關(guān)聯(lián)規(guī)則挖掘算法[J];計(jì)算機(jī)應(yīng)用;2005年06期
7 黃建設(shè);;一種改進(jìn)的關(guān)聯(lián)規(guī)則算法探討[J];計(jì)算機(jī)仿真;2005年12期
8 劉靜,尹存燕,陳家駿;一種規(guī)則和貝葉斯方法相結(jié)合的文本自動(dòng)分類(lèi)策略[J];計(jì)算機(jī)應(yīng)用研究;2005年07期
9 俞鴻魁;張華平;劉群;呂學(xué)強(qiáng);施水才;;基于層疊隱馬爾可夫模型的中文命名實(shí)體識(shí)別[J];通信學(xué)報(bào);2006年02期
10 潘春華,武港山;面向主題的Web信息收集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];小型微型計(jì)算機(jī)系統(tǒng);2003年12期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉苗苗;張永生;;文本分類(lèi)技術(shù)在搜索引擎中的應(yīng)用[J];中國(guó)新技術(shù)新產(chǎn)品;2010年04期
2 祝宇;夏詔杰;聶峰光;郭力;;支持向量機(jī)在化學(xué)主題爬蟲(chóng)中的應(yīng)用[J];計(jì)算機(jī)與應(yīng)用化學(xué);2006年04期
3 丁志剛;王小捷;;一種基于類(lèi)別意圖的信息檢索模型[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2009年01期
4 榮光;張化祥;;文本分類(lèi)在搜索引擎性能中的應(yīng)用[J];科技致富向?qū)?2008年24期
5 方蘭,王明文;文本自動(dòng)分類(lèi)技術(shù)及其應(yīng)用[J];計(jì)算機(jī)與現(xiàn)代化;2004年07期
6 馬玉春,宋瀚濤;基于搜索引擎的知識(shí)發(fā)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2004年30期
7 彭玉容;沈紅巖;程芳;;搜索引擎中的文本分類(lèi)方法研究[J];中國(guó)新技術(shù)新產(chǎn)品;2008年17期
8 ;中國(guó)計(jì)算機(jī)學(xué)會(huì)第九屆全國(guó)搜索引擎和網(wǎng)上信息挖掘?qū)W術(shù)研討會(huì)(SEWM2011)征文通知[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2010年10期
9 ;中國(guó)計(jì)算機(jī)學(xué)會(huì)第9屆全國(guó)搜索引擎和網(wǎng)上信息挖掘?qū)W術(shù)研討會(huì)(SEWM2011)征文通知[J];計(jì)算機(jī)研究與發(fā)展;2010年10期
10 ;中國(guó)計(jì)算機(jī)學(xué)會(huì)第九屆全國(guó)搜索引擎和網(wǎng)上信息挖掘?qū)W術(shù)研討會(huì)(SEWM2011)征文通知[J];計(jì)算機(jī)科學(xué);2010年10期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 李衛(wèi)東;楊炳儒;李龍星;曲文龍;;基于中心詞位置的VSM文本分類(lèi)算法[A];2005中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集(下)[C];2005年
2 程新榮;楊仁剛;;網(wǎng)頁(yè)自動(dòng)分類(lèi)在搜索引擎上的應(yīng)用研究[A];2007'中國(guó)儀器儀表與測(cè)控技術(shù)交流大會(huì)論文集(二)[C];2007年
3 陳克利;宗成慶;王霞;;基于大規(guī)模真實(shí)文本的平衡語(yǔ)料分析與文本分類(lèi)方法[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年
4 杜長(zhǎng)海;吉根林;;模糊聚類(lèi)的最大樹(shù)法在文本分類(lèi)中的應(yīng)用研究[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年
5 海麗且木·艾沙;維尼拉·木沙江;;Web文本分類(lèi)及其維、哈、柯多文種信息檢索中的應(yīng)用研究[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
6 胡俊;黃厚寬;;一種基于SVM的可視化文本分類(lèi)的方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
7 朱慕華;陳文亮;朱靖波;;詞聚類(lèi)在文本分類(lèi)中的應(yīng)用[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
8 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
9 賈會(huì)強(qiáng);劉曉麗;于洪志;;基于詞性特征提取的藏文文本分類(lèi)方法研究[A];CCF NCSC 2011——第二屆中國(guó)計(jì)算機(jī)學(xué)會(huì)服務(wù)計(jì)算學(xué)術(shù)會(huì)議論文集[C];2011年
10 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 劉文君;搜索引擎也在尋求創(chuàng)新[N];大眾科技報(bào);2007年
2 博文邋譯;你的隱私 搜索引擎知道[N];計(jì)算機(jī)世界;2007年
3 楊潔;搜索引擎營(yíng)銷(xiāo)市場(chǎng)生變[N];中國(guó)計(jì)算機(jī)報(bào);2007年
4 趙敏;“魚(yú)群理論”破解搜索營(yíng)銷(xiāo)謎局[N];中國(guó)企業(yè)報(bào);2007年
5 ;法國(guó)挑戰(zhàn)谷歌推出衛(wèi)星地圖搜索引擎[N];人民日?qǐng)?bào);2006年
6 MirrorCity.net技術(shù)總監(jiān) 姚浩;讓搜索引擎回歸最初夢(mèng)想[N];中國(guó)文化報(bào);2008年
7 本報(bào)記者 樊哲高;搜索引擎三國(guó)紛爭(zhēng) 中文市場(chǎng)兩軍對(duì)壘[N];中國(guó)電子報(bào);2009年
8 本報(bào)記者 操秀英;國(guó)雙科技以技術(shù)加服務(wù)贏得市場(chǎng)[N];科技日?qǐng)?bào);2009年
9 EndTo;優(yōu)化Meta討好搜索引擎[N];電腦報(bào);2009年
10 本報(bào)記者 馬文方;Yebol:從思維科學(xué)導(dǎo)出搜索引擎[N];中國(guó)計(jì)算機(jī)報(bào);2010年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王樹(shù)梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學(xué);2007年
2 楊傳耀;中文信息檢索索引模型及相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2007年
3 羅娜;基于本體的主題爬行技術(shù)研究[D];吉林大學(xué);2009年
4 張邦佐;基于正例和無(wú)標(biāo)記樣例學(xué)習(xí)研究[D];吉林大學(xué);2009年
5 章舜仲;文本分類(lèi)中詞共現(xiàn)關(guān)系的研究及其應(yīng)用[D];南京理工大學(xué);2010年
6 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
7 孟佳娜;遷移學(xué)習(xí)在文本分類(lèi)中的應(yīng)用研究[D];大連理工大學(xué);2011年
8 李群;主題搜索引擎聚類(lèi)算法的研究[D];北京林業(yè)大學(xué);2011年
9 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
10 李智星;用于文本分類(lèi)的簡(jiǎn)明語(yǔ)義分析技術(shù)研究[D];重慶大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 曾礪鋒;基于數(shù)字有機(jī)體數(shù)據(jù)庫(kù)的搜索引擎的理論研究與實(shí)現(xiàn)[D];電子科技大學(xué);2008年
2 張蕾;WEB中多媒體資料的發(fā)現(xiàn)研究[D];山東師范大學(xué);2004年
3 李凱;Web挖掘在教學(xué)資源搜索引擎中的應(yīng)用研究[D];東北師范大學(xué);2007年
4 譚龍遠(yuǎn);基于領(lǐng)域的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2009年
5 丁志剛;基于類(lèi)別意圖的信息檢索模型[D];北京郵電大學(xué);2009年
6 王偉;搜索引擎下Web分類(lèi)技術(shù)研究[D];內(nèi)蒙古科技大學(xué);2011年
7 呂靖;互聯(lián)網(wǎng)搜索詞分類(lèi)關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
8 張玉杰;基于偏斜數(shù)據(jù)集的中文文本分類(lèi)問(wèn)題的改進(jìn)特征權(quán)重算法研究[D];東北師范大學(xué);2010年
9 楊曉丹;基于Lucene的主題搜索引擎模板的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江工商大學(xué);2011年
10 江慧娜;中文搜索引擎的關(guān)鍵技術(shù)研究[D];北京化工大學(xué);2007年
,本文編號(hào):968668
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/968668.html