混合多層分類和樸素貝葉斯模型的垂直搜索引擎分類器設(shè)計
[Abstract]:This paper studies the distribution characteristics of computer education resources on Web, integrates topic words and document forms, and designs multi-layer classifiers to complete the correct classification in the process of topic search. Then the naive Bayesian model is used to classify the subject resource information automatically, and the physical storage of the resource is completed. In the experiment, the average correct rate of topic classification is about 78%, the average recall rate of topic is about 61%, and the average correct rate of resource analysis is about 81.5%. The test results can verify the feasibility of the design idea in this paper.
【作者單位】: 華東交通大學(xué)軟件學(xué)院;
【基金】:教育部人文社會科學(xué)研究規(guī)劃項目“基于模式識別的金融時間序列挖掘技術(shù)研究”(項目編號:09YJA630036) 華東交通大學(xué)校立科研基金項目“基于SOA架構(gòu)的垂直搜索引擎的研究與實現(xiàn)”(項目編號:08XX05)的研究成果之一
【分類號】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李方;劉瓊蓀;;基于改進(jìn)屬性加權(quán)的樸素貝葉斯分類模型[J];計算機工程與應(yīng)用;2010年04期
2 唐中軍;聶珍;;高校圖書館重點學(xué)科垂直搜索引擎初探[J];科技情報開發(fā)與經(jīng)濟(jì);2010年01期
3 張美芳;張迎春;;淺議垂直搜索引擎服務(wù)市場的商業(yè)模式[J];現(xiàn)代商業(yè);2010年06期
4 張敏;;基于本體的垂直搜索引擎的研究[J];軟件導(dǎo)刊;2010年02期
5 王文鈞;李巍;;垂直搜索引擎的現(xiàn)狀與發(fā)展探究[J];情報科學(xué);2010年03期
6 王琦;張戈;何婧;;基于Lucene與Heritrix的圖書垂直搜索引擎的研究與實現(xiàn)[J];計算機時代;2010年02期
7 祝奕;;垂直搜索引擎的構(gòu)建與應(yīng)用[J];信息與電腦(理論版);2010年01期
8 蘭富軍;李春霆;高海忠;;農(nóng)業(yè)主題垂直搜索引擎過濾技術(shù)研究[J];安徽農(nóng)業(yè)科學(xué);2010年09期
9 孫鐵利;趙雋;楊鳳芹;吳迪;;一種基于相對特征的文本分類算法[J];東北師大學(xué)報(自然科學(xué)版);2010年01期
10 林國;;基于樸素貝葉斯的農(nóng)業(yè)土地適宜性評價算法設(shè)計[J];杭州師范大學(xué)學(xué)報(自然科學(xué)版);2010年02期
相關(guān)會議論文 前10條
1 李毅;顧健;顧鐵軍;;基于樸素貝葉斯方法的郵件樣本預(yù)篩選[A];全國計算機安全學(xué)術(shù)交流會論文集·第二十五卷[C];2010年
2 袁繼來;林建入;柯曾勇;;巖爆可能性估計的貝葉斯網(wǎng)絡(luò)方法[A];Proceedings of 2010 The 3rd International Conference on Computational Intelligence and Industrial Application(Volume 6)[C];2010年
3 韓增新;顏雪松;姜韜;;一種改進(jìn)的樸素貝葉斯文本分類器研究[A];Proceedings of 2010 The 3rd International Conference on Computational Intelligence and Industrial Application(Volume 6)[C];2010年
4 司學(xué)峰;蔣國瑞;李英毅;;基于數(shù)據(jù)挖掘技術(shù)的客戶流失預(yù)測研究綜述[A];第三屆中國智能計算大會論文集[C];2009年
5 王占一;徐蔚然;劉東鑫;郭軍;;一種基于兩級分類器的垃圾短信過濾方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
6 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計與實現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
7 許震;沙朝鋒;王曉玲;周傲英;;LiPU:一種基于KL距離的主動分類算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
8 黃文良;李石堅;劉菊新;徐從富;;大規(guī)模垃圾短信實時過濾系統(tǒng)的設(shè)計與實現(xiàn)[A];中國通信學(xué)會第五屆學(xué)術(shù)年會論文集[C];2008年
9 富羽鵬;張敏;馬少平;;通過郵件分析進(jìn)行專家查找[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
10 蘇綏;林鴻飛;葉正;;基于字符語言模型的垃圾郵件過濾[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
相關(guān)重要報紙文章 前10條
1 本報記者 陳煒;生意寶瞄準(zhǔn)大宗商品交易市場[N];國際商報;2011年
2 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報研究所 周峻松;用開源軟件建垂直搜索引擎[N];計算機世界;2010年
3 記者李淼;盛大全面布局電子書產(chǎn)業(yè)[N];中國新聞出版報;2010年
4 記者李淼;盛大全面布局電子書產(chǎn)業(yè)[N];中國新聞出版報;2010年
5 記者李淼;盛大全面布局電子書產(chǎn)業(yè)[N];中國新聞出版報;2010年
6 記者李淼;盛大全面布局電子書產(chǎn)業(yè)[N];中國新聞出版報;2010年
7 記者李淼;盛大全面布局電子書產(chǎn)業(yè)[N];中國新聞出版報;2010年
8 記者李淼;盛大全面布局電子書產(chǎn)業(yè)[N];中國新聞出版報;2010年
9 記者李淼;盛大全面布局電子書產(chǎn)業(yè)[N];中國新聞出版報;2010年
10 記者李淼;盛大全面布局電子書產(chǎn)業(yè)[N];中國新聞出版報;2010年
相關(guān)博士學(xué)位論文 前10條
1 吳羽;面向時間敏感對象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
2 章舜仲;文本分類中詞共現(xiàn)關(guān)系的研究及其應(yīng)用[D];南京理工大學(xué);2010年
3 蔣慶華;基于生物網(wǎng)絡(luò)的疾病microRNA挖掘技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
4 蔣慶華;基于生物網(wǎng)絡(luò)的疾病microRNA挖掘技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
5 郝立麗;漢語文本數(shù)據(jù)挖掘[D];吉林大學(xué);2009年
6 蔣良孝;樸素貝葉斯分類器及其改進(jìn)算法研究[D];中國地質(zhì)大學(xué);2009年
7 惠孛;基于即時分類的垃圾郵件過濾關(guān)鍵技術(shù)的研究[D];電子科技大學(xué);2009年
8 舒泓;電能質(zhì)量擾動檢測和分類問題的研究[D];北京交通大學(xué);2009年
9 關(guān)菁華;基于貝葉斯網(wǎng)數(shù)據(jù)挖掘若干問題研究[D];吉林大學(xué);2009年
10 王美珍;垃圾郵件行為模式識別與過濾方法研究[D];華中科技大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 唐業(yè)yN;基于輕量級J2EE的證券數(shù)據(jù)分析系統(tǒng)研究與設(shè)計[D];浙江大學(xué);2011年
2 王海波;垃圾短信的屏蔽機制與應(yīng)用研究[D];東華大學(xué);2011年
3 李彬;基于NetFPGA的網(wǎng)絡(luò)流量分類[D];電子科技大學(xué);2011年
4 路慧;基于模式識別算法的網(wǎng)絡(luò)入侵檢測系統(tǒng)研究[D];華東師范大學(xué);2010年
5 梅君;中文文本分類的研究與應(yīng)用[D];南昌大學(xué);2010年
6 李春燕;企業(yè)信息垂直搜索引擎的研究與實現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2010年
7 李亮;基于Lucene和Heritrix的職位垂直搜索引擎的設(shè)計與實現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2010年
8 石占偉;垃圾頁面檢測及其在垂直搜索引擎中的應(yīng)用[D];燕山大學(xué);2010年
9 許厚金;垂直搜索引擎及其關(guān)鍵方法研究[D];燕山大學(xué);2010年
10 王金棟;元搜索引擎調(diào)度策略及結(jié)果排序算法的研究[D];燕山大學(xué);2010年
,本文編號:2436236
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2436236.html