基于決策樹(shù)技術(shù)的個(gè)性化服務(wù)Agent
本文選題:搜索引擎 + 個(gè)性化服務(wù); 參考:《微電子學(xué)與計(jì)算機(jī)》2006年03期
【摘要】:文章采用了機(jī)器學(xué)習(xí)技術(shù),從提交更精確地反映用戶興趣的檢索串入手,研究如何提高搜索引擎查準(zhǔn)率。文中采用決策樹(shù)方法進(jìn)行學(xué)習(xí),對(duì)決策樹(shù)方法應(yīng)用于網(wǎng)頁(yè)檢索中出現(xiàn)的幾個(gè)問(wèn)題:缺少屬性值的訓(xùn)練實(shí)例處理問(wèn)題;如何使不同權(quán)值的屬性,具有不同的表現(xiàn)力問(wèn)題;樹(shù)的重建問(wèn)題;過(guò)度擬合問(wèn)題;擴(kuò)充檢索串返回的網(wǎng)頁(yè)時(shí),屬性值的取舍問(wèn)題等進(jìn)行了分析和研究,給出了具體的解決方法。性能提高后的決策樹(shù),用驗(yàn)證集檢驗(yàn),正確率由70%提高到75.4%,較好地學(xué)習(xí)到了用戶的興趣。
[Abstract]:This paper uses machine learning technology to study how to improve the precision of search engine by submitting a more accurate retrieval string that reflects the user's interest. In this paper, the decision tree method is used to study several problems that appear in the application of decision tree method in web search: how to deal with the problem of lack of attribute value training example, how to make the attribute of different weight value have different expressive power, and how to make the attribute of different weight value have different expressive power. Tree reconstruction problem, over-fitting problem, extended search string return page, attribute value selection problem are analyzed and studied, and specific solutions are given. The accuracy of the improved decision tree is improved from 70% to 75.4%, and the user's interest is well studied.
【作者單位】: 廣東工業(yè)大學(xué)自動(dòng)化學(xué)院 廣東工業(yè)大學(xué)自動(dòng)化學(xué)院
【基金】:廣東省自然科學(xué)基金資助(970237)
【分類號(hào)】:TP18
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 陳紅英,楊宜民,毛革非;基于Agent的用戶興趣學(xué)習(xí)算法及其實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2004年06期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 姚克娟,李晉宏;應(yīng)用Agent技術(shù)實(shí)現(xiàn)個(gè)性化信息服務(wù)[J];北方工業(yè)大學(xué)學(xué)報(bào);2004年03期
2 鐘茂生;廖輝傳;謝勇;;面向用戶興趣的Web信息過(guò)濾系統(tǒng)[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年04期
3 周生明;廖元秀;;Cost-Sensitive學(xué)習(xí)的一個(gè)新課題[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年04期
4 廖元秀;周生明;;誤差在Cost-Sensitive分類中的應(yīng)用[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年02期
5 ;Information entropy for ordinal classification[J];Science China(Information Sciences);2010年06期
6 龍舜;鐘衍凡;蔡建華;王會(huì)進(jìn);;ABLE中的決策樹(shù)算法的模糊因子改進(jìn)方法[J];暨南大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年01期
7 劉星毅;;基于性價(jià)比的分裂屬性選擇方法[J];計(jì)算機(jī)應(yīng)用;2009年03期
8 武永成;;一種新的代價(jià)敏感分類方法[J];計(jì)算機(jī)與現(xiàn)代化;2009年03期
9 John Durkin,蔡競(jìng)峰,蔡自興;決策樹(shù)技術(shù)及其當(dāng)前研究方向[J];控制工程;2005年01期
10 袁鼎榮;張師超;朱曉峰;張晨;;基于相對(duì)等待時(shí)間的代價(jià)敏感決策樹(shù)[J];計(jì)算機(jī)科學(xué)與探索;2007年03期
相關(guān)會(huì)議論文 前3條
1 陸晨;彭怡;李友元;寇綱;;基于分類與TOPSIS方法預(yù)測(cè)公司審計(jì)變更[A];經(jīng)濟(jì)全球化與系統(tǒng)工程——中國(guó)系統(tǒng)工程學(xué)會(huì)第16屆學(xué)術(shù)年會(huì)論文集[C];2010年
2 韓松來(lái);張輝;周華平;;決策樹(shù)算法中多值偏向問(wèn)題的理論分析[A];全國(guó)自動(dòng)化新技術(shù)學(xué)術(shù)交流會(huì)會(huì)議論文集(一)[C];2005年
3 頓毅杰;張小峰;張永;;基于不可分辨關(guān)系的分類規(guī)則算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
相關(guān)博士學(xué)位論文 前10條
1 黃靜華;支持向量機(jī)算法研究及在氣象數(shù)據(jù)挖掘中的應(yīng)用[D];中國(guó)礦業(yè)大學(xué)(北京);2011年
2 陳曉林;基于動(dòng)態(tài)代價(jià)敏感的機(jī)器學(xué)習(xí)研究[D];華中科技大學(xué);2010年
3 嚴(yán)志永;在劃分?jǐn)?shù)據(jù)空間的視角下基于決策邊界的分類器研究[D];浙江大學(xué);2011年
4 邵華;基于決策樹(shù)的海量時(shí)序不均衡數(shù)據(jù)下預(yù)測(cè)系統(tǒng)的研究[D];東北大學(xué);2005年
5 牛曉太;多模式智能談判支持系統(tǒng)的理論與方法研究[D];武漢大學(xué);2004年
6 鄭恩輝;基于支持向量機(jī)的代價(jià)敏感數(shù)據(jù)挖掘研究與應(yīng)用[D];浙江大學(xué);2006年
7 王曙燕;醫(yī)學(xué)圖像智能分類算法研究[D];西北大學(xué);2006年
8 王慶;RH-KTB真空系統(tǒng)智能故障診斷[D];東北大學(xué);2004年
9 王中;數(shù)據(jù)挖掘技術(shù)及其在證券領(lǐng)域的應(yīng)用[D];天津大學(xué);2005年
10 趙立權(quán);粒度計(jì)算的模型研究[D];安徽大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 周翔;決策支持技術(shù)在企業(yè)銷售系統(tǒng)中的應(yīng)用研究[D];中國(guó)海洋大學(xué);2010年
2 牛為秋;基于粗糙集的決策樹(shù)分類算法[D];西安電子科技大學(xué);2010年
3 王佳杰;基于信息熵的決策樹(shù)算法研究及在肺病住院費(fèi)用分析中的應(yīng)用[D];長(zhǎng)春理工大學(xué);2011年
4 俞安琪;仿真數(shù)據(jù)并行分布式挖掘算法研究[D];哈爾濱工業(yè)大學(xué);2011年
5 王鵬;數(shù)據(jù)挖掘在高校困難生認(rèn)定中的應(yīng)用研究[D];東北師范大學(xué);2011年
6 邵坤;Web數(shù)據(jù)庫(kù)查詢結(jié)果個(gè)性化分類方法研究[D];東北大學(xué);2009年
7 楊宏偉;基于層次分解思想的決策樹(shù)[D];河北大學(xué);2003年
8 趙明華;模糊決策樹(shù)產(chǎn)生過(guò)程中參數(shù)的敏感性分析[D];河北大學(xué);2003年
9 吳宣為;示例學(xué)習(xí)的決策樹(shù)算法研究[D];合肥工業(yè)大學(xué);2004年
10 尤眾喜;無(wú)邊界學(xué)習(xí)及其支持和引導(dǎo)研究[D];華東師范大學(xué);2005年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 陳紅英,李衛(wèi)華;智能信息Agent的研究和實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2002年12期
2 陳紅英,李衛(wèi)華,毛革非;智能過(guò)濾Agent在Internet上的應(yīng)用[J];計(jì)算機(jī)工程;2002年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王萍;劉軍;姚笑秋;;基于小型搜索引擎的個(gè)性化策略研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年11期
2 黃X;林旭云;;基于個(gè)性化信息服務(wù)技術(shù)的研究[J];大眾科技;2006年02期
3 楊錦;;個(gè)性化搜索引擎應(yīng)用于數(shù)字圖書(shū)館信息服務(wù)系統(tǒng)[J];平原大學(xué)學(xué)報(bào);2007年06期
4 付曉翠;許盈;;基于Web數(shù)據(jù)挖掘的個(gè)性化搜索引擎研究綜述[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年03期
5 宋國(guó)柱;陳俊杰;;基于Agent的個(gè)性化搜索引擎關(guān)鍵技術(shù)研究[J];山西農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期
6 鄒芳紅;;Web數(shù)據(jù)挖掘與個(gè)性化搜索引擎綜述[J];計(jì)算機(jī)與現(xiàn)代化;2007年08期
7 許旌瑩;;決策樹(shù)算法在圖書(shū)館個(gè)性化服務(wù)中的應(yīng)用研究[J];科技信息;2011年14期
8 傅曉嵐;;基于Agent個(gè)性化智能檢索技術(shù)[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2008年11期
9 許東民;任宇;王以伍;;基于個(gè)性化服務(wù)的醫(yī)學(xué)數(shù)字圖書(shū)館的研究與設(shè)計(jì)[J];成都醫(yī)學(xué)院學(xué)報(bào);2007年02期
10 丁兆貴;金敏;;基于Lucene的個(gè)性化搜索引擎研究與實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年02期
相關(guān)會(huì)議論文 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國(guó)中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
3 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
4 維尼拉·木沙江;吐?tīng)柡椤の崴韭?;維、哈、柯文搜索引擎中網(wǎng)頁(yè)爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 ;《長(zhǎng)城》個(gè)性化服務(wù)專用郵票發(fā)行 全國(guó)青少年“紀(jì)念中國(guó)人民抗日戰(zhàn)爭(zhēng)暨世界反法西斯戰(zhàn)爭(zhēng)勝利六十周年知識(shí)競(jìng)答活動(dòng)”同時(shí)啟動(dòng)[A];萬(wàn)里長(zhǎng)城暨中國(guó)長(zhǎng)城學(xué)會(huì)優(yōu)秀文集[C];2005年
6 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
7 姚樹(shù)宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
8 倪俊峰;;基于黃頁(yè)搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
9 張望;王輝;;個(gè)性化服務(wù)中的并行K-Means聚類算法[A];2007年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2007年
10 劉建西;;公共圖書(shū)館個(gè)性化服務(wù)創(chuàng)新的幾點(diǎn)思考[A];福建省圖書(shū)館學(xué)會(huì)2007年學(xué)術(shù)年會(huì)論文集[C];2007年
相關(guān)重要報(bào)紙文章 前10條
1 賽迪顧問(wèn)股份有限公司 互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰 ;Google微軟中國(guó)搜索市場(chǎng)遇阻擊[N];中國(guó)計(jì)算機(jī)報(bào);2006年
2 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
3 周文林;搜狗3.0能否撼動(dòng)搜索市場(chǎng)[N];經(jīng)濟(jì)參考報(bào);2007年
4 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日?qǐng)?bào);2005年
5 賽迪顧問(wèn)股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,,還是門(mén)戶[N];中國(guó)計(jì)算機(jī)報(bào);2005年
6 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
7 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國(guó)經(jīng)營(yíng)報(bào);2005年
8 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
9 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國(guó)證券報(bào);2006年
10 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
9 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
10 張智雄;Internet科技信息資源門(mén)戶網(wǎng)站(STIP)系統(tǒng)的實(shí)踐研究[D];中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心;2000年
相關(guān)碩士學(xué)位論文 前10條
1 史錦榮;基于多Agent智能搜索引擎模型研究[D];太原理工大學(xué);2005年
2 李明浩;基于搜索引擎和數(shù)據(jù)挖掘的個(gè)性化web信息服務(wù)[D];吉林大學(xué);2008年
3 張園園;基于用戶興趣的個(gè)性化搜索引擎的分析與研究[D];燕山大學(xué);2006年
4 王海騰;基于多Agent的搜索引擎優(yōu)化研究[D];哈爾濱工業(yè)大學(xué);2007年
5 楊光偉;基于Lucene的個(gè)性化搜索引擎的研究與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2009年
6 李連江;個(gè)性化搜索引擎模型的研究與改進(jìn)[D];哈爾濱工程大學(xué);2008年
7 馮周;基于模糊信息處理的個(gè)性化文件搜索引擎算法研究與實(shí)現(xiàn)[D];電子科技大學(xué);2007年
8 楊獻(xiàn)峰;搜索引擎?zhèn)性化檢索技術(shù)的研究[D];中國(guó)石油大學(xué);2007年
9 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
10 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
本文編號(hào):1927304
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1927304.html