農業(yè)科技信息個性化服務推送模型研究
本文選題:信息抽取 + 用戶興趣模型; 參考:《計算機應用與軟件》2013年06期
【摘要】:針對農業(yè)科技信息共享率低、分散分布等問題,應用Web信息抽取方法實現自動采集多源農業(yè)科技信息入庫,采用XML文件實現失敗重試機制。通過對日志文件進行處理,采用改進的k-means聚類方法建立用戶訪問模式,并得到訪問模式的網頁特征詞及權重的集合,構建用戶興趣模型庫,為來訪會話推送網頁。在實際應用中,定時更新用戶模型庫,從而保證了站點內容的及時性、推送服務的可靠性、可用性。
[Abstract]:Aiming at the problems of low sharing rate and dispersed distribution of agricultural science and technology information, Web information extraction method is used to automatically collect agricultural science and technology information from many sources into database, and XML file is adopted to realize failure retry mechanism. By processing the log file, the improved k-means clustering method is used to establish the user access pattern, and the set of page feature words and weights of the access pattern is obtained, and the user interest model library is constructed to push the web page for the visiting session. In the practical application, the user model base is updated periodically to ensure the timeliness of the site content, the reliability and availability of the push service.
【作者單位】: 西北農林科技大學信息工程學院;
【基金】:國家科技支撐計劃項目(012BAH30F00) 十二五科技支撐項目(2011BAD21D21B05)
【分類號】:TP393.09
【參考文獻】
相關期刊論文 前9條
1 陳晨;田鳳珍;王克儉;;基于農業(yè)知識的網上專業(yè)書店的個性化服務[J];安徽農業(yè)科學;2011年14期
2 岳廣飛;何明祥;;關于我國農業(yè)個性化信息服務體系的構想[J];農業(yè)網絡信息;2009年03期
3 周立柱,林玲;聚焦爬蟲技術研究綜述[J];計算機應用;2005年09期
4 李春;朱珍民;葉劍;周佳穎;;個性化服務研究綜述[J];計算機應用研究;2009年11期
5 焦慶爭;蔚承建;;一種可靠信任推薦文本分類特征權重算法[J];計算機應用研究;2010年02期
6 劉軍;張凈;;基于DOM的網頁主題信息的抽取[J];計算機應用與軟件;2010年05期
7 孫吉貴;劉杰;趙連宇;;聚類算法研究[J];軟件學報;2008年01期
8 陳媛;茍光磊;;個性化服務用戶模型研究[J];計算機工程與設計;2008年09期
9 朱晉華;陳俊杰;;Web日志預處理中會話識別的優(yōu)化[J];太原理工大學學報;2008年02期
相關碩士學位論文 前2條
1 胡宜敏;農業(yè)搜索個性化平臺的研究與設計[D];中國科學技術大學;2009年
2 岳中原;詞典與統(tǒng)計相結合的中文分詞的研究[D];武漢理工大學;2010年
【共引文獻】
相關期刊論文 前10條
1 孫素芬;羅長壽;張峻峰;于峰;張樹亮;;農業(yè)信息資源整合系統(tǒng)研究與應用[J];安徽農業(yè)科學;2007年22期
2 汪斌;張云偉;劉健;陳晶;;一種面向農業(yè)信息主題網絡爬蟲的設計[J];安徽農業(yè)科學;2009年20期
3 李廣水;宋丁全;;數據分析在森林資源調查中的應用及發(fā)展研究[J];安徽農業(yè)科學;2009年22期
4 廉捷;劉云;;網絡輿情中的信息預處理與自動摘要算法[J];北京交通大學學報;2010年05期
5 左國才;周榮華;符開耀;;基于DBSCAN算法的電信客戶分類的應用研究[J];北京聯合大學學報(自然科學版);2012年03期
6 李曉方;武仲科;樊亞春;周明全;柳勇光;;一種新的用于三維檢索的快速鄰域搜索方法[J];北京師范大學學報(自然科學版);2011年05期
7 章林柯;崔立林;;潛艇機械噪聲源分類識別的小樣本研究思想及相關算法評述[J];船舶力學;2011年08期
8 孫英娟;楊柳;何昆鳥;;屬性離散化算法研究[J];長春師范學院學報(人文社會科學版);2009年12期
9 任斌;毛應爽;;基于本體的主動學習主題爬行的研究與實現[J];長春工程學院學報(自然科學版);2011年01期
10 陳慶枝;陳國龍;郭文忠;陳仕濤;;信息安全評估日志數據的一種混合聚類算法[J];重慶工學院學報(自然科學版);2009年10期
相關會議論文 前10條
1 曾成;趙錫均;徐紅;;基于量子遺傳算法的聚類方法[A];第二十九屆中國控制會議論文集[C];2010年
2 ;A Fuzzy Neural Network System Modeling Method Based on Data-driven[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
3 劉保政;汪定偉;;基于多因素的相近距離聚類方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
4 張立濤;張宇峰;;基于聚類分析的大型橋梁結構健康監(jiān)測數據異常識別研究[A];第21屆全國結構工程學術會議論文集第Ⅱ冊[C];2012年
5 王棟;陳勇;徐建良;;基于預測的BitTorrent種子評估方法[A];2008'中國信息技術與應用學術論壇論文集(二)[C];2008年
6 劉兵;胡學鋼;;基于多鏈接分析的主題爬蟲設計實現[A];全國第20屆計算機技術與應用學術會議(CACIS·2009)暨全國第1屆安全關鍵技術與應用學術會議論文集(上冊)[C];2009年
7 吳繼兵;李心科;;基于分治融合的混合屬性數據聚類算法研究[A];全國第20屆計算機技術與應用學術會議(CACIS·2009)暨全國第1屆安全關鍵技術與應用學術會議論文集(下冊)[C];2009年
8 戴玉剛;;藏文網頁采集技術研究[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年
9 余燦玲;王麗珍;張元武;;基于網格密度方向的聚類簇邊緣精度加強算法[A];第26屆中國數據庫學術會議論文集(A輯)[C];2009年
10 劉尊洋;汪作來;王自榮;余大斌;孫曉泉;;基于譜系法改進FCM的仿造迷彩主色提取方法[A];第九屆全國光電技術學術交流會論文集(上冊)[C];2010年
相關博士學位論文 前10條
1 徐森;文本聚類集成關鍵技術研究[D];哈爾濱工程大學;2010年
2 于翔;基于網格的數據流聚類方法研究[D];哈爾濱工程大學;2010年
3 徐紅波;基于空間填充曲線高維空間查詢算法研究[D];哈爾濱理工大學;2010年
4 吳羽;面向時間敏感對象的垂直搜索引擎關鍵技術研究[D];浙江大學;2011年
5 鄧斌;B2C在線評論中的客戶知識管理研究[D];電子科技大學;2010年
6 尹可挺;Internet環(huán)境中基于QoS的Web服務組合研究[D];浙江大學;2010年
7 皋軍;智能識別中的降維新方法及其應用研究[D];江南大學;2010年
8 蘇曉珂;基于聚類的異常挖掘算法研究[D];東華大學;2010年
9 卓瑩;基于拓撲·流量挖掘的網絡態(tài)勢感知技術研究[D];國防科學技術大學;2010年
10 陳彬;面向DEVS的多范式建模與仿真關鍵技術研究與實現[D];國防科學技術大學;2010年
相關碩士學位論文 前10條
1 呂芳芳;基于查詢擴展的垂直搜索研究[D];山東科技大學;2010年
2 劉文昊;基于模糊聚類和紋版輔助的織物疵點檢測算法研究[D];浙江理工大學;2010年
3 李振;網絡輿情預測關鍵技術研究[D];鄭州大學;2010年
4 翁巖青;網頁抓取策略研究[D];哈爾濱工程大學;2010年
5 丁金鳳;基于網格與密度的數據流聚類算法研究[D];哈爾濱工程大學;2010年
6 蔡宇虹;基于主題的元搜索引擎關鍵技術研究[D];哈爾濱工程大學;2010年
7 劉萍;軟件體系結構恢復的研究與實現[D];大連理工大學;2010年
8 姜榮;時間序列的聚類和關聯規(guī)則挖掘研究[D];遼寧師范大學;2010年
9 李丹丹;基于權重設計的聚類融合算法研究及應用[D];遼寧工程技術大學;2009年
10 劉瓊;基于群體智能的聚類算法研究[D];長沙理工大學;2010年
【二級參考文獻】
相關期刊論文 前10條
1 阮懷軍,鄭宏偉;美國的農業(yè)信息服務體系[J];山東農業(yè)科學;2001年02期
2 遲秀全;;手機短信平臺與推進我國農業(yè)信息化的探討[J];安徽農業(yè)科學;2006年18期
3 廖亞莉,王錫鋼,戰(zhàn)學剛;電子商務的個性化服務[J];鞍山科技大學學報;2004年03期
4 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學學報(自然科學版);2002年05期
5 宋麗哲,牛振東,宋瀚濤,余正濤,師雪霖;數字圖書館個性化服務用戶模型研究[J];北京理工大學學報;2005年01期
6 郭影帆,林紅斌;我國農業(yè)信息資源管理探析[J];商業(yè)研究;2004年15期
7 高紅;黃德根;楊元生;;漢語自動分詞中中文地名識別[J];大連理工大學學報;2006年04期
8 余戰(zhàn)秋;中文分詞技術及其應用初探[J];電腦知識與技術;2004年32期
9 曾文;鄢軍霞;;城市GIS地名定位工具的設計及應用[J];地球科學;2006年05期
10 ;下一代智能搜索技術[J];新電腦;2006年05期
【相似文獻】
相關期刊論文 前10條
1 藍永健;;基于Lucene的校園網垂直搜索引擎的設計與實現[J];廣東教育學院學報;2009年03期
2 余淼;楊丹;趙俊芹;;垂直搜索引擎的關鍵技術研究[J];軟件導刊;2007年23期
3 張敏;;中文垂直搜索引擎研究與實現[J];福建電腦;2010年06期
4 馬續(xù)補;郭菊娥;;基于GATE的任務信息抽取研究[J];情報雜志;2010年01期
5 郭力軍;;RSS個性化信息服務的用戶興趣模型實現與應用[J];計算機與現代化;2010年08期
6 劉建培;;基于Delphi的中文分詞設計[J];計算機系統(tǒng)應用;2009年03期
7 王正;陸余良;劉金紅;施凡;;基于Lucene的互聯網文獻信息檢索系統(tǒng)的研究[J];安徽大學學報(自然科學版);2009年05期
8 葛冬梅;;基于內容的個性化、自適應的HTML頁面轉換[J];黑龍江工程學院學報(自然科學版);2009年03期
9 鄭如濱;撒力;謝婷;;基于Heritrix與Lucene的垂直搜索引擎研究[J];電腦知識與技術;2008年29期
10 王利鑫;耿煥同;孫凱;張茜;;基于自然語言處理的文本泄密自動檢測技術[J];計算機工程與設計;2011年08期
相關會議論文 前10條
1 王敏;葉寬余;薛峰;;一種面向網店商品搜索的中文分詞系統(tǒng)設計[A];全國第22屆計算機技術與應用學術會議(CACIS·2011)暨全國第3屆安全關鍵技術與應用(SCA·2011)學術會議論文摘要集[C];2011年
2 徐志明;宋毅;馮子威;李生;;一種基于分類的用戶興趣模型[A];第六屆全國信息檢索學術會議論文集[C];2010年
3 韓冬煦;常寶寶;;基于邊界熵和卡方統(tǒng)計量的多領域適應性中文分詞方法[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
4 修馳;宋柔;;基于“大詞”實例的中文分詞研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
5 張梅山;鄧知龍;車萬翔;劉挺;;統(tǒng)計與詞典相結合的領域自適應中文分詞[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
6 崔欣辰;曲寧;陳青華;;隱馬爾可夫模型在Web信息抽取中的幾點改進[A];全國第4屆信號和智能信息處理與應用學術會議論文集[C];2010年
7 孟紅;鐘華;;基于htmlparser的搜索引擎信息抽取系統(tǒng)設計與實現[A];第六屆全國信息檢索學術會議論文集[C];2010年
8 郭宏蕾;郭志立;;基于模型組合訓練機制的特定領域名詞性實體識別[A];全國第八屆計算語言學聯合學術會議(JSCL-2005)論文集[C];2005年
9 李紀華;夏薇;;基于XML的web信息提取方法研究[A];全國高校社科信息資料研究會第六次會員代表大會暨第13次學術研討會論文集[C];2010年
10 ;中國中文信息學會交流材料[A];2011年網絡學術交流研討會交流材料[C];2011年
相關重要報紙文章 前10條
1 史小敏;前景廣闊的信息抽取技術[N];解放軍報;2004年
2 彭芳;搜索也專業(yè)[N];中國計算機報;2004年
3 清華大學IT可用性實驗室;2005中文搜索引擎質量對比[N];計算機世界;2005年
4 本報記者 張彤;讓計算機說中國話[N];網絡世界;2004年
5 記者 李霆鈞;國內首個“影視劇植入廣告分析系統(tǒng)”出爐[N];中國電影報;2010年
6 本報記者 王翌;8848:優(yōu)化EC流程[N];計算機世界;2004年
7 記者 吳苡婷;用技術挖出網絡信息中“金子”[N];上海科技報;2009年
8 賀俊;匯聚億萬草根智慧 奇虎發(fā)布經驗搜索[N];證券日報;2006年
9 記者 楊朝暉;醫(yī)藥搜索:不再“眾里尋他千百度”[N];科技日報;2007年
10 中國科學院計算技術研究所 王 斌;內容為王[N];計算機世界;2004年
相關博士學位論文 前10條
1 劉亞清;開放式環(huán)境中的本體演化及其在信息抽取的應用研究[D];大連海事大學;2011年
2 孫道軍;文本挖掘預處理相關基礎技術分析與應用研究[D];北京郵電大學;2008年
3 劉娜;文本自動摘要和信息抽取方法及其應用研究[D];大連海事大學;2012年
4 孫越恒;基于統(tǒng)計的NLP技術在中文信息檢索中的應用研究[D];天津大學;2005年
5 陸銘;WEB2.0網絡熱點發(fā)現與個性化檢索研究[D];中國科學技術大學;2012年
6 李傳席;基于本體的自適應Web信息抽取方法研究[D];中國科學技術大學;2012年
7 牟冬梅;數字圖書館知識組織語義互聯策略及其應用研究[D];吉林大學;2009年
8 張京楣;基于統(tǒng)計方法的文本風格分析研究[D];山東大學;2012年
9 劉向威;NLP技術在中文信息檢索中的應用研究[D];天津大學;2005年
10 張奇;信息抽取中實體關系識別研究[D];中國科學技術大學;2010年
相關碩士學位論文 前10條
1 金璐鈺;基于框架的事件抽取關鍵技術研究[D];蘇州大學;2010年
2 楊柱;基于DIV標簽樹的網頁主題信息抽取方法[D];湖南大學;2010年
3 田紅;表格信息抽取引擎的設計與實現[D];西北師范大學;2004年
4 全海金;基于用戶行為及語義相關實時更新的用戶興趣模型[D];西南師范大學;2005年
5 楊文柱;基于領域知識和信息抽取的個性化Web查詢系統(tǒng)[D];河北大學;2002年
6 張志強;Web信息抽取技術研究與基于Web service的實現[D];河北大學;2004年
7 陳蘭;基于ontology的信息抽取系統(tǒng)的研究與實現[D];電子科技大學;2004年
8 孟令謙;基于ontology的中文信息抽取系統(tǒng)的研究與實現[D];電子科技大學;2004年
9 王花;Web信息抽取技術研究[D];西北農林科技大學;2010年
10 楊秀麗;基于網頁內容分析的Web信息抽取技術及其應用[D];河北科技大學;2010年
,本文編號:1806682
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1806682.html