基于維吾爾文的聚焦策略爬蟲技術研究
本文關鍵詞:基于維吾爾文的聚焦策略爬蟲技術研究
更多相關文章: 網(wǎng)絡爬蟲 維吾爾文聚焦策略 維吾爾文搜索引擎
【摘要】:隨著網(wǎng)絡資源的不斷豐富,人們獲取信息的途徑已被網(wǎng)絡代替。維吾爾文,在語言信息處理,WEB應用等領域有了迅速的發(fā)展。文章針對網(wǎng)絡爬蟲的工作原理以及聚焦爬蟲策略進行闡述,在此基礎上結合維吾爾語信息提取的相關研究,研究了維吾爾文的網(wǎng)絡爬蟲技術的結構和策略,從而為維吾爾文搜索引擎的網(wǎng)頁數(shù)據(jù)庫建設和維吾爾文網(wǎng)絡輿情分析研究提供海量的語料。
【作者單位】: 新疆師范大學信息管理中心;
【關鍵詞】: 網(wǎng)絡爬蟲 維吾爾文聚焦策略 維吾爾文搜索引擎
【分類號】:TP393.092;TP391.3
【正文快照】: 維吾爾語不僅是廣大維吾爾群眾相互交流的語言,也是傳承著現(xiàn)代維吾爾族文化的有效載體。加強維吾爾語信息化建設,尤其是維吾爾語在計算機信息處理方面的研究,對于提升新疆和其他地區(qū)的文化交流,促進少數(shù)民族地區(qū)科技教育事業(yè)的蓬勃發(fā)展,以及加快少數(shù)民族語言文字的信息化建設
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 王巖;;搜索引擎中網(wǎng)絡爬蟲技術的發(fā)展[J];電信快報;2008年10期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱華;淺談網(wǎng)絡信息資源采集技術[J];國家圖書館學刊;2004年02期
2 葛宇;梁靜;陳曉敏;;搜索引擎系統(tǒng)中熱點問題的探討[J];成都電子機械高等?茖W校學報;2009年04期
3 王春梅;;基于Bloom Filter的網(wǎng)絡爬蟲URL消重算法研究[J];產(chǎn)業(yè)與科技論壇;2011年18期
4 胡靜芳;沈亞斌;;基于Web的新聞采集系統(tǒng)[J];電腦知識與技術;2009年19期
5 孫立偉;何國輝;吳禮發(fā);;網(wǎng)絡爬蟲技術的研究[J];電腦知識與技術;2010年15期
6 鄭凱;;基于動態(tài)評價URL鏈接結構的主題爬行策略[J];福建電腦;2010年02期
7 董日壯;郭曙超;;網(wǎng)絡爬蟲的設計與實現(xiàn)[J];電腦知識與技術;2014年17期
8 王宏偉;陳明華;謝世鐘;;智能電網(wǎng)用電信息采集系統(tǒng)EPONDBA算法研究[J];光通信技術;2014年02期
9 楊寶森;來玲;;面向學科的網(wǎng)絡信息挖掘系統(tǒng)研究[J];情報理論與實踐;2006年02期
10 陸蓓;程肖;諶志群;;互聯(lián)網(wǎng)輿情挖掘研究述略[J];情報資料工作;2010年02期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 翟偉斌;許榕生;;基于Internet的CIS研究[A];第十三屆全國核電子學與核探測技術學術年會論文集(下冊)[C];2006年
2 徐劍;柯貴明;;網(wǎng)絡爬蟲技術在搜索引擎中的應用[A];全國第21屆計算機技術與應用學術會議(CACIS·2010)暨全國第2屆安全關鍵技術與應用學術會議論文集[C];2010年
3 李盛韜;吳麗輝;于滿泉;潘文鋒;余智華;王斌;程學旗;;主題Web信息采集的研究與設計[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術會議論文集[C];2003年
4 張凱;李魁;張剛;王斌;;基于站點的Web信息采集器研究[A];第二屆全國信息檢索與內(nèi)容安全學術會議(NCIRCS-2005)論文集[C];2005年
5 張凱;丁國棟;張剛;;GatherCore:一種面向采集系統(tǒng)的工具集[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 王桂紅;農(nóng)產(chǎn)品市場價格web信息分析方法研究[D];沈陽農(nóng)業(yè)大學;2013年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 劉世濤;;簡析搜索引擎中網(wǎng)絡爬蟲的搜索策略[J];阜陽師范學院學報(自然科學版);2006年03期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 曹忠;趙文靜;;一種優(yōu)化的網(wǎng)絡爬蟲的設計與實現(xiàn)[J];電腦知識與技術;2008年35期
2 鄒海亮;孫莉;;可定制的聚焦網(wǎng)絡爬蟲[J];電子科技;2009年01期
3 戚欣;;基于本體的主題網(wǎng)絡爬蟲設計[J];武漢理工大學學報;2009年03期
4 彭軻;廖聞劍;;基于瀏覽器服務的網(wǎng)絡爬蟲[J];硅谷;2009年04期
5 楊松梅;;網(wǎng)絡爬蟲[J];硅谷;2009年15期
6 張紅云;劉煒;熊前興;;一種基于語義本體的網(wǎng)絡爬蟲模型[J];計算機應用與軟件;2009年11期
7 王江紅;朱麗君;李彩虹;;一種新型網(wǎng)絡爬蟲的設計與實現(xiàn)[J];微計算機信息;2010年03期
8 孫立偉;何國輝;吳禮發(fā);;網(wǎng)絡爬蟲技術的研究[J];電腦知識與技術;2010年15期
9 于成龍;于洪波;;網(wǎng)絡爬蟲技術研究[J];東莞理工學院學報;2011年03期
10 張睿涵;林振榮;李建民;衷灣;;基于主題定制的專利網(wǎng)絡爬蟲的設計與實現(xiàn)[J];計算機與現(xiàn)代化;2011年07期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 夏詔杰;郭力;李曉霞;;化學主題網(wǎng)絡爬蟲的研究[A];第十屆全國計算(機)化學學術會議論文摘要集[C];2009年
2 李楠;谷利澤;鈕心忻;;用于XSS掃描的網(wǎng)絡爬蟲的設計與實現(xiàn)[A];2010年全國通信安全學術會議論文集[C];2010年
3 徐劍;柯貴明;;網(wǎng)絡爬蟲技術在搜索引擎中的應用[A];全國第21屆計算機技術與應用學術會議(CACIS·2010)暨全國第2屆安全關鍵技術與應用學術會議論文集[C];2010年
4 張軍;于浩;內(nèi)野寬治;;UGC中產(chǎn)品評論信息的挖掘[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
5 王慶廣;何力;韓偉紅;;基于爬蟲的有害網(wǎng)站發(fā)現(xiàn)與判別系統(tǒng)的實現(xiàn)[A];第27次全國計算機安全學術交流會論文集[C];2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 龔秋艷;并行網(wǎng)絡爬蟲設計與實現(xiàn)[D];華東師范大學;2010年
2 么士宇;基于分布式計算的網(wǎng)絡爬蟲技術研究[D];大連海事大學;2011年
3 陳奮;過濾型網(wǎng)絡爬蟲的研究與設計[D];廈門大學;2007年
4 金梅;網(wǎng)絡爬蟲性能提升與功能拓展的研究與實現(xiàn)[D];吉林大學;2012年
5 芮虎;比價購物平臺中網(wǎng)絡爬蟲的設計與實現(xiàn)[D];華東理工大學;2013年
6 趙茉莉;網(wǎng)絡爬蟲系統(tǒng)的研究與實現(xiàn)[D];電子科技大學;2013年
7 劉晶晶;面向微博的網(wǎng)絡爬蟲研究與實現(xiàn)[D];復旦大學;2012年
8 譚龍遠;基于領域的網(wǎng)絡爬蟲技術的研究與實現(xiàn)[D];武漢理工大學;2009年
9 張紅云;基于頁面分析的主題網(wǎng)絡爬蟲的研究[D];武漢理工大學;2010年
10 趙鵬程;分布式書籍網(wǎng)絡爬蟲系統(tǒng)的設計與實現(xiàn)[D];西南交通大學;2014年
,本文編號:540887
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/540887.html