基于用戶關(guān)系的維吾爾文微博數(shù)據(jù)獲取方法的研究
本文關(guān)鍵詞:基于用戶關(guān)系的維吾爾文微博數(shù)據(jù)獲取方法的研究
更多相關(guān)文章: 跨語言 輿情 數(shù)據(jù)獲取 用戶關(guān)系 網(wǎng)絡(luò)爬蟲 微博API
【摘要】:目前,互聯(lián)網(wǎng)上的大部分群體性數(shù)據(jù)資源集中在微博、論壇等社交網(wǎng)絡(luò)上.跨語言社會(huì)輿情分析是我國智能信息處理的一個(gè)研究熱點(diǎn).維吾爾語是我國主要少數(shù)民族語言之一,為了構(gòu)建一個(gè)好的跨語言輿情分析系統(tǒng),維吾爾文微博的數(shù)據(jù)獲取顯得尤為重要.維吾爾文微博數(shù)據(jù)獲取最大的難點(diǎn)是微博開發(fā)商不提供API.本文以技術(shù)和經(jīng)濟(jì)為基礎(chǔ)的"Guduk"微博為研究對象,提出了一種基于用戶關(guān)系的維吾爾文微博數(shù)據(jù)獲取爬蟲系統(tǒng)方案,此方案解決了在不提供API情況下的數(shù)據(jù)獲取難點(diǎn).本文的研究為跨語言輿情分析系統(tǒng)提供大量的維吾爾文社交網(wǎng)絡(luò)數(shù)據(jù)資源、數(shù)據(jù)獲取方法和技術(shù).
【作者單位】: 新疆大學(xué)信息科學(xué)與工程學(xué)院;新疆大學(xué)新疆多語種信息技術(shù)重點(diǎn)實(shí)驗(yàn)室;
【關(guān)鍵詞】: 跨語言 輿情 數(shù)據(jù)獲取 用戶關(guān)系 網(wǎng)絡(luò)爬蟲 微博API
【基金】:國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973)項(xiàng)目(2014cb340506) 國家自然科學(xué)基金項(xiàng)目(61331011)
【分類號(hào)】:TP393.092
【正文快照】: 0引言目前,互聯(lián)網(wǎng)已成為人們互相交流、表達(dá)民意、參與經(jīng)濟(jì)和政治生活的公共平臺(tái).微博(Micro Blog)是一個(gè)用戶通過PC或者智能設(shè)備建立個(gè)人社交區(qū)域,而達(dá)到信息分享、信息傳播目地的社交網(wǎng)絡(luò)之一.微博的信息更新速度快,并實(shí)現(xiàn)了及時(shí)分享功能.2006年10月,首個(gè)微博網(wǎng)站—Twitter
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 姚科;;開放API:新浪微博必經(jīng)之路?[J];互聯(lián)網(wǎng)天地;2010年08期
2 廉捷;周欣;曹偉;劉云;;新浪微博數(shù)據(jù)挖掘方案[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年10期
3 陳雷;劉嘉勇;;基于HTTP協(xié)議的POST數(shù)據(jù)分析與還原[J];通信技術(shù);2011年04期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張國安;鐘紹輝;;基于k均值聚類的微博用戶分類的研究[J];電腦知識(shí)與技術(shù);2012年26期
2 張國安;鐘紹輝;;基于微博用戶評(píng)論和用戶轉(zhuǎn)發(fā)的數(shù)據(jù)挖掘[J];電腦知識(shí)與技術(shù);2012年27期
3 趙前東;葉猛;;微博熱點(diǎn)話題檢測系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];電視技術(shù);2013年03期
4 張愷;馬忠軍;張溯章;;基于桂電微校園的社會(huì)網(wǎng)絡(luò)實(shí)證研究[J];桂林電子科技大學(xué)學(xué)報(bào);2013年02期
5 許星;席鵬富;秦天;;社會(huì)網(wǎng)絡(luò)的輿情信息分析與可視化——以新浪微博為例[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年12期
6 陳舜華;王曉彤;郝志峰;蔡瑞初;肖曉軍;盧宇;;基于微博API的分布式抓取技術(shù)[J];電信科學(xué);2013年08期
7 張春華;;基于模板驅(qū)動(dòng)的微博數(shù)據(jù)采集程序[J];電腦編程技巧與維護(hù);2013年22期
8 邱仕坦;;基于CS-SVM的網(wǎng)絡(luò)熱點(diǎn)話題變化趨勢預(yù)測[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期
9 吳健生;秦維;彭建;李衛(wèi)鋒;;基于步行指數(shù)的城市日常生活設(shè)施配置合理性評(píng)估——以深圳市福田區(qū)為例[J];城市發(fā)展研究;2014年10期
10 劉玉坤;夏棟梁;馬麗;;基于AGSO-LSSVM的熱點(diǎn)話題預(yù)測模型[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年06期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 方春林;郭曉勇;;基于主題的微博數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[A];廣西計(jì)算機(jī)學(xué)會(huì)2014年學(xué)術(shù)年會(huì)論文集[C];2014年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 劉行軍;微博用戶及其信息傳播影響因素研究[D];華中師范大學(xué);2013年
2 黃煥;面向e-Learning的學(xué)習(xí)者情感建模及應(yīng)用研究[D];華中師范大學(xué);2014年
3 張海鵬;網(wǎng)絡(luò)服務(wù)系統(tǒng)的動(dòng)力學(xué)建模與分析研究[D];中國科學(xué)技術(shù)大學(xué);2014年
4 苑衛(wèi)國;微博用戶行為分析和網(wǎng)絡(luò)結(jié)構(gòu)演化的研究[D];北京交通大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 盧燕兒;基于SaaS的協(xié)同項(xiàng)目管理系統(tǒng)的研究與開發(fā)[D];南昌大學(xué);2010年
2 朱少龍;基于微博的社會(huì)化媒體分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
3 趙敏;基于GPRS及彩信的遠(yuǎn)程監(jiān)控裝置的研究與實(shí)現(xiàn)[D];中北大學(xué);2012年
4 馬君;微博文化研究[D];四川師范大學(xué);2011年
5 夏雪峰;基于行為檢測的防火墻技術(shù)研究與實(shí)現(xiàn)[D];北方工業(yè)大學(xué);2012年
6 麥藝華;面向中文微博的社會(huì)網(wǎng)絡(luò)分析及應(yīng)用[D];華南理工大學(xué);2012年
7 鄭營營;基于HTTP/FTP協(xié)議的斷點(diǎn)續(xù)傳多線程下載組件[D];濟(jì)南大學(xué);2012年
8 李韋男;基于模式匹配和協(xié)議分析的入侵檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];華東理工大學(xué);2013年
9 岳亞杰;微博協(xié)同過濾推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2012年
10 陶金;零度偏離理論視角下的微博修辭研究[D];渤海大學(xué);2013年
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前7條
1 張彥超;劉云;李勇;沈波;;基于自動(dòng)生成模板的Web信息抽取技術(shù)[J];北京交通大學(xué)學(xué)報(bào);2009年05期
2 周立柱,林玲;聚焦爬蟲技術(shù)研究綜述[J];計(jì)算機(jī)應(yīng)用;2005年09期
3 馬博;袁丁;;Linux下的高流量數(shù)據(jù)包監(jiān)聽技術(shù)[J];計(jì)算機(jī)應(yīng)用;2009年05期
4 姚峰;;Java平臺(tái)中Base64編碼/解碼算法的改進(jìn)[J];計(jì)算機(jī)應(yīng)用與軟件;2008年12期
5 歐健文,董守斌,蔡斌;模板化網(wǎng)頁主題信息的提取方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
6 郭世澤;何韶軍;牛偉;;基于HASH表和SYN計(jì)算的TCP包重組方法[J];信息安全與通信保密;2006年02期
7 石偉丞;譚良;周明天;;可復(fù)原WebMail的設(shè)計(jì)與實(shí)現(xiàn)[J];通信技術(shù);2010年05期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 來雪玲;圖書館用戶關(guān)系管理[J];圖書館學(xué)研究;2004年09期
2 趙玉敏;;面向知識(shí)服務(wù)的圖書館用戶關(guān)系管理[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2007年11期
3 徐雙;劉勇;;基于用戶知識(shí)交互的圖書館用戶關(guān)系管理[J];情報(bào)探索;2010年08期
4 付凱芳;;基于知識(shí)轉(zhuǎn)移的圖書館用戶關(guān)系管理分析[J];民營科技;2010年08期
5 ;微博的含義[J];民間傳奇故事(A卷);2010年05期
6 孫萬軍;用戶卡——郵政實(shí)行用戶關(guān)系管理的第一步[J];中國郵政;2000年12期
7 陳娟;;媒體的用戶關(guān)系管理應(yīng)建立基于大數(shù)據(jù)的管理理念[J];中國傳媒科技;2013年01期
8 陳娟;;大數(shù)據(jù)時(shí)代的媒體用戶關(guān)系管理[J];傳媒觀察;2013年07期
9 莫啟儀;;新時(shí)代圖書館用戶關(guān)系管理實(shí)踐研究[J];新世紀(jì)圖書館;2013年07期
10 ;移動(dòng)時(shí)代 媒體與用戶關(guān)系的新變革[J];聲屏世界·廣告人;2013年07期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 蔡賽緘;丁麗佳;;對氣象微博的初步探討及發(fā)展前景思考[A];廣東省氣象學(xué)會(huì)2012年學(xué)術(shù)年會(huì)論文摘要文集[C];2012年
中國重要報(bào)紙全文數(shù)據(jù)庫 前4條
1 李志廷;黨報(bào)微博,力量不“微”[N];寧夏日報(bào);2013年
2 實(shí)習(xí)生 張雪嬌;移動(dòng)社交:一場愈演愈烈的社交變革[N];科技日報(bào);2014年
3 潘啟雯;小米的市場“風(fēng)暴效應(yīng)”為什么能這么持久[N];上海證券報(bào);2014年
4 張江;小米營銷成功的亮點(diǎn)[N];中華合作時(shí)報(bào);2014年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 武慧娟;社會(huì)化標(biāo)注系統(tǒng)中個(gè)性化信息推薦模型研究[D];吉林大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 黨永杰;新浪微博用戶關(guān)系研究[D];華中師范大學(xué);2013年
2 劉夢琦;基于用戶關(guān)系管理理論的高校圖書館發(fā)展研究[D];安徽大學(xué);2012年
3 周余姣;基于CRM理念的圖書館用戶關(guān)系管理研究[D];河北大學(xué);2009年
4 王鵬;運(yùn)營支撐系統(tǒng)的CRM研究[D];黑龍江大學(xué);2013年
5 陳立鋒;基于移動(dòng)CDR的用戶關(guān)系分析及應(yīng)用[D];北京郵電大學(xué);2014年
6 孫大鵬;基于Hadoop的SNS用戶關(guān)系鏈分析的研究和應(yīng)用[D];東北師范大學(xué);2014年
7 白林根;基于復(fù)雜網(wǎng)絡(luò)的微博用戶關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)研究[D];杭州電子科技大學(xué);2014年
,本文編號(hào):1051203
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1051203.html