一種面向企業(yè)的行業(yè)微博信息推薦方法
【圖文】:
86計算機(jī)應(yīng)用與軟件2014年圖12012年2月新浪企業(yè)微博行業(yè)分布雖然微博平臺包含了各種行業(yè)信息,而且對于行業(yè)事件的反應(yīng)很快,但是在其上獲取較為全面的行業(yè)信息面臨諸多困難。微博平臺的興起和用戶的快速增長帶來了信息過載問題,隨著用戶關(guān)注數(shù)量的增加,與行業(yè)無關(guān)的內(nèi)容也越來越多地出現(xiàn)在用戶訂閱的微博中。加之微博平臺本身也具有主題分散和信息碎片化的特點。這就要求能夠識別企業(yè)微博用戶的行業(yè)興趣,并對微博信息依照行業(yè)相關(guān)度進(jìn)行提取和推薦。然而,現(xiàn)有的社交媒體管理與分析軟件在行業(yè)信息提取方面大多僅僅利用用戶自定義關(guān)鍵詞來進(jìn)行簡單的文字匹配,這種方法存在較大缺陷。首先,個別關(guān)鍵詞并不能全面刻畫行業(yè)信息需求;其次,語言的豐富性使得簡單的文字匹配效果很受限。本文針對以上問題提出了一種基于行業(yè)語料的行業(yè)信息推薦方法。行業(yè)語料的來源方面,由于企業(yè)微博所發(fā)信息具有較強(qiáng)的行業(yè)相關(guān)性,所以行業(yè)相關(guān)用戶的歷史微博是行業(yè)語料的主要來源。對行業(yè)語料采用關(guān)鍵詞提取和用戶自定義關(guān)鍵詞擴(kuò)展技術(shù)相融合的方法建模用戶的行業(yè)興趣,從而兼顧了行業(yè)信息的全面刻畫與用戶興趣的動態(tài)改變。最后,通過比較行業(yè)興趣與待過濾微博的相關(guān)性來提取和推薦行業(yè)相關(guān)微博信息。1相關(guān)工作微博等社交媒體促使了學(xué)術(shù)界一個新興的研究分支———社交媒體分析SMA(SocialMediaAnalytics)的興起。Melville等人提出了SMA需要解決的四大關(guān)鍵問題[7],即相關(guān)挖掘、影響力識別、情感分析和話題檢測,Leskovec又將SMA的問題進(jìn)一步細(xì)化[8]。在國內(nèi),基于微博的研究工作近年來也獲得了越來越多的關(guān)注。文坤梅等人對基于中文微博的研究工作進(jìn)行了綜述[9]。在國內(nèi),計算機(jī)學(xué)科內(nèi)關(guān)于社交媒體分析的相關(guān)研究剛剛起步,相關(guān)研
保囝沒ё遠(yuǎn)ㄒ騫丶憧誓芄輝諞歡ǔ潭壬轄餼隼?啟動現(xiàn)象。本方法主要分為數(shù)據(jù)獲取與預(yù)處理、行業(yè)關(guān)鍵詞提娶用戶自定義關(guān)鍵詞擴(kuò)展以及個性化微博推薦四大組成部分。首先,獲取用戶相關(guān)微博信息進(jìn)行數(shù)據(jù)預(yù)處理;之后數(shù)據(jù)分別交由關(guān)鍵詞提取與關(guān)鍵詞擴(kuò)展模塊,關(guān)鍵詞提取將基于TextRank算法無指導(dǎo)地進(jìn)行,關(guān)鍵詞擴(kuò)展將基于用戶自定義關(guān)鍵詞使用P-IOW算法進(jìn)行;之后將二者的結(jié)果根據(jù)用戶自定義權(quán)重進(jìn)行線性合并;合并結(jié)果供相關(guān)推薦模塊進(jìn)行相關(guān)度比較,以對待推薦微博生成相關(guān)性評分,從而達(dá)到推薦相關(guān)微博的目的。處理流程如圖2所示。圖2方法整體流程圖示2.1數(shù)據(jù)獲取與預(yù)處理本文基于行業(yè)相關(guān)語料進(jìn)行關(guān)鍵詞提取與關(guān)鍵詞擴(kuò)展。行業(yè)相關(guān)語料的來源可以是該用戶的歷史微博語料,也可以是用戶指定的若干個本行業(yè)相關(guān)企業(yè)用戶的歷史微博語料。在經(jīng)過對若干行業(yè)微博的分析后,本文發(fā)現(xiàn)名詞能夠較準(zhǔn)
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 宋雙永;李秋丹;;面向移動終端的微博信息推薦方法[J];計算機(jī)科學(xué);2011年11期
2 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學(xué)報;2012年06期
3 程亮;邱云飛;孫魯;;微博謠言檢測方法研究[J];計算機(jī)應(yīng)用與軟件;2013年02期
4 李瑩;;對于企業(yè)微博營銷的發(fā)展現(xiàn)狀與展望[J];價值工程;2012年31期
5 趙春芳;;淺談中小企業(yè)如何走出微博營銷困境[J];現(xiàn)代商業(yè);2012年21期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 馬寧;劉怡君;;基于超網(wǎng)絡(luò)中超邊排序算法的網(wǎng)絡(luò)輿論領(lǐng)袖識別[J];系統(tǒng)工程;2013年09期
2 劉喜文;鄭昌興;王文龍;湯剛強(qiáng);;構(gòu)建數(shù)據(jù)倉庫過程中的數(shù)據(jù)清洗研究[J];圖書與情報;2013年05期
3 季芳;;中小企業(yè)實施微博營銷策略分析[J];四川職業(yè)技術(shù)學(xué)院學(xué)報;2013年05期
4 馬寶君;張楠;孫濤;;智慧城市背景下公眾反饋大數(shù)據(jù)分析:概率主題建模的視角[J];電子政務(wù);2013年12期
5 潘善亮;茅琴嬌;韓露;;一種基于虛擬社交化的Web服務(wù)發(fā)現(xiàn)方法研究[J];電信科學(xué);2013年12期
6 易軍凱;田立康;;基于類別區(qū)分度的文本特征選擇算法研究[J];北京化工大學(xué)學(xué)報(自然科學(xué)版);2013年S1期
7 代寬;趙輝;韓冬;宋天勇;;基于向量空間模型的中文網(wǎng)頁主題特征項抽取[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2014年01期
8 顧益軍;解易;張培晶;;面向有組織犯罪分析的人際關(guān)系網(wǎng)絡(luò)節(jié)點重要性評價研究[J];中國人民公安大學(xué)學(xué)報(自然科學(xué)版);2013年04期
9 吳瑞紅;呂學(xué)強(qiáng);;基于互聯(lián)網(wǎng)的術(shù)語定義辨析[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
10 羅琦;;一種最大分類間隔SVDD的多類文本分類算法[J];電訊技術(shù);2014年04期
相關(guān)會議論文 前1條
1 劉權(quán);郭武;;基于核主成分分析的話題跟蹤系統(tǒng)[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 劉馨月;Web挖掘中的鏈接分析與話題檢測研究[D];大連理工大學(xué);2012年
2 馬飛;云數(shù)據(jù)中心中虛擬機(jī)放置和實時遷移研究[D];北京交通大學(xué);2013年
3 樂承毅;企業(yè)知識與員工知識貢獻(xiàn)度集成評價方法及應(yīng)用研究[D];浙江大學(xué);2013年
4 孫甲申;基于主題模型和隨機(jī)游走的標(biāo)簽技術(shù)研究[D];北京郵電大學(xué);2013年
5 張鵬;數(shù)據(jù)中心網(wǎng)絡(luò)的流量管理和優(yōu)化問題研究[D];北京郵電大學(xué);2013年
6 王寶勛;面向網(wǎng)絡(luò)社區(qū)問答對的語義挖掘研究[D];哈爾濱工業(yè)大學(xué);2013年
7 龔書;抽取式多文檔文摘的文本表示研究[D];北京交通大學(xué);2013年
8 張俊三;Web中相關(guān)實體發(fā)現(xiàn)研究[D];北京交通大學(xué);2013年
9 尹莉;基礎(chǔ)數(shù)學(xué)領(lǐng)域作者合作網(wǎng)絡(luò)實證分析[D];西北大學(xué);2013年
10 李朋;異構(gòu)信息網(wǎng)絡(luò)分析模型及其應(yīng)用研究[D];重慶大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 高雅;微博新聞事件信息可信度評價[D];吉林大學(xué);2013年
2 耿玉嬌;MapReduce中基于抽樣技術(shù)的傾斜問題研究[D];大連海事大學(xué);2013年
3 芮虎;比價購物平臺中網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)[D];華東理工大學(xué);2013年
4 王梓;林產(chǎn)品貿(mào)易信息用戶興趣模型及個性化搜索[D];北京林業(yè)大學(xué);2013年
5 牛雷;分布式多媒體平臺中視頻搜索技術(shù)的研究與應(yīng)用[D];北京郵電大學(xué);2013年
6 胡瑩;移動微博持續(xù)使用行為影響因素研究[D];北京郵電大學(xué);2013年
7 林哲;面向行業(yè)的信息融合原型系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學(xué);2013年
8 萬德穩(wěn);藏文搜索和搜索結(jié)果聚類研究及系統(tǒng)實現(xiàn)[D];西南交通大學(xué);2013年
9 閻正喜;H基金公司網(wǎng)上交易系統(tǒng)安全問題研究[D];西南交通大學(xué);2013年
10 陳彥敏;基于聯(lián)合條件熵的文本特征提取算法的研究及其應(yīng)用[D];華東師范大學(xué);2013年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 閆瑞;曹先彬;李凱;;面向短文本的動態(tài)組合分類算法[J];電子學(xué)報;2009年05期
2 廖祥文;曹冬林;方濱興;許洪波;程學(xué)旗;;基于概率推理模型的博客傾向性檢索研究[J];計算機(jī)研究與發(fā)展;2009年09期
3 杜偉夫;譚松波;云曉春;程學(xué)旗;;一種新的情感詞匯語義傾向計算方法[J];計算機(jī)研究與發(fā)展;2009年10期
4 何菲;;微博營銷第N種可能——超越粉絲[J];IT經(jīng)理世界;2011年09期
5 鄭斐然;苗奪謙;張志飛;高燦;;一種中文微博新聞話題檢測的方法[J];計算機(jī)科學(xué);2012年01期
6 陳可,張琴舜,陳培培,蔡日基;BP神經(jīng)網(wǎng)絡(luò)在證券分析預(yù)測中應(yīng)用[J];計算機(jī)工程;2001年11期
7 林小俊;張猛;暴筱;李軍;吳璽宏;;基于概念網(wǎng)絡(luò)的短文本分類方法[J];計算機(jī)工程;2010年21期
8 許曉東;肖銀濤;朱士瑞;;微博社區(qū)的謠言傳播仿真研究[J];計算機(jī)工程;2011年10期
9 李文波;孫樂;張大鯤;;基于Labeled-LDA模型的文本分類新算法[J];計算機(jī)學(xué)報;2008年04期
10 曹娟;張勇東;李錦濤;唐勝;;一種基于密度的自適應(yīng)最優(yōu)LDA模型選擇方法[J];計算機(jī)學(xué)報;2008年10期
,本文編號:2584637
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2584637.html