面向微博的消費(fèi)意圖識(shí)別
發(fā)布時(shí)間:2021-06-24 00:11
互聯(lián)網(wǎng)的快速發(fā)展和互聯(lián)網(wǎng)軟硬件的革新給人們的生活帶來了巨大的變化,如今PC,手機(jī),PDA等電子設(shè)備已經(jīng)進(jìn)入千家萬戶,成為人們生活中的必需品。在現(xiàn)階段互聯(lián)網(wǎng)的發(fā)展中,社交化已成為主要的發(fā)展方向和趨勢(shì),各個(gè)社交網(wǎng)站例如推特和新浪微博迅速出現(xiàn)且占領(lǐng)大量的用戶。大眾通過社交網(wǎng)絡(luò)分享自己生活點(diǎn)滴和發(fā)表自己的觀點(diǎn),在用戶分享的內(nèi)容中包含著大量個(gè)人對(duì)某種產(chǎn)品的消費(fèi)意圖傾向信息。因此,微博作為一種社會(huì)媒體與社交網(wǎng)絡(luò)應(yīng)用,包含著巨大的商業(yè)價(jià)值。本文面向微博中的消費(fèi)意圖進(jìn)行了一系列的研究。在研究方面嘗試采用模板匹配和分類方法識(shí)別用戶消費(fèi)意圖,在工程方面提出了消費(fèi)意圖識(shí)別的解決方案。本文主要通過以下方法進(jìn)行微博消費(fèi)意圖的識(shí)別:新浪微博數(shù)據(jù)獲取和基于分類的僵尸用戶過濾,基于自動(dòng)抽取模板技術(shù)的消費(fèi)意圖識(shí)別,基于分類的消費(fèi)意圖識(shí)別。下面簡(jiǎn)要介紹各個(gè)研究點(diǎn)的主要研究?jī)?nèi)容。(1)我們對(duì)新浪微博的數(shù)據(jù)獲取采用了兩種方式,調(diào)用新浪微博API的方式和模擬登陸爬取網(wǎng)頁的方式。由于新浪微博對(duì)爬數(shù)據(jù)的限制,如每小時(shí)每IP只能調(diào)用API一萬次,爬取網(wǎng)頁一段時(shí)間后出現(xiàn)驗(yàn)證碼等限制,本文最終搭建Hadoop云計(jì)算平臺(tái),以多個(gè)IP同時(shí)爬...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Hub與Authority權(quán)值計(jì)算
加V集合和VF1集合Fig2-4VerifiedusersetandVF1set
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文L 的語言學(xué)知識(shí)資源和語料庫(kù)資源,上層提供分詞,詞性標(biāo)注,命名,依存句法分析,語義消歧,語義角色標(biāo)注等核心功能。在上層提供接口供用戶調(diào)用,DLL API,Web Service還有可視化的結(jié)果和網(wǎng)頁Dem統(tǒng)已經(jīng)提供給國(guó)內(nèi)上百家科研機(jī)構(gòu)和企業(yè)使用,被證明在實(shí)用性是上產(chǎn)品。
本文編號(hào):3245942
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Hub與Authority權(quán)值計(jì)算
加V集合和VF1集合Fig2-4VerifiedusersetandVF1set
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文L 的語言學(xué)知識(shí)資源和語料庫(kù)資源,上層提供分詞,詞性標(biāo)注,命名,依存句法分析,語義消歧,語義角色標(biāo)注等核心功能。在上層提供接口供用戶調(diào)用,DLL API,Web Service還有可視化的結(jié)果和網(wǎng)頁Dem統(tǒng)已經(jīng)提供給國(guó)內(nèi)上百家科研機(jī)構(gòu)和企業(yè)使用,被證明在實(shí)用性是上產(chǎn)品。
本文編號(hào):3245942
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3245942.html
最近更新
教材專著