面向微博的消費意圖識別
發(fā)布時間:2021-06-24 00:11
互聯網的快速發(fā)展和互聯網軟硬件的革新給人們的生活帶來了巨大的變化,如今PC,手機,PDA等電子設備已經進入千家萬戶,成為人們生活中的必需品。在現階段互聯網的發(fā)展中,社交化已成為主要的發(fā)展方向和趨勢,各個社交網站例如推特和新浪微博迅速出現且占領大量的用戶。大眾通過社交網絡分享自己生活點滴和發(fā)表自己的觀點,在用戶分享的內容中包含著大量個人對某種產品的消費意圖傾向信息。因此,微博作為一種社會媒體與社交網絡應用,包含著巨大的商業(yè)價值。本文面向微博中的消費意圖進行了一系列的研究。在研究方面嘗試采用模板匹配和分類方法識別用戶消費意圖,在工程方面提出了消費意圖識別的解決方案。本文主要通過以下方法進行微博消費意圖的識別:新浪微博數據獲取和基于分類的僵尸用戶過濾,基于自動抽取模板技術的消費意圖識別,基于分類的消費意圖識別。下面簡要介紹各個研究點的主要研究內容。(1)我們對新浪微博的數據獲取采用了兩種方式,調用新浪微博API的方式和模擬登陸爬取網頁的方式。由于新浪微博對爬數據的限制,如每小時每IP只能調用API一萬次,爬取網頁一段時間后出現驗證碼等限制,本文最終搭建Hadoop云計算平臺,以多個IP同時爬...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:61 頁
【學位級別】:碩士
【部分圖文】:
Hub與Authority權值計算
加V集合和VF1集合Fig2-4VerifiedusersetandVF1set
哈爾濱工業(yè)大學工學碩士學位論文L 的語言學知識資源和語料庫資源,上層提供分詞,詞性標注,命名,依存句法分析,語義消歧,語義角色標注等核心功能。在上層提供接口供用戶調用,DLL API,Web Service還有可視化的結果和網頁Dem統(tǒng)已經提供給國內上百家科研機構和企業(yè)使用,被證明在實用性是上產品。
本文編號:3245942
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:61 頁
【學位級別】:碩士
【部分圖文】:
Hub與Authority權值計算
加V集合和VF1集合Fig2-4VerifiedusersetandVF1set
哈爾濱工業(yè)大學工學碩士學位論文L 的語言學知識資源和語料庫資源,上層提供分詞,詞性標注,命名,依存句法分析,語義消歧,語義角色標注等核心功能。在上層提供接口供用戶調用,DLL API,Web Service還有可視化的結果和網頁Dem統(tǒng)已經提供給國內上百家科研機構和企業(yè)使用,被證明在實用性是上產品。
本文編號:3245942
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3245942.html
最近更新
教材專著