天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

跨領域中文微博消費意圖識別方法的研究

發(fā)布時間:2017-04-05 14:08

  本文關鍵詞:跨領域中文微博消費意圖識別方法的研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:網(wǎng)絡和社交媒體在世界范圍內(nèi)的興起,人們在互聯(lián)網(wǎng)方面充當?shù)慕巧饾u多樣化。以微博為代表的言論平臺逐漸成為人們?nèi)粘I畹闹匾M成部分,與此同時,電商消費平臺也借助著互聯(lián)網(wǎng)使之規(guī)模越來越大。微博用戶在網(wǎng)絡上關于商品的評論、意見對于電商的營銷策略以及生產(chǎn)商的產(chǎn)品設計都有著非常巨大的價值。從微博中識別其消費意圖也因此尤為重要。微博的言論來自各個領域,本文針對微博的這個特點,提出了一種基于語義距離的遷移學習算法,用于對微博意圖的探測以及識別。語義距離是消費方向相關的計算,遷移學習則是針對微博言論的跨領域,這種文本分類方法可以提高識別的準確率。此外,本文利用依存句法結構以及拼音特征來解析中文微博的表達以及存在的錯別字情況,借此特征可以較好地學習到一些微博的信息。最后,本文進行了相對比較全面的微博意圖識別的實驗,針對識別的結果做出分析,并與相關領域的研究結果作對比研究。結果表明了基于語義距離的遷移學習算法在中文微博消費意圖的識別方面是可行的,效果是較為理想的。
【關鍵詞】:消費意圖識別 語義距離 遷移學習 文本分類
【學位授予單位】:上海交通大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.1
【目錄】:
  • 摘要3-4
  • ABSTRACT4-9
  • 第一章 緒論9-13
  • 1.1 研究背景9-10
  • 1.2 研究Qg容10-11
  • 1.3 論文貢獻11
  • 1.4 論文結構11-13
  • 第二章 相關研究13-23
  • 2.1 意圖的探測和識別13-15
  • 2.1.1 搜索引擎下的意圖13-14
  • 2.1.2 消費意圖的探測以及識別14-15
  • 2.2 遷移學習15-17
  • 2.3 文本處理17-20
  • 2.3.1 文本的基礎處理17-19
  • 2.3.2 文本處理的應用領域19-20
  • 2.4 語義距離20-22
  • 2.4.1 向量空間模型20-21
  • 2.4.2 語義距離計算21-22
  • 2.4.3 詞向量22
  • 2.5 本章小結22-23
  • 第三章 系統(tǒng)基礎架構和基礎工具23-32
  • 3.1 系統(tǒng)基礎架構23-24
  • 3.2 系統(tǒng)基礎性工作準備24-31
  • 3.2.1 微博的獲取與處理24-26
  • 3.2.2 領域相關本體庫的建立26-31
  • 3.3 工具介紹31
  • 3.4 本章小結31-32
  • 第四章 跨領域微博意圖識別的關鍵技術32-49
  • 4.1 跨領域的遷移學習32
  • 4.2 特征選擇32-37
  • 4.2.1 特征選擇算法32-34
  • 4.2.2 句法特征34-36
  • 4.2.3 微博特有特征36-37
  • 4.3 基于語義距離的遷移學習框架37-47
  • 4.3.1 EM算法37-38
  • 4.3.2 基于EM算法的遷移學習38-42
  • 4.3.3 文本語義距離計算方法42-44
  • 4.3.4 基于語義距離的遷移學習44-47
  • 4.4 基于語義距離的原始資料分類47-48
  • 4.5 本章小結48-49
  • 第五章 實驗方法與結果分析49-59
  • 5.1 實驗介紹49-50
  • 5.1.1 實驗語料49
  • 5.1.2 分類的評價標準49-50
  • 5.2 微博文本特征50-51
  • 5.3 消費意圖識別的實驗51-57
  • 5.4 基于語義距離刪選無關微博的實驗57-58
  • 5.5 本章小結58-59
  • 第六章 總結與展望59-61
  • 6.1 本文總結59
  • 6.2 討論與展望59-61
  • 參考文獻61-65
  • 致謝65-67
  • 攻讀碩士學位期間已發(fā)表或錄用的論文67-69

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前7條

1 賴清楠;馬皓;宋維佳;李婷婷;蔣廣學;張蓓;;高校BBS與微博的用戶社交行為特征分析[J];通信學報;2013年S2期

2 謝麗星;周明;孫茂松;;基于層次結構的多策略中文微博情感分析和特征抽取[J];中文信息學報;2012年01期

3 廉捷;周欣;曹偉;劉云;;新浪微博數(shù)據(jù)挖掘方案[J];清華大學學報(自然科學版);2011年10期

4 李林容;黎薇;;微博的文化特性及傳播價值[J];當代傳播;2011年01期

5 楊惠棟;;大學生錯別字探析[J];安徽文學(下半月);2010年03期

6 蘇金樹;張博鋒;徐昕;;基于機器學習的文本分類技術研究進展[J];軟件學報;2006年09期

7 陳正,李開復;拼寫糾正在拼音輸入法中的應用[J];計算機學報;2001年07期


  本文關鍵詞:跨領域中文微博消費意圖識別方法的研究,由筆耕文化傳播整理發(fā)布。



本文編號:287130

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/287130.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶26deb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com