基于社會媒體的市場行情預(yù)測方法研究
本文關(guān)鍵詞:基于社會媒體的市場行情預(yù)測方法研究
更多相關(guān)文章: 市場行情預(yù)測 社會媒體 消費意圖挖掘 開放式事件抽取 電影票房預(yù)測 股市漲跌預(yù)測
【摘要】:以Facebook、Twitter、新浪微博為代表的社會媒體的迅猛發(fā)展,為觀察大眾的主觀世界提供了空前的數(shù)據(jù)支持,從而也為預(yù)測大眾的行為提供了新的手段;谏鐣襟w的預(yù)測技術(shù)是指通過對社會媒體數(shù)據(jù)的挖掘與分析,看清事實真相,聚集大眾的群體智慧,運用科學(xué)的知識、方法和手段,對事物未來發(fā)展趨勢和狀態(tài)做出科學(xué)的估計和評價。準(zhǔn)確的預(yù)測結(jié)果對于人類生活中的趨利避害,工作中的計劃決策起著至關(guān)重要的作用。一項決策的結(jié)果與該決策本身之間有著時間上的滯后關(guān)系,“利”與“害”總是存在于未來的時間與空間之中,任何決策都不可避免地要依賴預(yù)測。通過對未來趨勢做出提前判斷,有利于適時地調(diào)整計劃,以及采取措施實施調(diào)控。然而,基于社會媒體的預(yù)測研究面臨著各種挑戰(zhàn),這其中包括了缺乏清晰的問題定義和界限劃分的挑戰(zhàn);社會媒體中群體智慧的挖掘以及文本語義理解不夠深入的挑戰(zhàn)以及預(yù)測模型較為簡單,主要依靠線性回歸模型,對非線性系統(tǒng)預(yù)測能力有限的挑戰(zhàn)。本文主要針對這三個挑戰(zhàn)進行了研究,并對市場行情預(yù)測中的電影票房預(yù)測和股市漲跌預(yù)測進行探索,分別從社會媒體文本中抽取用戶消費意圖信息和客觀的事件報道作為特征進行預(yù)測。具體而言,本文的主要研究內(nèi)容可概括為以下幾個方面:1.本文提出了隱式消費意圖挖掘任務(wù),并構(gòu)造基于領(lǐng)域自適應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型自動識別社會媒體中的隱式消費意圖,在此識別結(jié)果基礎(chǔ)上推薦用戶意圖相關(guān)產(chǎn)品以期滿足其消費需求。具體而言,給定一條微博文本,首先基于領(lǐng)域自適應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型做二元分類,判斷其是否含有用戶消費意圖;隨后,對于有消費意圖的微博文本再抽取其中的需求詞,最后,根據(jù)該需求詞去事先構(gòu)造好的消費意圖事理圖譜中檢索可以滿足消費意圖的產(chǎn)品推薦給用戶。本文構(gòu)建了母嬰領(lǐng)域和電影票房領(lǐng)域的語料,實驗結(jié)果表明:(1)本文提出的領(lǐng)域自適應(yīng)方法可以有效克服訓(xùn)練語料少帶來的消費意圖識別效果不理想的問題;(2)推薦給用戶的意圖相關(guān)全部產(chǎn)品中有60%左右的產(chǎn)品可以滿足用戶的消費需求。2.本文提出基于消費意圖的電影票房預(yù)測模型;谙M意圖理解的電影票房預(yù)測相對于傳統(tǒng)的電影票房預(yù)測而言,可以說是站在一個全新的角度進行研究,為此能夠給預(yù)測工作帶來兩方面的優(yōu)勢:(1)電影上映前就可以采集到大量的民眾反饋數(shù)據(jù);(2)可以大規(guī)模的獲取與電影票房高低最相關(guān)的影響因素:大眾是否愿意觀看某部電影。在此特征基礎(chǔ)上,本文提出了高斯連接函數(shù)回歸模型作為預(yù)測方法,該方法不需要對輸入數(shù)據(jù)進行任何獨立同分布假設(shè),且能夠分析輸入數(shù)據(jù)之間的相互作用關(guān)系。本文在中國電影市場和美國電影市場均做了實驗對比分析,結(jié)果表明本文提出的方法與傳統(tǒng)的基于線性回歸模型和支持向量回歸模型的方法相比都取得了更加優(yōu)異的表現(xiàn)。3.本文提出一套面向預(yù)測的事件定義,事件抽取和事件表示學(xué)習(xí)方法。該方法既克服了特定域事件抽取需要預(yù)先指定事件類型和標(biāo)注大量訓(xùn)練語料的費時費力的問題,又解決了開放域事件抽取很難進行事件歸一化,判斷事件類型的問題。本文提出的方法利用張量神經(jīng)網(wǎng)絡(luò)模型以開放式事件抽取結(jié)果作為輸入,通過張量對事件元組之間的關(guān)系進行建模學(xué)習(xí)并最終輸出低維、稠密、實數(shù)值的事件向量。對于相似的事件,其在同一向量空間上距離也相近。實驗結(jié)果表明,本文提出的事件抽取和表示方法與基線方法相比能夠更加準(zhǔn)確地表示客觀事件。4.本文提出了基于卷積神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,該模型利用開放式事件抽取并泛化得到的事件向量作為輸入特征。該模型將輸入事件劃分成長期事件,中長期事件和短期事件,并利用卷積層神經(jīng)結(jié)點將長期和中長期事件進行建模學(xué)習(xí),抽取其中最重要的事件特征并分別表示合成一個向量。隨后,卷積神經(jīng)網(wǎng)絡(luò)中的隱含層結(jié)點建模學(xué)習(xí)事件特征向量與股市漲跌之間的隱含復(fù)雜關(guān)系,最終輸出股市漲跌的預(yù)測結(jié)果。實驗結(jié)果表明,本文提出的方法比當(dāng)前最好的股市漲跌預(yù)測方法在準(zhǔn)確率指標(biāo)上能夠提升4個百分點?傊,本文一方面致力于解決基于社會媒體的信息抽取相關(guān)問題,另一方面致力于預(yù)測模型的構(gòu)建工作,以期能夠充分利用好抽取到的有用信息,將其最終應(yīng)用到以電影票房和股市漲跌為代表的市場行情預(yù)測任務(wù)上。本研究取得了一些初步的成果,期待這些成果能為本領(lǐng)域的其他研究者提供參考借鑒。隨著基于社會媒體的預(yù)測技術(shù)的不斷完善以及大數(shù)據(jù)語料的不斷開放,相信基于社會媒體的市場行情預(yù)測研究在未來會取得更大的突破。同時,基于社會媒體的預(yù)測技術(shù)的成熟也將促進其他相關(guān)研究的發(fā)展。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 賈茜;陳曉丹;;社會媒體研究評述[J];情報科學(xué);2013年08期
2 李會會;;新規(guī)則——用社會媒體做營銷[J];中國商貿(mào);2013年19期
3 Jennifer Woodard Maderazo;姜明媚;;社會媒體是否讓我們共享了過多的信息?[J];互聯(lián)網(wǎng)周刊;2007年10期
4 鐵錚;;積極應(yīng)對危機新聞事件[J];紅旗文稿;2007年11期
5 王飛躍;;萬維社會媒體在防災(zāi)應(yīng)急中的作用[J];科技導(dǎo)報;2008年10期
6 王志安;;積極的中國社會媒體角色[J];青年記者;2008年13期
7 王飛躍;曾大軍;曹志冬;;應(yīng)急2.0:萬維社會媒體及群體態(tài)勢建模與分析[J];中國應(yīng)急管理;2009年01期
8 徐桂權(quán);;社會媒體觸發(fā)公眾風(fēng)潮[J];中國報道;2010年03期
9 李芳;;新聞援助:和諧社會媒體的新職能[J];采寫編;2010年06期
10 繆琦;;解析傳統(tǒng)媒體與社會媒體的融合趨勢——以《新周刊》新浪微博為例[J];電視研究;2011年02期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 申玉;;大學(xué)生對社會媒體價值觀教育功能的認(rèn)知[A];第十一屆全國心理學(xué)學(xué)術(shù)會議論文摘要集[C];2007年
2 黃清源;;微博控制的維系與消解——傳播政治經(jīng)濟學(xué)視野中的微博研究[A];首屆華中地區(qū)新聞與傳播學(xué)科研究生學(xué)術(shù)論壇獲獎?wù)撐腫C];2010年
3 雷群明;;編輯與名家書稿[A];多出精品 多出人才——中國編輯學(xué)會第八屆年會論文集[C];2003年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 朱冰;萬維社會媒體大災(zāi)時方顯神通[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2008年
2 姜永育;社會媒體報道亟待疏導(dǎo)[N];中國氣象報;2005年
3 張榮忠;美國警察重視與社會媒體合作互動[N];人民公安報;2011年
4 特約評論員 安替;十年反恐戰(zhàn)爭 進入社交媒體階段[N];21世紀(jì)經(jīng)濟報道;2011年
5 陳恩濤;社會媒體廣泛宣傳安徽郵政發(fā)展成就[N];中國郵政報;2008年
6 Ben Adams 編譯 胡德良;FDA發(fā)布制藥界利用社會媒體的新意見[N];醫(yī)藥經(jīng)濟報;2014年
7 王琳 本報記者 張夢穎;增進交流、消除疑慮和隔閡是社會媒體的職責(zé)所在[N];中國社會科學(xué)報;2012年
8 哈佛尼曼學(xué)者、專欄作家 安替;以開放來回應(yīng)暴力[N];21世紀(jì)經(jīng)濟報道;2011年
9 記者 蘇軍;過度依賴讀圖 思維能力降低[N];文匯報;2009年
10 記者 李雙雙;昆明“微政務(wù)”發(fā)揮“政能量”[N];昆明日報;2014年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 杜建光;面向社會媒體的文本和屬性分析技術(shù)研究[D];北京理工大學(xué);2015年
2 丁效;基于社會媒體的市場行情預(yù)測方法研究[D];哈爾濱工業(yè)大學(xué);2016年
3 付博;面向社會媒體的用戶消費意圖分析關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年
4 沈鈞戈;基于社會媒體的旅游數(shù)據(jù)挖掘與個性化推薦[D];西安電子科技大學(xué);2016年
5 郭亮;基于社會媒體挖掘的社會化搜索研究[D];北京郵電大學(xué);2014年
6 韓曉暉;Web社會媒體中信息的質(zhì)量評價及應(yīng)用研究[D];山東大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 戚鳳國;信息社會媒體播放產(chǎn)品生命周期的轉(zhuǎn)變[D];南京藝術(shù)學(xué)院;2009年
2 葉爾郎·馬季耶夫;論社會媒體對中國治理的影響[D];復(fù)旦大學(xué);2013年
3 董瑜;社會媒體實體關(guān)聯(lián)網(wǎng)絡(luò)的復(fù)雜性研究[D];杭州電子科技大學(xué);2015年
4 袁多利;基于中文社會媒體分析的股票行為預(yù)測[D];合肥工業(yè)大學(xué);2013年
5 丁緒武;基于興趣圖譜的社會化電子商務(wù)社區(qū)發(fā)現(xiàn)研究[D];上海工程技術(shù)大學(xué);2015年
6 張鑫;面向社會媒體的中文文本校對方法研究與實現(xiàn)[D];黑龍江大學(xué);2015年
7 張一博;基于社會媒體的社交圈識別研究[D];哈爾濱工業(yè)大學(xué);2012年
8 樸雅寧;社會媒體病毒營銷的信息轉(zhuǎn)發(fā)與跟蹤統(tǒng)計模式[D];吉林大學(xué);2014年
9 李翔;微博中影響力的研究[D];中國科學(xué)技術(shù)大學(xué);2014年
,本文編號:1277258
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1277258.html