【摘要】:互聯(lián)網(wǎng)技術(shù)及大數(shù)據(jù)技術(shù)的飛速發(fā)展,大大促進了用戶自動化、多樣化、個性化的金融知識服務(wù)需求,而傳統(tǒng)的金融知識服務(wù)方式、方法已經(jīng)無法滿足用戶日新月異的需要。另一方面,金融大數(shù)據(jù)通常由海量網(wǎng)頁信息、大量的PDF公告、圖片、表格以及實時交易數(shù)據(jù)等形式各異、內(nèi)容多樣的異構(gòu)信息組成。因此,為了給用戶提供更高效、準確的知識服務(wù),亟需異構(gòu)信息處理技術(shù)、數(shù)據(jù)挖掘等方法的支撐。此外,選取金融知識服務(wù)領(lǐng)域中備受關(guān)注的問題和較為活躍的應(yīng)用進行研究,更具應(yīng)用前景和研究價值。基于以上分析,本文研究面向網(wǎng)絡(luò)金融知識服務(wù)的模型與方法,通過互聯(lián)網(wǎng)異構(gòu)信息的獲取和檢索,利用金融本體知識及時間序列分析方法對信息整合和處理,為用戶提供知識服務(wù)。在構(gòu)造網(wǎng)絡(luò)金融知識服務(wù)總體框架基礎(chǔ)上,針對金融領(lǐng)域中用戶關(guān)心的三個主要分支——股票、基金、債券,重點研究了活躍度較高的新股、封閉式基金、企業(yè)債券的知識服務(wù)模型和方法。主要研究內(nèi)容包括:第一,基于互聯(lián)網(wǎng)異構(gòu)信息處理的金融知識服務(wù)總體設(shè)計。目前,專門針對某一領(lǐng)域尤其金融知識服務(wù)領(lǐng)域的異構(gòu)信息處理方法進行結(jié)構(gòu)化、系統(tǒng)化的闡述并不多見,也沒有從基于互聯(lián)網(wǎng)的異構(gòu)信息處理角度提出對金融知識服務(wù)流程、框架的總結(jié)。因此,為了提高金融知識服務(wù)的質(zhì)量和效率,對金融異構(gòu)信息的獲取、處理的方法進行闡述,建立金融異構(gòu)信息處理總體框架。將異構(gòu)信息自動獲取、金融文本與數(shù)據(jù)關(guān)系發(fā)現(xiàn)、信息驗證的過程模塊化,并構(gòu)建金融知識服務(wù)平臺,提供新股、封基、企業(yè)債券等金融領(lǐng)域的實時知識服務(wù)。第二,基于分合增益模型的新股收益分析方法研究。提出N元分合增益問題,建立相應(yīng)增益模型,利用動態(tài)規(guī)劃思想,通過優(yōu)化的最優(yōu)路徑算法、增益計算方法、增益評價方法解決該增益問題,并進行評價。最后,利用該模型解決了新股收益分析問題,計算出一段時間內(nèi)新股的最優(yōu)投資路徑和投資收益率,為投資者、研究機構(gòu)、監(jiān)管機構(gòu)提供橫向、縱向投資對比數(shù)據(jù),為未來新股投資策略提供參考。第三,基于最大熵的新股推薦最優(yōu)策略模型研究。根據(jù)新股申購規(guī)則等約束條件結(jié)合新股數(shù)據(jù)特征,提出基于最大熵的新股推薦最優(yōu)策略模型,實現(xiàn)新股推薦。該模型避免了傳統(tǒng)統(tǒng)計學(xué)軟件對固定算法的依賴性及數(shù)據(jù)特征的局限性,模型中采用了LMT(Logistic Model Tree)分類、多元線性回歸、最大熵方法的結(jié)合,彌補了單一算法的弊端,根據(jù)預(yù)測結(jié)果計算對新股的推薦程度,避免了單獨對股票價格或收益率直接預(yù)測的不確定性和可能出現(xiàn)的較大偏差。實驗表明,提出的模型對新股投資收益路徑的預(yù)測較平均水平有了較大提高。第四,基于神經(jīng)網(wǎng)絡(luò)的封閉式基金時序混合模型。提出了基于BP神經(jīng)網(wǎng)絡(luò)的多模型融合方法,將最大熵模型、趨勢擬合模型、支持向量回歸模型作為神經(jīng)網(wǎng)絡(luò)的輸入,每個輸入模型可以處理不同形式的特征,避免了單一方法中數(shù)據(jù)特征形式的局限性。將該模型應(yīng)用于封閉式基金凈值估值,為用戶提供實時估值參考,且實驗表明,提出的模型比單一估值方法的預(yù)測精度有所提高。第五,基于異構(gòu)信息的企業(yè)債券分析方法研究。為了提供自動化、個性化、高效的金融知識服務(wù),構(gòu)建金融領(lǐng)域本體,提出基于互聯(lián)網(wǎng)的債券檢索評估模型、基于本體規(guī)則自適應(yīng)的特征抽取模型、基于優(yōu)化特征權(quán)重算法的非均衡數(shù)據(jù)分類方法,解決了債券公告檢索過程中的時間敏感性問題、提高了特征自動抽取的準確率、強化了非均衡分類過程中少數(shù)類別特征的分類粒度。通過提出的信息驗證方法對金融知識服務(wù)平臺的信息進行驗證,保證信息準確性。金融知識服務(wù)平臺關(guān)鍵技術(shù)對比實驗分析表明,提出的模型和方法使得基于互聯(lián)網(wǎng)的金融領(lǐng)域檢索問題、特征自動抽取問題及非均衡數(shù)據(jù)分類問題得到了解決和改善。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:F830;TP311.13
【共引文獻】
相關(guān)期刊論文 前10條
1 朱明;陶新民;;基于隨機下采樣和SMOTE的不均衡SVM分類算法[J];信息技術(shù);2012年01期
2 ?±;程龍生;;上市公司財務(wù)困境預(yù)測的改進馬田系統(tǒng)方法[J];技術(shù)經(jīng)濟;2012年04期
3 王紅君;司向飛;岳有軍;;連鑄結(jié)晶器拉坯阻力信號特征提取及識別[J];計算機仿真;2012年02期
4 陶新民;童智靖;劉玉;付丹丹;;基于ODR和BSMOTE結(jié)合的不均衡數(shù)據(jù)SVM分類算法[J];控制與決策;2011年10期
5 焦盛嵐;楊炳儒;翟云;趙萬里;;一種用于非平衡數(shù)據(jù)分類的集成學(xué)習(xí)模型[J];計算機工程與應(yīng)用;2012年29期
6 陶新民;張冬雪;郝思媛;付丹丹;;基于譜聚類欠取樣的不均衡數(shù)據(jù)SVM分類算法[J];控制與決策;2012年12期
7 陶新民;郝思媛;張冬雪;李震;;基于樣本特性欠取樣的不均衡支持向量機[J];控制與決策;2013年07期
8 職為梅;郭華平;范明;;抽樣技術(shù)和CBES分類非平衡數(shù)據(jù)集[J];計算機科學(xué);2013年12期
9 劉余霞;劉三民;劉濤;王忠群;;一種新的過采樣算法DB_SMOTE[J];計算機工程與應(yīng)用;2014年06期
10 杜紅樂;;基于核空間中K-近鄰的不均衡數(shù)據(jù)算法[J];計算機科學(xué)與探索;2015年07期
本文編號:
2801805
本文鏈接:http://sikaile.net/shoufeilunwen/jjglss/2801805.html