天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于文本數(shù)據(jù)的軟集合預(yù)測方法研究

發(fā)布時(shí)間:2018-02-14 08:23

  本文關(guān)鍵詞: 軟集合 軟依賴 軟序列依賴 文本數(shù)據(jù) 預(yù)測 出處:《重慶大學(xué)》2016年博士論文 論文類型:學(xué)位論文


【摘要】:大數(shù)據(jù)時(shí)代,文本數(shù)據(jù)是人們傳播和接受信息的重要途徑之一。企業(yè)利用文本數(shù)據(jù)發(fā)布招聘和優(yōu)惠廣告,新聞機(jī)構(gòu)利用文本數(shù)據(jù)描述正在發(fā)生的事件,公眾利用文本數(shù)據(jù)表達(dá)觀點(diǎn)抒發(fā)情感等。對于企業(yè)和個(gè)人而言,文本數(shù)據(jù)蘊(yùn)含了大量價(jià)值。分析提取文本數(shù)據(jù)中蘊(yùn)含的價(jià)值,是大數(shù)據(jù)時(shí)代取得競爭優(yōu)勢的重要途徑。研究基于文本數(shù)據(jù)的預(yù)測方法則是文本數(shù)據(jù)價(jià)值提取的途徑之一。但自然語言特征、非精確性等不確定性特征阻礙了利用文本數(shù)據(jù)進(jìn)行預(yù)測,有必要尋找處理不確定性特征的合適理論并開發(fā)相應(yīng)預(yù)測方法。軟集合理論是處理不確定性特征的先進(jìn)理論之一。它源于對近似描述問題的研究,以尋找近似解為構(gòu)建理念,使用參數(shù)化集族的方式描述問題,著眼于建立非精確模型解決問題,并得到相應(yīng)的近似解。從理論構(gòu)建理念、問題描述方式和解決路徑來看,軟集合理論適于作為研究不確定性預(yù)測方法的基礎(chǔ)理論。因此,尋找基于文本數(shù)據(jù)的預(yù)測問題和軟集合理論的結(jié)合點(diǎn),構(gòu)建基于文本數(shù)據(jù)的軟集合預(yù)測方法,能夠在發(fā)現(xiàn)、提取文本數(shù)據(jù)蘊(yùn)含價(jià)值的過程中為企業(yè)和個(gè)人提供可靠工具。本文以三個(gè)方面為切入點(diǎn)研究基于文本數(shù)據(jù)的軟集合預(yù)測方法。(1)基于文本數(shù)據(jù)的軟集合特征選擇方法研究。特征選擇階段是基于文本數(shù)據(jù)預(yù)測的重要階段。本文針對該階段以及特征間非精確關(guān)系構(gòu)建了基于文本數(shù)據(jù)的軟集合特征選擇方法(FSST)。該方法提出了新的基于等價(jià)類的軟集合模型,即成對關(guān)系軟集合模型(PRSS),并進(jìn)一步構(gòu)建了近似軟集合、依賴度軟集合和不可分辨關(guān)系軟集合用以處理特征間非精確關(guān)系。成對關(guān)系軟集合模型消除了以往基于等價(jià)類軟集合模型(NSS)的冗余,將衡量特征間依賴程度的運(yùn)算轉(zhuǎn)化為矩陣計(jì)算方式,提升了運(yùn)算效率。使用算例分析詳細(xì)介紹了FSST的執(zhí)行過程。使用16個(gè)樣本數(shù)據(jù)庫分析比較了FSST與基于NSS的特征選擇方法。結(jié)果說明FSST保持了分類精度和可擴(kuò)展性,提高了運(yùn)行效率。(2)基于文本數(shù)據(jù)的軟依賴預(yù)測方法研究。與以往預(yù)測方法相比,該方法利用了軟概率、軟條件概率和軟依賴處理自然語言特征和非精確性的優(yōu)點(diǎn),即能夠處理整個(gè)預(yù)測過程、隨數(shù)據(jù)庫更新動(dòng)態(tài)變化、不需要提供嚴(yán)格的概率穩(wěn)定性假設(shè)、構(gòu)建非精確模型獲取近似解等。首先介紹了軟概率、軟條件概率、軟估計(jì)和軟依賴等基礎(chǔ)理論,然后介紹了方法所解決的預(yù)測問題,并構(gòu)建了基于文本數(shù)據(jù)的軟依賴預(yù)測模型、特征軟集合模型以及依賴軟集合模型。依據(jù)這些模型,構(gòu)建了基于文本數(shù)據(jù)的軟依賴預(yù)測方法。軟依賴預(yù)測模型建立起不考慮時(shí)間滯后效應(yīng)并基于文本數(shù)據(jù)的軟集合預(yù)測問題與軟依賴之間的聯(lián)系。軟依賴預(yù)測模型的具體實(shí)現(xiàn)依賴于特征軟集合模型和依賴軟集合模型。特征軟集合模型整合了FSST方法,能夠處理特征間非精確關(guān)系并將文本數(shù)據(jù)轉(zhuǎn)化為向量空間表示形式。依賴軟集合模型計(jì)算軟估計(jì),完成預(yù)測任務(wù)。同時(shí)針對依賴軟集合模型中存在的空集問題和預(yù)測過程中特征過多問題,提出了尋找近似事件和采用啟發(fā)式算法的解決方案。為了對軟估計(jì)的效果進(jìn)行評估,定義了三種軟估計(jì)誤差度量,即誤差軟映射、單次誤差軟映射和總誤差,并介紹了計(jì)算軟估計(jì)誤差度量所需的點(diǎn)與集合之間誤差度量,即基于Hausdorff距離的Theil不等系數(shù)和基于最小Manhattan距離的Theil不等系數(shù)。算例分析中介紹了基于文本數(shù)據(jù)的軟依賴預(yù)測方法執(zhí)行過程。應(yīng)用分析中使用該方法預(yù)測10家公司8-K報(bào)告對當(dāng)期股價(jià)波動(dòng)的影響,分析了方法的優(yōu)劣勢并與其他預(yù)測方法做了定性比較。結(jié)果說明,基于文本數(shù)據(jù)的軟依賴預(yù)測方法能夠?yàn)椴豢紤]時(shí)間滯后效應(yīng)并基于文本數(shù)據(jù)的軟集合預(yù)測任務(wù)提供支持。(3)基于文本數(shù)據(jù)的軟序列依賴預(yù)測方法研究。該方法利用軟序列概率、軟序列條件概率和軟序列依賴,解決了基于文本數(shù)據(jù)的軟依賴預(yù)測方法無法處理時(shí)間滯后效應(yīng)的問題。由于軟序列依賴是軟依賴在處理樣本序列上的擴(kuò)展,軟序列依賴擁有與軟依賴相同的處理自然語言特征和非精確性的優(yōu)勢。首先根據(jù)軟序列概率、軟序列條件概率定義了軟序列估計(jì)和軟序列依賴,而后介紹了方法所解決的預(yù)測問題,構(gòu)建了基于文本數(shù)據(jù)的軟序列依賴預(yù)測模型和序列依賴軟集合模型。依據(jù)這些模型,構(gòu)建了基于文本數(shù)據(jù)的軟序列依賴預(yù)測方法。基于文本數(shù)據(jù)的軟序列依賴預(yù)測模型建立起考慮時(shí)間滯后效應(yīng)并基于文本數(shù)據(jù)的軟集合預(yù)測問題與軟序列依賴之間的聯(lián)系。軟序列依賴預(yù)測模型的具體實(shí)現(xiàn)依賴于特征軟集合模型和序列依賴軟集合模型。特征軟集合模型將文本數(shù)據(jù)轉(zhuǎn)化為向量空間表示形式。序列依賴軟集合模型計(jì)算軟序列估計(jì),完成預(yù)測任務(wù)。同時(shí)針對序列依賴軟集合模型中存在空集和特征過多問題,分別構(gòu)建了尋找近似事件的方法和啟發(fā)式算法。定義了序列誤差軟映射、序列單次誤差軟映射及序列總誤差對軟序列估計(jì)進(jìn)行評估。算例分析中介紹了基于文本數(shù)據(jù)的軟序列依賴預(yù)測方法執(zhí)行過程,應(yīng)用分析中使用該方法預(yù)測10家公司8-K報(bào)告對滯后一期股價(jià)波動(dòng)的影響。結(jié)果說明,基于文本數(shù)據(jù)的軟序列依賴預(yù)測方法能夠?yàn)榭紤]時(shí)間滯后效應(yīng)并基于文本數(shù)據(jù)的軟集合預(yù)測任務(wù)提供支持。
[Abstract]:......
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:F272

【參考文獻(xiàn)】

相關(guān)期刊論文 前5條

1 袁鼎榮;謝揚(yáng)才;陸廣泉;劉星;;一種新的基于軟集合理論的文本分類方法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期

2 艾偉;孫四明;張峰;;基于本體的Web文本挖掘與信息檢索[J];計(jì)算機(jī)工程;2010年22期

3 洪智勇;秦克云;;基于模糊軟集合理論的文本分類方法[J];計(jì)算機(jī)工程;2010年13期

4 李汶華;郭均鵬;;區(qū)間型符號數(shù)據(jù)回歸分析及其應(yīng)用[J];管理科學(xué)學(xué)報(bào);2010年04期

5 肖智,李瀠兵 ,鐘波,楊秀苔;基于軟集合的企業(yè)競爭力綜合評價(jià)方法研究[J];統(tǒng)計(jì)研究;2003年10期

,

本文編號:1510270

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/xmjj/1510270.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e10fa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com