基于PSP_HDP主題模型的非結(jié)構(gòu)化經(jīng)濟(jì)指標(biāo)挖掘
發(fā)布時間:2021-10-07 20:34
隨著經(jīng)濟(jì)活動數(shù)據(jù)的不斷豐富,互聯(lián)網(wǎng)平臺上產(chǎn)生了大量的財經(jīng)文本,其中蘊含了經(jīng)濟(jì)領(lǐng)域發(fā)展?fàn)顩r的影響因素.如何從這些財經(jīng)文本中有效地挖掘與經(jīng)濟(jì)有關(guān)的經(jīng)濟(jì)要素,是實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)在經(jīng)濟(jì)研究中應(yīng)用的關(guān)鍵.根據(jù)人工構(gòu)建非結(jié)構(gòu)化經(jīng)濟(jì)指標(biāo)的局限性,以及主題模型在非結(jié)構(gòu)化經(jīng)濟(jì)指標(biāo)挖掘中存在的問題,結(jié)合已有經(jīng)濟(jì)領(lǐng)域分類標(biāo)準(zhǔn)、詞語之間的語義關(guān)系和詞語對主題的代表性,定義了文檔的領(lǐng)域隸屬度、詞語與主題的語義相關(guān)度和詞語對主題的貢獻(xiàn)度,用于分別描述CRF(Chinese restaurant franchise)中餐廳的菜肴風(fēng)格、顧客之間對菜肴要求的一致程度和顧客對菜肴的專一程度;結(jié)合文檔領(lǐng)域?qū)傩浴⒃~語語義和詞語在主題中的出現(xiàn)情況,提出了PSPHDP(combining documents’ domain properties,word semantics and words’ presences in topics with HDP)主題模型.由于PSPHDP主題模型改進(jìn)了文檔-主題與主題-詞語的分配過程,從而提高了經(jīng)濟(jì)主題的區(qū)分度和辨識度,可以更有效地挖掘與經(jīng)濟(jì)有...
【文章來源】:軟件學(xué)報. 2020,31(03)北大核心EICSCD
【文章頁數(shù)】:21 頁
【參考文獻(xiàn)】:
期刊論文
[1]百度搜索、風(fēng)險感知與金融風(fēng)險預(yù)測——基于行為金融學(xué)的視角[J]. 羅鵬,陳義國,許傳華. 金融論壇. 2018(01)
[2]基于MRT-LDA模型的微博文本分類[J]. 龐雄文,萬本帥,王盼. 計算機科學(xué). 2017(08)
[3]互聯(lián)網(wǎng)搜索行為能幫助我們預(yù)測宏觀經(jīng)濟(jì)嗎?[J]. 劉濤雄,徐曉飛. 經(jīng)濟(jì)研究. 2015(12)
[4]基于MB-HDP模型的微博主題挖掘[J]. 劉少鵬,印鑒,歐陽佳,黃云,楊曉穎. 計算機學(xué)報. 2015(07)
[5]基于MB-LDA模型的微博主題挖掘[J]. 張晨逸,孫建伶,丁軼群. 計算機研究與發(fā)展. 2011(10)
[6]分層Dirichlet過程及其應(yīng)用綜述[J]. 周建英,王飛躍,曾大軍. 自動化學(xué)報. 2011(04)
本文編號:3422724
【文章來源】:軟件學(xué)報. 2020,31(03)北大核心EICSCD
【文章頁數(shù)】:21 頁
【參考文獻(xiàn)】:
期刊論文
[1]百度搜索、風(fēng)險感知與金融風(fēng)險預(yù)測——基于行為金融學(xué)的視角[J]. 羅鵬,陳義國,許傳華. 金融論壇. 2018(01)
[2]基于MRT-LDA模型的微博文本分類[J]. 龐雄文,萬本帥,王盼. 計算機科學(xué). 2017(08)
[3]互聯(lián)網(wǎng)搜索行為能幫助我們預(yù)測宏觀經(jīng)濟(jì)嗎?[J]. 劉濤雄,徐曉飛. 經(jīng)濟(jì)研究. 2015(12)
[4]基于MB-HDP模型的微博主題挖掘[J]. 劉少鵬,印鑒,歐陽佳,黃云,楊曉穎. 計算機學(xué)報. 2015(07)
[5]基于MB-LDA模型的微博主題挖掘[J]. 張晨逸,孫建伶,丁軼群. 計算機研究與發(fā)展. 2011(10)
[6]分層Dirichlet過程及其應(yīng)用綜述[J]. 周建英,王飛躍,曾大軍. 自動化學(xué)報. 2011(04)
本文編號:3422724
本文鏈接:http://sikaile.net/jingjilunwen/jingjililun/3422724.html
最近更新
教材專著