基于創(chuàng)投媒體的文本挖掘分析創(chuàng)投市場趨勢
發(fā)布時間:2021-08-28 07:00
創(chuàng)投市場一直以來都是金融市場的重要部分,創(chuàng)業(yè)公司的發(fā)展離不開創(chuàng)投市場的資金支持,因此創(chuàng)投市場對于推動經(jīng)濟發(fā)展發(fā)揮著重要的作用。進入18年以來,創(chuàng)投市場的情況一直不容樂觀,被稱為“史上最嚴的資管新規(guī)”出臺,自上而下的進行去杠桿,各路出資方的資金也出現(xiàn)大幅下跌,LP的總量減少,母基金自身募資也比較難,上市公司因為二級市場不景氣也開始削弱出資,因此創(chuàng)投市場的情況比較嚴峻。通過一些直觀的數(shù)據(jù),比如市場上的投資事件數(shù)、投資金額數(shù),在一定程度上可以初步判斷目前的一個市場環(huán)境情況。因此對于一級市場的投資者而言,投資更需要謹慎。如果能通過一些分析提前布局創(chuàng)投市場未來投資熱門賽道,那么投資收益保證就會有很大的成功概率。投資熱度趨勢固然不是唯一的考慮因素,因為還要考慮項目的總體質(zhì)量(比如項目的市場空間、商業(yè)模式、競爭優(yōu)勢、團隊背景等),但是對于投資者的投資判斷還是有很大的幫助,方便進行提早布局和研究。目前關(guān)于創(chuàng)投市場的數(shù)據(jù)相對二級市場股票交易的市場數(shù)據(jù)要少很多,不像二級市場每天有大量的交易數(shù)據(jù)作為參考。創(chuàng)投市場的融資金額或者融資事件數(shù)的直觀統(tǒng)計數(shù)據(jù)相對于創(chuàng)投市場的研究而言較為宏觀,很難進一步深入分析研究。...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖3-1?Scrapy整體架構(gòu)??Scrapy主要是為了爬取網(wǎng)站數(shù)據(jù),可以應(yīng)用在包括數(shù)據(jù)挖掘等程序中
《?;?ss5。撸辏榇??-■?■?.*?:-^?.‘.入m?..;?.-;:;,^:;:-?-;^-u:??;?〇:?.?ju’.廠-;屮.?w?.!私;;:??-:Sl^if£i^{fcSi^feffiSzz±zz|zziii:^SS^^^k??£-J....識£ii5idSgi¥Siixiiti=i!i??*<*'>*???■?-:??*?^?。?"?,?"?,?r?y.u?u??■:::凝遇B?薇門?1:二1—"?、'??圖3-2?python爬蟲數(shù)據(jù)截圖??3.2數(shù)據(jù)預(yù)處理??數(shù)據(jù)預(yù)處理對于后續(xù)的分析結(jié)果至關(guān)重要,如果想要取得理想的結(jié)果,那就??應(yīng)該重視數(shù)據(jù)的預(yù)處理部分。本文主要是對36氪的文章進行文本數(shù)據(jù)清洗,處??理過程如下:??3.2.1文本分詞??文本分詞對于文本挖掘是至關(guān)重要的一步,原始文本數(shù)據(jù)中常常會包含大量??的噪聲信息,一些詞語以及標點符號會反復(fù)出現(xiàn),這類詞對于文本數(shù)據(jù)挖掘而言??并不會提供有用信息,而是作為噪聲存在干擾其他詞,因此分詞的處理直接影響??最后的結(jié)果。本文采用jieba對文本分詞進行處理,包含精確模式、全模式、搜??索引擎模式等三種分詞模式,對于本文而言,選取精確模式更為合適。??>精確模式:將文本句子的分詞進行較為精準的切分,適合文本分析。??>全模式:把句子中所有的可以成詞的詞語都掃描出來,速度非?,可以快??速將文本中的詞語都區(qū)分出來,但是不能有效解決詞語的歧義問題。??>搜索引擎模式:該模式是在精確模式的基礎(chǔ)之上,對較長的詞匯進行再次切??分,相對而言更適用于搜索引擎分詞。??現(xiàn)以“定位理論認為營銷的終極戰(zhàn)場在
圖4-2?36氪發(fā)文數(shù)量(按年統(tǒng)計)??10??
【參考文獻】:
期刊論文
[1]文本挖掘領(lǐng)域研究現(xiàn)狀與趨勢分析[J]. 陶潔. 武漢船舶職業(yè)技術(shù)學(xué)院學(xué)報. 2018(02)
[2]我國科技媒體類網(wǎng)站比較研究——以虎嗅網(wǎng)、鈦媒體和36氪為例[J]. 程海燕. 新聞傳播. 2016(11)
[3]保險資金參與創(chuàng)業(yè)投資的路徑及風險管理研究[J]. 葉穎剛. 上海保險. 2015(12)
[4]LDA主題模型[J]. 鄒曉輝,孫靜. 智能計算機與應(yīng)用. 2014(05)
[5]挖掘中文網(wǎng)絡(luò)客戶評論的產(chǎn)品特征及情感傾向[J]. 李實,葉強,李一軍,羅嗣卿. 計算機應(yīng)用研究. 2010(08)
[6]TFIDF算法研究綜述[J]. 施聰鶯,徐朝軍,楊曉江. 計算機應(yīng)用. 2009(S1)
[7]基于詞性選擇的文本預(yù)處理方法研究[J]. 李英. 情報科學(xué). 2009(05)
[8]基于改進TF-IDF的中文網(wǎng)頁關(guān)鍵詞抽取——以新聞網(wǎng)頁為例[J]. 錢愛兵,江嵐. 情報理論與實踐. 2008(06)
[9]文本挖掘理論概述[J]. 鞏知樂,張德賢. 福建電腦. 2008(09)
[10]基于語義計算的語句相關(guān)度研究[J]. 李素建. 計算機工程與應(yīng)用. 2002(07)
博士論文
[1]資本市場制度對創(chuàng)投機構(gòu)投資戰(zhàn)略與績效的影響研究[D]. 吳剛.對外經(jīng)濟貿(mào)易大學(xué) 2018
[2]基于深度學(xué)習(xí)的文本表示與分類方法研究[D]. 閆琰.北京科技大學(xué) 2016
本文編號:3368043
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖3-1?Scrapy整體架構(gòu)??Scrapy主要是為了爬取網(wǎng)站數(shù)據(jù),可以應(yīng)用在包括數(shù)據(jù)挖掘等程序中
《?;?ss5。撸辏榇??-■?■?.*?:-^?.‘.入m?..;?.-;:;,^:;:-?-;^-u:??;?〇:?.?ju’.廠-;屮.?w?.!私;;:??-:Sl^if£i^{fcSi^feffiSzz±zz|zziii:^SS^^^k??£-J....識£ii5idSgi¥Siixiiti=i!i??*<*'>*???■?-:??*?^?。?"?,?"?,?r?y.u?u??■:::凝遇B?薇門?1:二1—"?、'??圖3-2?python爬蟲數(shù)據(jù)截圖??3.2數(shù)據(jù)預(yù)處理??數(shù)據(jù)預(yù)處理對于后續(xù)的分析結(jié)果至關(guān)重要,如果想要取得理想的結(jié)果,那就??應(yīng)該重視數(shù)據(jù)的預(yù)處理部分。本文主要是對36氪的文章進行文本數(shù)據(jù)清洗,處??理過程如下:??3.2.1文本分詞??文本分詞對于文本挖掘是至關(guān)重要的一步,原始文本數(shù)據(jù)中常常會包含大量??的噪聲信息,一些詞語以及標點符號會反復(fù)出現(xiàn),這類詞對于文本數(shù)據(jù)挖掘而言??并不會提供有用信息,而是作為噪聲存在干擾其他詞,因此分詞的處理直接影響??最后的結(jié)果。本文采用jieba對文本分詞進行處理,包含精確模式、全模式、搜??索引擎模式等三種分詞模式,對于本文而言,選取精確模式更為合適。??>精確模式:將文本句子的分詞進行較為精準的切分,適合文本分析。??>全模式:把句子中所有的可以成詞的詞語都掃描出來,速度非?,可以快??速將文本中的詞語都區(qū)分出來,但是不能有效解決詞語的歧義問題。??>搜索引擎模式:該模式是在精確模式的基礎(chǔ)之上,對較長的詞匯進行再次切??分,相對而言更適用于搜索引擎分詞。??現(xiàn)以“定位理論認為營銷的終極戰(zhàn)場在
圖4-2?36氪發(fā)文數(shù)量(按年統(tǒng)計)??10??
【參考文獻】:
期刊論文
[1]文本挖掘領(lǐng)域研究現(xiàn)狀與趨勢分析[J]. 陶潔. 武漢船舶職業(yè)技術(shù)學(xué)院學(xué)報. 2018(02)
[2]我國科技媒體類網(wǎng)站比較研究——以虎嗅網(wǎng)、鈦媒體和36氪為例[J]. 程海燕. 新聞傳播. 2016(11)
[3]保險資金參與創(chuàng)業(yè)投資的路徑及風險管理研究[J]. 葉穎剛. 上海保險. 2015(12)
[4]LDA主題模型[J]. 鄒曉輝,孫靜. 智能計算機與應(yīng)用. 2014(05)
[5]挖掘中文網(wǎng)絡(luò)客戶評論的產(chǎn)品特征及情感傾向[J]. 李實,葉強,李一軍,羅嗣卿. 計算機應(yīng)用研究. 2010(08)
[6]TFIDF算法研究綜述[J]. 施聰鶯,徐朝軍,楊曉江. 計算機應(yīng)用. 2009(S1)
[7]基于詞性選擇的文本預(yù)處理方法研究[J]. 李英. 情報科學(xué). 2009(05)
[8]基于改進TF-IDF的中文網(wǎng)頁關(guān)鍵詞抽取——以新聞網(wǎng)頁為例[J]. 錢愛兵,江嵐. 情報理論與實踐. 2008(06)
[9]文本挖掘理論概述[J]. 鞏知樂,張德賢. 福建電腦. 2008(09)
[10]基于語義計算的語句相關(guān)度研究[J]. 李素建. 計算機工程與應(yīng)用. 2002(07)
博士論文
[1]資本市場制度對創(chuàng)投機構(gòu)投資戰(zhàn)略與績效的影響研究[D]. 吳剛.對外經(jīng)濟貿(mào)易大學(xué) 2018
[2]基于深度學(xué)習(xí)的文本表示與分類方法研究[D]. 閆琰.北京科技大學(xué) 2016
本文編號:3368043
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3368043.html
最近更新
教材專著