基于文本挖掘技術(shù)的創(chuàng)業(yè)板股票招股說明書風(fēng)險分析
本文關(guān)鍵詞:基于文本挖掘技術(shù)的創(chuàng)業(yè)板股票招股說明書風(fēng)險分析
更多相關(guān)文章: 招股說明書 風(fēng)險信息披露 文本挖掘 特異性風(fēng)險
【摘要】:2009年10月30日,我國籌備許久的創(chuàng)業(yè)板在深圳正式開盤。創(chuàng)業(yè)板的開啟為許多不符合在主板或者中小板上市的中小企業(yè)開通了融資渠道。由于創(chuàng)業(yè)板是主板之外的一種新型資本市場形式,其與主板在市場定位、發(fā)行條件、信息披露和監(jiān)督管理等方面存在差異。同時,由于創(chuàng)業(yè)板企業(yè)更關(guān)注于成長性,往往面臨著更高的風(fēng)險。因此本文針對在創(chuàng)業(yè)板擬上市企業(yè)發(fā)布的招股說明書,對這些創(chuàng)業(yè)板企業(yè)的風(fēng)險信息披露狀況進(jìn)行分析。本文將招股說明書作為研究對象,主要因為招股說明書是上市公司信息披露最重要的法律文獻(xiàn)之一,對投資者,監(jiān)管者具有重要的參考價值。本文對于不同企業(yè)的招股說明書披露的風(fēng)險信息先進(jìn)行量化分析,對其中披露風(fēng)險信息的數(shù)量以及披露風(fēng)險因素所用篇幅進(jìn)行描述性統(tǒng)計,對比不同地區(qū)的企業(yè)風(fēng)險信息披露狀況。在對招股說明書的文本內(nèi)容進(jìn)行分析時,本文引入了文本挖掘技術(shù)。首先,對搜集的招股說明書文本數(shù)據(jù)進(jìn)行了清洗、降噪等預(yù)處理,利用中科院計算技術(shù)研究所研究的漢語詞法分析系統(tǒng)——ICTCLAS,對文本數(shù)據(jù)進(jìn)行分詞處理。將文本非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的存儲模式,之后將文本數(shù)據(jù)降維。企業(yè)在進(jìn)行風(fēng)險披露時,按照其可能影響業(yè)績的重要性依次披露,因此本文提取各個企業(yè)的首要風(fēng)險,對其中關(guān)鍵詞語進(jìn)行分析。利用編程實現(xiàn)TF-IDF算法,詞頻TF展現(xiàn)了不同地區(qū)企業(yè)的共同性風(fēng)險,利用TF-IDF取值提取了不同地區(qū)創(chuàng)業(yè)板擬上市企業(yè)的特異性風(fēng)險,結(jié)合該地區(qū)企業(yè)所屬行業(yè)的分布情況,總結(jié)我國創(chuàng)業(yè)板擬上市企業(yè)對于共同性風(fēng)險披露的特點以及各地企業(yè)特異性風(fēng)險披露狀況。通過對創(chuàng)業(yè)板擬上市企業(yè)招股說明書的披露風(fēng)險研究,本文得出我國創(chuàng)業(yè)板企業(yè)招股說明書中風(fēng)險信息披露的現(xiàn)狀,并對完善披露提出了思考及建議。本文將傳統(tǒng)應(yīng)用于互聯(lián)網(wǎng)的文本挖掘技術(shù),應(yīng)用于傳統(tǒng)的招股說明書的分析,具有創(chuàng)新性,但是本文建立的挖掘模型還不是很完善,模型缺乏連貫性。在之后的研究中,如果可以將預(yù)處理、分詞、特征提取等挖掘模塊集合起來,形成分析流程,對今后招股說明書信息挖掘更有幫助。
【關(guān)鍵詞】:招股說明書 風(fēng)險信息披露 文本挖掘 特異性風(fēng)險
【學(xué)位授予單位】:上海師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:F832.51
【目錄】:
- 中文摘要4-6
- Abstract6-10
- 第1章 緒論10-13
- 1.1 研究的背景與問題的提出10-11
- 1.2 研究的目的與意義11
- 1.3 研究的內(nèi)容、方法與技術(shù)路線11-12
- 1.4 研究的主要貢獻(xiàn)12-13
- 第2章 相關(guān)內(nèi)容文獻(xiàn)綜述13-17
- 2.1 對于招股說明書的研究及成果13-14
- 2.2 企業(yè)風(fēng)險概念的研究14-15
- 2.3 文本信息挖掘研究15-17
- 第3章 基于文本信息挖掘的風(fēng)險分析技術(shù)17-28
- 3.1 中文分詞的主要方法17-19
- 3.1.1 機(jī)械式分詞方法17-18
- 3.1.2 理解分詞方法18
- 3.1.3 ICTCLAS中文分詞系統(tǒng)18-19
- 3.2 文本存儲模型19-22
- 3.2.1 布爾模型20
- 3.2.2 向量空間模型20-21
- 3.2.3 概率模型21-22
- 3.3 文本特征降維22-26
- 3.3.1 文本特征析取22
- 3.3.2 文本特征提取22-23
- 3.3.3 全局特征提取與局部特征提取23
- 3.3.4 有監(jiān)督特征選擇23-26
- 3.4 文本特征加權(quán)26-28
- 第4章 招股說明書中風(fēng)險信息披露的實證分析28-47
- 4.1 創(chuàng)業(yè)板上市公司地區(qū)分布特征28-31
- 4.2 證監(jiān)會對創(chuàng)業(yè)板上市公司風(fēng)險披露的要求31-33
- 4.3 招股說明書披露風(fēng)險量化分析33-37
- 4.3.1 風(fēng)險信息披露數(shù)量分析33-35
- 4.3.2 風(fēng)險信息披露篇幅量分析35-37
- 4.4 首要風(fēng)險分析37
- 4.5 不同地區(qū)企業(yè)的共同風(fēng)險披露狀況37-42
- 4.5.1 不同地區(qū)制造業(yè)企業(yè)的共同風(fēng)險披露狀況39-40
- 4.5.2 不同地區(qū)信息技術(shù)行業(yè)企業(yè)的共同風(fēng)險披露狀況40-42
- 4.6 不同地區(qū)企業(yè)特異性風(fēng)險分析42-44
- 4.7 招股說明書風(fēng)險信息披露狀況及地區(qū)特點44-47
- 4.7.1 不同地區(qū)創(chuàng)業(yè)板擬上市企業(yè)風(fēng)險披露情況44-45
- 4.7.2 招股說明書風(fēng)險信息的現(xiàn)狀和存在問題總結(jié)45-47
- 第5章 結(jié)論47-50
- 5.1 本文結(jié)論47-48
- 5.2 本文創(chuàng)新與改進(jìn)48-50
- 參考文獻(xiàn)50-53
- 致謝53
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張星星;葛察忠;海熱提;;我國上市公司環(huán)境信息披露現(xiàn)狀初步研究[J];環(huán)境保護(hù);2008年06期
2 吳斌,傅偉鵬,鄭毅,劉少輝,史忠植;一種基于群體智能的Web文檔聚類算法[J];計算機(jī)研究與發(fā)展;2002年11期
3 冉秋紅;羅嫣;趙麗;;上市公司智力資本信息披露的實證分析及改進(jìn)設(shè)想[J];經(jīng)濟(jì)管理;2007年22期
4 龐劍鋒,卜東波,白碩;基于向量空間模型的文本自動分類系統(tǒng)的研究與實現(xiàn)[J];計算機(jī)應(yīng)用研究;2001年09期
5 肖華芳;萬文軍;;我國上市公司智力資本信息自愿披露的實證研究[J];會計之友(上旬刊);2009年06期
6 孫學(xué)剛,陳群秀,馬亮;基于主題的Web文檔聚類研究[J];中文信息學(xué)報;2003年03期
7 李婉麗;張婧;;西部地區(qū)上市公司環(huán)境信息披露實證研究[J];青海社會科學(xué);2008年04期
8 張丹;;上市公司智力資本信息披露市場效應(yīng)研究——基于上市公司IPO招股說明書的經(jīng)驗證據(jù)[J];新會計;2009年02期
9 楊乃定;企業(yè)風(fēng)險管理發(fā)展的新趨勢[J];中國軟科學(xué);2002年06期
10 汪宜霞;夏新平;;招股說明書信息含量與新股長期市場表現(xiàn)的實證研究[J];中國會計評論;2004年01期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 蘇力華;基于向量空間模型的文本分類技術(shù)研究[D];西安電子科技大學(xué);2006年
2 丁瓊;基于向量空間模型的文本自動分類系統(tǒng)的研究與實現(xiàn)[D];同濟(jì)大學(xué);2007年
3 種莉萍;基于內(nèi)容分析法的IPO招股說明書中的風(fēng)險信息披露研究[D];山東財經(jīng)大學(xué);2012年
4 張海明;我國上市銀行招股說明書信息披露研究[D];山東大學(xué);2013年
,本文編號:579418
本文鏈接:http://sikaile.net/jingjilunwen/zbyz/579418.html