Logit模型參數(shù)估計方法的研究
本文關鍵詞:Logit模型參數(shù)估計方法的研究
【摘要】:近年來,統(tǒng)計學與機器學習得到了深入的發(fā)展,數(shù)據(jù)正以前所未有的速度產(chǎn)生著,越來越多的統(tǒng)計模型在計算機領域得到了廣泛深入的應用,其中l(wèi)ogit模型發(fā)揮了重要的作用.此外,logit模型在處理經(jīng)濟、生物醫(yī)藥、金融、語音以及圖像識別上逐漸顯示出良好的特性. 而對于logit模型的參數(shù)估計,人們一般根據(jù)訓練樣本構造極大似然函數(shù),結(jié)合擬牛頓法或者梯度下降法對目標函數(shù)進行逐步優(yōu)化,來得到模型參數(shù)的估計值.這種參數(shù)求解方法有以下幾個局限性.首先是這種方法對于初值的選取有較大的依賴,而且并不能保證得到全局最優(yōu)解;其次是進行求解的過程中,迭代的速度以及得到的結(jié)果的精度并沒有成型的結(jié)論. 此外,這種方法只考慮使用模型的離散的輸出變量來進行參數(shù)估計,并沒有考慮數(shù)據(jù)的內(nèi)在結(jié)構,在實際運用中,受到了較大的限制.由于logit模型在經(jīng)濟、金融、生物等領域取得了不錯的成果,所以研究這個模型參數(shù)求解的其他方法對于更好地發(fā)揮模型的效用有著較大的意義.Logit模型的基本假設是事件發(fā)生的對數(shù)機會比是各輸入變量的線性函數(shù).本文中對樣本進行分組的思想正是基于此.在logit模型中,輸入變量會對事件發(fā)生的概率產(chǎn)生影響.對于給定的一個輸入,會以一定的概率得到一個輸出.由此,得到這樣一個思想,給定一組樣本,這組樣本的輸入變量有的相同,有的不同,我們根據(jù)樣本數(shù)據(jù)的輸入變量,將輸入變量相同的樣本分為一組,然后分別統(tǒng)計各組的事件發(fā)生頻率,這樣可以得到多組不同輸入條件下的事件發(fā)生的頻率.這種通過對模型中的潛變量進行估計,繼而進行模型的參數(shù)估計的方法,克服了極大似然估計參數(shù)估計方法忽視數(shù)據(jù)內(nèi)在結(jié)構的弊端,提高了參數(shù)估計的精度.本文在對模型中的潛變量進行估計后,提出了兩種基于不同目標函數(shù)的參數(shù)估計方法.其中,基于分組數(shù)據(jù)的最小二乘估計方法由于并非是迭代求解,所以對初值的依賴性在這里不存在,而且在樣本量比較大時,算法所耗費的時間遠遠少于通過迭代進行參數(shù)估計的算法;此外基于分組數(shù)據(jù)的EM算法選定了基于核函數(shù)的目標函數(shù),并且在目標函數(shù)中根據(jù)各分組樣本量的不同,設置了不同的權重,克服了基于數(shù)據(jù)分組的最小二乘估計方法對于各分組樣本量分布的敏感性.在這兩種基于數(shù)據(jù)分組的參數(shù)估計方法中,我們采用事件發(fā)生的頻率來對事件發(fā)生的概率進行估計.其中基于分組數(shù)據(jù)最小二乘估計方法大大降低了估計的時間與空間的復雜度,基于分組數(shù)據(jù)的EM估計方法,在迭代求解過程中,對各個分組的樣本量以及誤差進行了考量,在算法穩(wěn)定性上表現(xiàn)良好.在實際應用中,我們可以結(jié)合三種方法對模型參數(shù)進行估計,能夠更好地處理各類分類問題.
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:F224
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 邱醒杰;付明珍;宣潔;;基于二元logit模型的購房意愿分析——以濟南為例[J];中國外資;2013年12期
2 丁友剛;宋獻中;;基于多元logit模型的國有企業(yè)高管更換決策機理研究[J];統(tǒng)計研究;2011年06期
3 劉芳;;面板logit模型研究綜述[J];現(xiàn)代商貿(mào)工業(yè);2010年21期
4 盧永艷;王維國;;基于面板logit模型的上市公司財務困境預測[J];數(shù)學的實踐與認識;2010年05期
5 周宇;雷漢云;;基于logit模型的信用擔保風險研究[J];山東社會科學;2008年07期
6 劉芳;;基于面板logit模型的上市公司財務困境實證分析——以裝備制造業(yè)為例[J];經(jīng)濟視角(下);2011年09期
7 朱廣俊;;宏觀經(jīng)濟因素對匯率制度選擇的影響——基于多元離散排序logit模型的實證分析[J];現(xiàn)代經(jīng)濟信息;2013年21期
8 丁金平;;基于成本效益的Logit模型分析[J];商業(yè)會計;2014年11期
9 鄒鑫;李莉莉;房琳;;基于Logit和KMV的我國上市公司信用風險的比較研究[J];青島大學學報(自然科學版);2014年02期
10 劉梅;杜麗麗;張曉;;基于logit模型的農(nóng)戶有機肥施用意愿及影響因素分析——以山東為例[J];安徽農(nóng)業(yè)科學;2010年09期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 顧兆軍;任振強;;應用Logit模型建模旅客航線選擇行為[A];2009年研究生學術交流會通信與信息技術論文集[C];2009年
2 程海波;;股票投資價值的logit模型研究——對滬市A股制造行業(yè)的實證分析[A];中國會計學會財務管理專業(yè)委員會2009年學術年會論文集[C];2009年
3 黎志成;廖雪珍;胡斌;;運用logit回歸方法進行組合定性預測[A];2001年中國管理科學學術會議論文集[C];2001年
4 Yunhui Miao;Jiafu Tang;Gang Qu;;Behavior Prediction of Telecom Consumers' Choice with Packages Based on Improved Nested Logit Model[A];第25屆中國控制與決策會議論文集[C];2013年
5 王玨;張奇;胡藍藝;汪壽陽;;基于Logit與SVM的銀行業(yè)信用風險預警模型研究[A];中國系統(tǒng)工程學會第十八屆學術年會論文集——A10系統(tǒng)工程方法在金融、投資、保險業(yè)等領域的研究[C];2014年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 周博見;基于路徑的Logit型隨機用戶均衡模型求解算法研究[D];東南大學;2015年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 白文娟;基于Logit與KMV模型的信用風險研究[D];東北財經(jīng)大學;2015年
2 張亞寧;城市交通擁堵定價研究[D];東北財經(jīng)大學;2016年
3 孫海云;Logit模型參數(shù)估計方法的研究[D];浙江大學;2016年
4 位剛;偏Logit模型及其應用研究[D];西北農(nóng)林科技大學;2011年
5 褚冬琳;基于logit模型的制造業(yè)上市公司財務預警分析[D];福州大學;2011年
6 賈偉娜;Mixed logit模型及其應用研究[D];寧波大學;2011年
7 郭靜;基于logit模型的全裝修住房選擇研究[D];西安建筑科技大學;2014年
8 張睿;Mixed Logit模型及其在農(nóng)村居民就醫(yī)地點選擇分析中的應用[D];西南財經(jīng)大學;2014年
9 任漢;基于面板數(shù)據(jù)Logit模型的美國系統(tǒng)性風險研究[D];中國科學技術大學;2015年
10 曹勝杰;基于logit模型的商業(yè)銀行信用風險量化管理[D];西南財經(jīng)大學;2011年
,本文編號:1176067
本文鏈接:http://sikaile.net/jingjifazhanlunwen/1176067.html