因果推斷是一門建立在統(tǒng)計學(xué)科基礎(chǔ)上發(fā)展起來的專門用于研究事物間因果關(guān)系的學(xué)科.近代自然科學(xué)誕生后,越來越多的科學(xué)家提出了各自對“因”和“果”的理解,從Laplace的“決定論因果觀”到Hume的“經(jīng)驗論因果觀”,期間經(jīng)過了不斷演變與融合,至今形成了如今被大眾廣泛接受的“概率論因果觀”.作為以量子理論和概率論為基礎(chǔ)發(fā)展起來的一門科學(xué),因果推斷自誕生以來就被廣泛應(yīng)用于社會科學(xué)各領(lǐng)域,如教育研究、行為研究、心理測量學(xué)、經(jīng)濟計量學(xué)、社會學(xué)及流行病學(xué)和生物統(tǒng)計學(xué)等.如統(tǒng)計推斷常遇到的數(shù)據(jù)一樣,因果推斷涉及到的數(shù)據(jù)也是復(fù)雜多樣的,通常有高維和低維、線性和非線性或部分線性、連續(xù)型和離散型以及缺失和完全數(shù)據(jù)等等.隨著數(shù)據(jù)類型的不同,使用的因果推斷方法也不一樣,從一開始的基于貝葉斯條件概率的無模型因果推斷,到后來的含噪聲項的有模型因果推斷,再發(fā)展到如今的各種關(guān)于復(fù)雜數(shù)據(jù)的因果推斷.在現(xiàn)有的有模型的因果推斷研究中,主要是以線性回歸模型和非線性回歸模型這兩種模型為研究對象探索其因果機制.鑒于實際數(shù)據(jù)常常不是完全的線性或者非線性關(guān)系,如果仍用線性模型或非線性模型來對它們的因果關(guān)系進行探索,將可能得到錯誤的結(jié)論,應(yīng)采用兩者的“混合”——部分線性回歸模型.然而,到目前為止,還未有針對部分線性模型做因果推斷的相關(guān)研究,因此本文著眼于研究部分線性模型的因果推斷,以期能在更多的領(lǐng)域中實現(xiàn)因果推斷的價值.本文對國內(nèi)外相關(guān)問題和線性、非線性、部分線性模型的研究歷史與現(xiàn)狀進行了綜合評述,針對現(xiàn)有的線性模型和非線性模型的因果推斷理論做了簡要的概述.在此基礎(chǔ)上,提出了基于部分線性核化跡方法的部分線性模型的因果推斷方法.該方法主要分為兩個步驟:第一是通過運用再生核希爾伯特空間理論和基于罰函數(shù)的Profile局部最小二乘方法,估計部分線性模型的未知非線性函數(shù)和未知參數(shù)矩陣;第二是建立適用于部分線性模型的因果判斷準(zhǔn)則,以便可以通過該準(zhǔn)則來確定部分線性數(shù)據(jù)的因果關(guān)系.為能夠?qū)⒃摲椒◤V泛地運用于各個學(xué)科領(lǐng)域,本文還提出了針對離散型數(shù)據(jù)的部分線性因果推斷方法并加以實例驗證.隨后進行統(tǒng)計模擬分析,驗證本文所提出方法的合理性.并就一些重要定理給出具體的證明.本文最后應(yīng)用所提方法進行了實證研究,進行單灶性乳頭狀甲狀腺癌轉(zhuǎn)移的成因分析.在此項案例研究里,考慮到數(shù)據(jù)的病理變量具有較高維度,且響應(yīng)變量(癌轉(zhuǎn)移)是離散型變量,故在對甲狀腺癌數(shù)據(jù)進行部分線性因果分析前,進行了數(shù)據(jù)降維、相關(guān)性診斷、癌轉(zhuǎn)移變量的連續(xù)化處理、變量連續(xù)化的驗證等工作,在保證癌轉(zhuǎn)移變量連續(xù)化的合理性的前提下,繼續(xù)對經(jīng)過連續(xù)化后的新變量和降維后的病理變量采用部分線性模型核化跡方法進行因果分析.在這個過程中,相關(guān)性診斷是為了說明相關(guān)關(guān)系和因果關(guān)系的不同,實際情況說明詳見后文.最后對全文做了一個簡要的總結(jié)以及指出了未來可以進一步研究的方向.模擬分析和實證研究結(jié)果顯示,本文提出的部分線性模型的因果推斷算法——部分線性模型核化跡方法,以及基于線性判別分析基礎(chǔ)上的離散變量連續(xù)化方法能夠合理地對不同領(lǐng)域的數(shù)據(jù)進行因果分析.本文的方法具有以下幾個優(yōu)點,第一,不限維度,低維和高維都適用;第二,不限變量的類型,離散和連續(xù)都適用;第三,該方法適用于具有部分線性關(guān)系的數(shù)據(jù).
【學(xué)位單位】:浙江財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:O212
【部分圖文】:
LDA投影的可視化圖

中央?yún)^(qū)轉(zhuǎn)移與否的重要程度(樹的數(shù)目=5000)
【參考文獻】
相關(guān)期刊論文 前10條
1 劉松平;趙銘;王連臣;柯延壯;;甲狀腺癌頸部中央?yún)^(qū)淋巴結(jié)轉(zhuǎn)移對側(cè)區(qū)的影響[J];中國現(xiàn)代醫(yī)學(xué)雜志;2016年07期
2 周衍琪;劉靜頤;王越;;“部分線性模型”研究文獻綜述[J];商;2015年13期
3 張浩;郝志峰;蔡瑞初;溫雯;;基于互信息的適用于高維數(shù)據(jù)的因果推斷算法[J];計算機應(yīng)用研究;2015年02期
4 樊孝菊;鄭午;王成勇;;PPI與CPI關(guān)系的再研究:基于非線性Granger因果檢驗[J];統(tǒng)計與決策;2013年20期
5 劉鴻翔;耿直;;具有部分依從現(xiàn)象的臨床試驗中因果效應(yīng)的上下界估計[J];湖北第二師范學(xué)院學(xué)報;2010年08期
6 魏傳華;李靜;吳喜之;;部分線性模型基于參數(shù)信息的統(tǒng)計推斷[J];數(shù)學(xué)的實踐與認識;2009年19期
7 劉鴻翔;耿直;陳華;;具有不依從現(xiàn)象的臨床試驗中平均處理效應(yīng)的上下界估計[J];湖北大學(xué)學(xué)報(自然科學(xué)版);2009年01期
8 劉鴻翔;耿直;;具有有序依從個體臨床試驗中因果效應(yīng)的Bayesian分析[J];湖北大學(xué)學(xué)報(自然科學(xué)版);2007年02期
9 李國柱 ,張舉剛 ,黃本春;因果關(guān)系檢驗方法研究[J];統(tǒng)計與決策;2005年07期
10 耿直;觀察性研究與混雜因素[J];統(tǒng)計與信息論壇;2004年05期
本文編號:
2860721
本文鏈接:http://sikaile.net/kejilunwen/yysx/2860721.html