【摘要】:研究背景: 近年來(lái)循證醫(yī)學(xué)(evidence based medicine)得到了迅速發(fā)展,基于meta分析的循證醫(yī)學(xué)研究結(jié)果也作為較高級(jí)別的證據(jù)來(lái)指導(dǎo)臨床實(shí)踐。目前,在診斷試驗(yàn)評(píng)價(jià)領(lǐng)域,診斷試驗(yàn)meta分析方法因不能滿足應(yīng)用需求,而使得這一領(lǐng)域的研究受到關(guān)注。診斷試驗(yàn)的meta分析方法目前應(yīng)用最多的是RutterGatsonis(2001)提出的HSROC (hierarchical summary receiver-operator curves)模型和Reitsma等人(2005)提出的雙變量隨機(jī)效應(yīng)模型(bivariate random-effects model)。 HSROC模型考慮了不同診斷界值對(duì)靈敏度和特異度的影響,是目前處理涉及不同診斷界值診斷試驗(yàn)meta分析的主要方法。雙變量隨機(jī)效應(yīng)模型最初主要是用于分析理論上認(rèn)為實(shí)際的或者潛在的診斷界值是固定時(shí)的情況。Harbord (2007)已經(jīng)證明當(dāng)不考慮協(xié)變量時(shí),上述HSROC模型和雙變量隨機(jī)效應(yīng)模型是等價(jià)的。此外,診斷試驗(yàn)meta分析方法還有Holling (2012)提出的PHM方法(proportional hazards model approach), Doebler (2012)提出的將基于logit變化的雙變量隨機(jī)效應(yīng)模型擴(kuò)展到基于tα族變換的雙變量隨機(jī)效應(yīng)模型,Rucker(2010)提出的基于加權(quán)Youden的SROC (summary receiver operating characteristics)模型,另外還有基于bayes的模型,以及我系研究生劉江美于2013年提出的以加權(quán)Youden指數(shù)作為合并效應(yīng)量的meta分析方法。Rutter的HSROC模型和Reitsma等的雙變量隨機(jī)效應(yīng)模型是目前應(yīng)用最廣的模型。上述模型普遍存在三個(gè)重大缺陷:一是診斷界值的確定過(guò)分理想化,與現(xiàn)實(shí)脫節(jié);二是假設(shè)靈敏度和特異度均服從二項(xiàng)分布且相互獨(dú)立,與靈敏度和特異度高度相關(guān)這一事實(shí)相悖;三是僅僅利用了靈敏度、特異度信息,忽略了診斷界值及診斷指標(biāo)的分布信息。 診斷界值的確定方法,有基于Youden指數(shù)也有基于ROC曲線的確定方法。其中Youden指數(shù)是靈敏度和特異度之和,它將靈敏度和特異度的重要性同等看待。但是,在臨床診斷的應(yīng)用中,由于疾病的性質(zhì)不同,對(duì)于靈敏度和特異度的權(quán)重要求也不同。針對(duì)這一實(shí)際問(wèn)題,李丹玲和陳平雁提出了加權(quán)Youden指數(shù),將加權(quán)Youden指數(shù)定義為Jw=2[w·SEN+(1-w)·SPE]-1其中0≤w≤1,進(jìn)一步滿足了臨床應(yīng)用的需求,但是將權(quán)重的確定問(wèn)題留給了應(yīng)用的一方。 關(guān)于加權(quán)Youden指數(shù)中權(quán)重的確定方法,Pepe (2003)和PerkinsSchisterman (2006)分別提出了基于疾病發(fā)病率和錯(cuò)分類相對(duì)代價(jià)(relative costs of misclassification)的方法,但是這兩種方法中所用到的疾病發(fā)病率和相對(duì)代價(jià)在現(xiàn)實(shí)中都很難獲得。Rucker(2010)提出的基于加權(quán)Youden指數(shù)的SROC meta分析模型中給出了基于logistic分布的權(quán)重估計(jì)方法,但是并未經(jīng)過(guò)模擬驗(yàn)證。因此,關(guān)于權(quán)重的確定問(wèn)題有待新方法的誕生。 研究目的: 本研究的目的:①在正態(tài)分布和logistic分布假設(shè)下,基于加權(quán)Youden指數(shù)確定最佳診斷界值的準(zhǔn)則,建立估計(jì)靈敏度、特異度、最佳診斷界值及加權(quán)Youden指數(shù)的方差及置信區(qū)間的參數(shù)和非參數(shù)方法;②將Rucker (2010)提出的確定權(quán)重的方法推廣到更一般的情形,并用Monte Carlo方法進(jìn)行驗(yàn)證;③提出新的基于最大加權(quán)Youden指數(shù)的SROC模型,并通過(guò)模擬驗(yàn)證。 方法: 1.參數(shù)方法采用delta法構(gòu)建靈敏度、特異度、最佳診斷界值及加權(quán)Youden指數(shù)的方差及置信區(qū)間;非參數(shù)方法采用bootstrap方法構(gòu)建構(gòu)靈敏度、特異度、最佳診斷界值及加權(quán)Youden指數(shù)的方差及置信區(qū)間;用Mome Carlo方法驗(yàn)證其正確性并比較兩種方法的優(yōu)劣。 2.理論推導(dǎo),對(duì)Rucker(2010)提出的權(quán)重估計(jì)方法進(jìn)行推廣,并在正態(tài)分布及l(fā)ogistic分布假設(shè)下用Monte Carlo方法進(jìn)行驗(yàn)證,根據(jù)理論推導(dǎo)給出方便的權(quán)重確定工具。 3.構(gòu)建基于最大加權(quán)Youden指數(shù)的SROC模型,用模擬及實(shí)例驗(yàn)證其合理性。 結(jié)果: 1、基于最大加權(quán)Youden指數(shù)診斷界值選擇及其置信區(qū)間構(gòu)建 1.1參數(shù)方法 ①正態(tài)分布假設(shè)下 加權(quán)Youden指數(shù)計(jì)算公式為Jw=2[w·SEN+(1-w)·SPE]-1,其中0w1,要使加權(quán)Youden指數(shù)取得最大值等價(jià)于使w·SEN+(1-w)·SPE取得最大值,我們可以表示為使得λ·SEN+(1-λ)·SPE取得最大值。假設(shè)病人中診斷指標(biāo)D~N(μD,σ2D),對(duì)照組中診斷指標(biāo)H~N(μH,σ2H),則基于最大加權(quán)Youden的最佳診斷界值c為: 上式中有可能小于0,即存在無(wú)解的情況,此時(shí)加權(quán)Youden指數(shù)隨著診斷界值的變化是單調(diào)的。此時(shí)可以分成以下幾種情況:α)uDuH,b≥1,λ≥0.5,此時(shí)必然有解; b) uDuH b1,λ0.5,此時(shí)存在無(wú)解的可能,在這種無(wú)解的情況下,隨著診斷界值增大加權(quán)Youden在增大,而且此時(shí)2(1-λ)Sp的增速大于2λSe的減速; c) uDuH, b1,λ.5,此時(shí)存在無(wú)解的可能,在這種無(wú)解的情況下,隨著診斷界值增大加權(quán)Youden在減小,而且此時(shí)2(1-λ)SP的增速小于2λSe的減速; d) uDuH b≤1,λ≤0.5,此時(shí)必然有解; e) uDuH, b≥1,λ≥0.5,此時(shí)必然有解; f) uDuH, b1,λ0.5,此時(shí)存在無(wú)解的可能,在這種無(wú)解的情況下,隨著診斷界值增大加權(quán)Youden在減小,而且此時(shí)2(1-λ)Sp的減速大于2λSe的增速; g) uDuH, b1, λ0.5,此時(shí)存在無(wú)解的可能,在這種無(wú)解的情況下,隨著診斷界值增大加權(quán)Youden在增大,而且此時(shí)2(1-λ)Sp的減速小于2λSe的增速; h) uDuH, b≤1,λ≤0.5,此時(shí)必然有解。 當(dāng)上式有解時(shí),若令c1c2,則當(dāng)b1時(shí)c=c2,當(dāng)b1時(shí)c=c1。當(dāng)b=1時(shí), 界值c的方差用delta法推導(dǎo),置信區(qū)間根據(jù)正態(tài)近似法構(gòu)建;赿elta法的Var(c)可構(gòu)建如下: ②Logistic分布假設(shè)下 假設(shè)病人中診斷指標(biāo)D~Logistic(mD,bD),對(duì)照組診斷指標(biāo)H~Logistic(mH,bH)。求使加權(quán)Youden取到最大值的c等價(jià)于求如下式子的解: 當(dāng)β1,λ=0.5時(shí),解上式可得 當(dāng)β1,λ未知時(shí),解上式可得取使得t 大于0的解,則c=mD-bDln(t)。上式也可能有兩個(gè)解,此時(shí)取選擇使得加權(quán)Youden最大的解,上式也可能存在無(wú)解的情況: a)當(dāng)mDmH,λO.5時(shí),無(wú)解情況下必然是隨著診斷界值的增高Youden單調(diào)遞減,2(1-λ)Sp的增速小于22Se的減速; b)當(dāng)mDmH,λO.5時(shí),無(wú)解情況下必然是隨著診斷界值的增高Youden單調(diào)遞增,2(1-λ)SP的增速大于22Se的減速; c)當(dāng)mDmH,λ0.5時(shí),無(wú)解情況下必然是隨著診斷界值的增高Youden單調(diào)遞增,2(1-λ)Sp的減速小于2λSe的增速; d)當(dāng)mDmH,λ0.5時(shí),無(wú)解情況下必然是隨著診斷界值的增高Kouden單調(diào)遞增,2(1-λ)Sp的減速大于22Se的增速。 當(dāng)β和λ均未知時(shí)上式?jīng)]有解析解,此時(shí)利用泰勒展開法求近似解,上式左邊可以在1處進(jìn)行泰勒展開,求近似解得: 取使得t*大于0的解,則c=mD-bDln(t)。 上述所有c的估計(jì)值c可以通過(guò)將λ,β,q代入各式中求得。上式同樣會(huì)出現(xiàn)無(wú)解的情況,此時(shí)隨著界值的變化加權(quán)Youden指數(shù)單調(diào)。 c的方差同樣采用delta法估計(jì),置信區(qū)間構(gòu)建為基于delta法的Var(c)可構(gòu)建如下: 1.2非參數(shù)方法 現(xiàn)實(shí)應(yīng)用中當(dāng)我們不依賴背后的分布時(shí),常采用基于樣本數(shù)據(jù),計(jì)算每個(gè)樣本取值為界值時(shí),其對(duì)應(yīng)的加權(quán)Youden指數(shù),然后選擇使得加權(quán)Youden指數(shù)取得最大值的界值。這種方法我們把它叫做最佳診斷界值的非參數(shù)估計(jì)方法。非參數(shù)方法中最佳診斷界值的方差及置信區(qū)間采用bootstrap方法構(gòu)建。 第一種bootstrap (BP)方法,策略1是將原有的樣本進(jìn)行重抽樣,重復(fù)B次找出第α/2及1-α/2分位數(shù)構(gòu)建置信區(qū)間,可以稱之為非參數(shù)的bootstrap方法;策略2是基于樣本估算的參數(shù),如樣本均值和標(biāo)準(zhǔn)差,從背后的分布中重新抽樣,如正態(tài)分布,模擬B次找出第α/2及1-α/2分位數(shù)構(gòu)建置信區(qū)間,可以稱之為參數(shù)的bootstrap方法。策略2相比較與策略1的優(yōu)勢(shì)在于在meta分析中,當(dāng)我們無(wú)法獲得原始數(shù)據(jù)時(shí)較實(shí)用。 第二種為矯正bias的bootstrap方法:bias corrected and accelerated bootstrap(BCa)。 第三種正態(tài)近似法(AN),用bootstrap重抽樣后先計(jì)算診斷界值的方差,然后基于正態(tài)近似構(gòu)建置信區(qū)間。 1.3模擬研究 從模擬研究結(jié)果我們得出,基于delta法及bootstrap方法構(gòu)建的診斷界值置信區(qū)間,其覆蓋率都非常接近設(shè)定的95%,可以滿足我們的應(yīng)用需求。在滿足參數(shù)法條件時(shí),參數(shù)法不論是從bias還是從MSE來(lái)評(píng)價(jià)都要大大優(yōu)于非參數(shù)法。另外我們也得出,參數(shù)法無(wú)解時(shí)模擬中采用的用樣本最大值或最小值去估計(jì)診斷界值的方法是不可行的,會(huì)增大bias。另外模擬結(jié)果還發(fā)現(xiàn)當(dāng)靈敏度或特異度接近0或1的極端情況時(shí)非參數(shù)法失效,但有待后續(xù)進(jìn)一步驗(yàn)證。 總體來(lái)看,當(dāng)滿足參數(shù)方法條件時(shí)我們推薦優(yōu)先選擇參數(shù)法,雖然參數(shù)法存在無(wú)解情況,但是現(xiàn)實(shí)應(yīng)用中給靈敏度特異度設(shè)置一個(gè)下限,例如0.5,就可以避免無(wú)解情況的出現(xiàn),而且也非常符合現(xiàn)實(shí)需求。 2、最大加權(quán)Youden指數(shù)及對(duì)應(yīng)靈敏度、特異度置信區(qū)間構(gòu)建 2.1參數(shù)方法 ①正態(tài)分布假設(shè)下 不失一般性,令uDuH則:根據(jù)delta法靈敏度、特異度及加權(quán)Youden指數(shù)的方差可以構(gòu)建如下: 置信區(qū)間根據(jù)正態(tài)近似法可以構(gòu)建為: ②Logistic分布假設(shè)下不失一般性,令mpmH則:Se=Ψ(mp-c/bD)、Sp=Ψ(c-mH/bH根據(jù)delta法靈敏度、特異度和加權(quán)Youden 指數(shù)的方差可以構(gòu)建如下: 根據(jù)正態(tài)近似法可以構(gòu)建置信區(qū)間為: 2.2非參數(shù)方法 當(dāng)用非參數(shù)的方法選擇診斷界值時(shí),其對(duì)應(yīng)的最大加權(quán)Youden指數(shù)和相應(yīng)靈敏度、特異度的置信區(qū)間均采用bootstrap方法估計(jì)。其估計(jì)策略與診斷界值估計(jì)策略相同。 2.3模擬研究 模擬結(jié)果顯示,當(dāng)滿足參數(shù)法條件時(shí),不論是靈敏度、特異度還是最大加權(quán)Youden指數(shù),參數(shù)法的結(jié)果不論是從bias還是從MSE指標(biāo)均大大優(yōu)于非參數(shù)的方法,甚至在樣本量為50時(shí)參數(shù)法都優(yōu)于非參數(shù)法在樣本量為300時(shí)的結(jié)果。用delta法構(gòu)建的靈敏度、特異度還是最大加權(quán)Youden指數(shù)的95%置信區(qū)間其覆蓋率絕大多數(shù)都在93%~96%區(qū)間,其中大部分小于95%,而且隨著樣本量的增加不斷接近95%,基本滿足實(shí)際應(yīng)用的需求。 靈敏度在正態(tài)分布各種參數(shù)下,非參數(shù)法估計(jì)值均偏高,但是偏高的幅度基本上都在0.05以內(nèi)。Logistic分布下,當(dāng)β1.5,λ=0.8時(shí),參數(shù)法非參數(shù)法估計(jì)值均偏低,參數(shù)法結(jié)果偏低主要是受無(wú)解情況嚴(yán)重造成的,其他參數(shù)情況下參數(shù)法均能較好的估計(jì)真值,但是非參數(shù)法估計(jì)值均偏高,這與正態(tài)分布下情況相同,偏離的幅度也都在0.05以內(nèi)。非參數(shù)置信區(qū)間構(gòu)建中AN法普遍低于95%,BP法當(dāng)樣本量較大的時(shí)候普遍大于95%,而且BP法在小樣本中尤其是權(quán)重不是0.5時(shí),基本失效。整體來(lái)看AN法的結(jié)果較BP法更接近95%。兩種分布下都出現(xiàn)當(dāng)真值越偏離0.5時(shí),置信區(qū)間越偏離95%的現(xiàn)象。當(dāng)λ=0.8時(shí),兩種bootstrap方法均失效,也就是當(dāng)靈敏度真值較大時(shí),本次研究中均為大于90%,模擬中用到的bootstrap方法均失效,樣本量越大越明顯。 特異度在正態(tài)分布各種參數(shù)下非參數(shù)法估計(jì)值均偏高,但是偏高的幅度基本上都在0.05以內(nèi)。Logistic分布下,當(dāng)β0.8,λ=0.8時(shí),非參數(shù)法估計(jì)值均偏低,其他情況下非參數(shù)法估計(jì)值均偏高,這與正態(tài)分布下情況相同,當(dāng)λ=0.8時(shí)偏離的幅度大于0.3,其他情況偏離幅度都在0.05以內(nèi),主要原因是λ=0.8時(shí)特異度的真值接近0。非參數(shù)法置信區(qū)間構(gòu)建中AN法普遍低于95%,BP法當(dāng)樣本量較大的時(shí)候普遍大于95%,而且BP法在小樣本中,基本失效。整體來(lái)看AN法的結(jié)果較BP法更接近95%。兩種分布下都出現(xiàn)當(dāng)真值越偏離0.5時(shí),置信區(qū)間越偏離95%的現(xiàn)象。當(dāng)λ=0.8時(shí),兩種bootstrap方法均失效,也就是當(dāng)特異度接近0時(shí),模擬中用到的bootstrap方法均失效,樣本量越大越明顯。 整體來(lái)看,當(dāng)靈敏度特異度接近1或0時(shí)非參數(shù)法估計(jì)均有較大偏性,模擬中用到的bootstrap置信區(qū)間構(gòu)建法均失效。 最大加權(quán)Youden指數(shù)非參數(shù)法均嚴(yán)重高估,樣本量50、100時(shí)25%分位數(shù)都要大于真值,樣本量為300時(shí)25%分位數(shù)與真值接近。兩種非參數(shù)置信區(qū)間法在所有情況下均失效,當(dāng)用10000次模擬結(jié)果的均值代替真值計(jì)算95%置信區(qū)間是其覆蓋率與95%接近。所以本次模擬懷疑用非參數(shù)法求加權(quán)Youden指數(shù)以及Youden指數(shù)時(shí),其估計(jì)結(jié)果不是無(wú)偏估計(jì),均要高于真實(shí)值。但是從診斷界值及靈敏度特異度估計(jì)結(jié)果來(lái)看,當(dāng)加權(quán)Youden指數(shù)僅僅作為一個(gè)決策標(biāo)準(zhǔn)時(shí),相應(yīng)的診斷界值及靈敏度特異度能滿足實(shí)際應(yīng)用的需要。 3、加權(quán)Youden指數(shù)權(quán)重估計(jì) 3.1理論推導(dǎo) 若用F、f和G、g分別表示病人及對(duì)照人群中診斷指標(biāo)的累積分布函數(shù)和概率密度函數(shù),則有: 其中c為使得加權(quán)Youden指數(shù)取得最大值時(shí)的診斷界值,Se和Sp為對(duì)應(yīng)的靈敏度和特異度。 ①正態(tài)分布假設(shè)下 其中Φ,口分別是標(biāo)準(zhǔn)正態(tài)分布的累積分布函數(shù)和概率密度函數(shù)。 ②Logistic分布假設(shè)下 其中bD,bH分別為病人組及對(duì)照組lOgistic分布的scale;參數(shù)。 上述的計(jì)算方法均為反推的算法,即使在診斷指標(biāo)不是根據(jù)最大加權(quán)Youden指數(shù)計(jì)算時(shí),我們用這種方法也可以反推一個(gè)與其對(duì)應(yīng)的權(quán)重λ。我們知道,靈敏度、特異度及加權(quán)Youden指數(shù)均可以表示成關(guān)于診斷界值c的函數(shù),以正態(tài)分布為例,我們發(fā)現(xiàn)c值是關(guān)于權(quán)重λ和病人及對(duì)照組兩組的均值和標(biāo)準(zhǔn)差的函數(shù),因此根據(jù)已知的或者根據(jù)先驗(yàn)信息獲得的病人及對(duì)照組兩組的均值和標(biāo)準(zhǔn)差,我們可以構(gòu)建一條權(quán)重和靈敏度、特異度及加權(quán)Youden指數(shù)的曲線,從而方便現(xiàn)實(shí)中不同研究者根據(jù)臨床需要選擇權(quán)重。 3.2模擬研究 正態(tài)分布下,參數(shù)法權(quán)重計(jì)算結(jié)果完全與設(shè)置的權(quán)重一致,這從整個(gè)理論推導(dǎo)中可以解釋,個(gè)別偏離真值的主要是無(wú)解情況下的估計(jì)方法有偏差造成的。在logistic分布下,因?yàn)閰?shù)法是根據(jù)泰勒展開求得近似解,所以并不能達(dá)到完全與真值一致,估計(jì)偏差嚴(yán)重的主要是無(wú)解情況下替代方法的偏差造成的,結(jié)果中當(dāng)權(quán)重為0.8時(shí)泰勒展開近似法出現(xiàn)了系統(tǒng)性偏差,結(jié)合整個(gè)結(jié)果來(lái)看當(dāng)膨1時(shí)權(quán)重越大這種偏差會(huì)越大,所以我們懷疑β≠1時(shí)權(quán)重越接近1泰勒展開近似性越差,但是從前兩節(jié)的模擬結(jié)果來(lái)看,這種方法在診斷界值確定及相應(yīng)指標(biāo)方差置信區(qū)間構(gòu)建上能滿足應(yīng)用需要。 非參數(shù)方法不論是在正態(tài)分布還是logistic分布假設(shè)下,當(dāng)權(quán)重設(shè)置為0.5時(shí),估計(jì)效果均較好,當(dāng)權(quán)重小于0.5時(shí)估計(jì)值偏低,當(dāng)大于0.5是估計(jì)值偏高,樣本量越大越接近真值。 整體來(lái)看,不論參數(shù)法還是非參數(shù)法都能滿足現(xiàn)實(shí)應(yīng)用需要,參數(shù)法要優(yōu)于非參數(shù)法。 4、基于最大加權(quán)Youden指數(shù)診斷界值的SROC新模型 4.1模型構(gòu)建 在正態(tài)分布假設(shè)下,當(dāng)時(shí),令可以推出 式子中a可以用α=Φ-1(Se)+Φ-1(Sp)估計(jì),也可以直接用已知的分布參數(shù)估計(jì),那么通過(guò)上式就可以構(gòu)建基于最大加權(quán)Youden指數(shù)的ROC曲線,五為0時(shí)令Se為0Sp為1,λ為1時(shí)Ap為0Se為1,確定了a后令λ從0取值到1,就可以構(gòu)建一條ROC曲線;而且這種方法還可以通過(guò)選擇λ不同值,在ROC上取值,相比傳統(tǒng)的ROC有其獨(dú)特的優(yōu)勢(shì)。因此我們就可以在原有的ROC曲線上添加一條權(quán)重的坐標(biāo)軸。 當(dāng)用于meta分析時(shí),我們只需對(duì)a進(jìn)行估計(jì)。 當(dāng)文中有提供兩組均值標(biāo)準(zhǔn)差時(shí): 當(dāng)文中沒(méi)有提供兩組均值標(biāo)準(zhǔn)差時(shí):αi=Φ-1(Sei)+Φ-1(Spi) 當(dāng)b≠1時(shí),最佳診斷入靈敏度和特異度的計(jì)算公式,我們同樣可以得到權(quán)重對(duì)靈敏度特異度的表達(dá)式,構(gòu)建ROC曲線,但是上面計(jì)算診斷界值c的式子存在無(wú)解的情況,此時(shí)權(quán)重不能取遍整個(gè)(0,1)區(qū)間,但是可以考慮給靈敏度、特異度設(shè)定一個(gè)下限,然后繪制部分與權(quán)重對(duì)應(yīng)的ROC曲線,也就是權(quán)重的坐標(biāo)軸只是(0,1)區(qū)間中的某個(gè)子集。 當(dāng)用于meta分析時(shí),我們很容易可以得出也就可以構(gòu)建模型β·scD+scH=α。然后對(duì)每個(gè)研究的α、β的估計(jì)值做meta分析。 當(dāng)文中有提供兩組均值標(biāo)準(zhǔn)差時(shí): 當(dāng)文中沒(méi)有提供兩組均值標(biāo)準(zhǔn)差時(shí): 式子中權(quán)重的估計(jì)借鑒Rucker的策略,將雙變量隨機(jī)效應(yīng)模型合并后的靈敏度和特異度代入權(quán)重計(jì)算公式中計(jì)算,這里的β可以用其他研究β的合并值估計(jì),當(dāng)完全沒(méi)有信息時(shí)令β=1。 對(duì)于每個(gè)研究的權(quán)重,提出兩種方法: 方法一:考慮要將有提供均值和標(biāo)準(zhǔn)差的跟只有靈敏度和特異度的區(qū)別對(duì)待,根據(jù)各個(gè)研究的樣本量,提出如下簡(jiǎn)易的權(quán)重設(shè)置方法: 當(dāng)有均值標(biāo)準(zhǔn)差信息時(shí): 當(dāng)沒(méi)有均值標(biāo)準(zhǔn)差信息時(shí):wi=(1/TPi+1/FNi+1/TNi+1/FPi)-1 方法二:逆方差法 假設(shè)b=1時(shí): 當(dāng)文中有提供兩組均值標(biāo)準(zhǔn)差的情況時(shí): 當(dāng)文中沒(méi)有提供兩組均值標(biāo)準(zhǔn)差的情況時(shí): Var(αi)采用基于參數(shù)bootstrap法的AN法估計(jì),假設(shè)健康人組服從標(biāo)準(zhǔn)正態(tài)分布,則病人組服從均值和標(biāo)準(zhǔn)差分別為αi和1的正態(tài)分布,然后可模B次,計(jì)算每一次的αb=Φ-1(Seb)+Φ-1(Spb),求Var(α)。 假設(shè)b≠1時(shí): 當(dāng)文中有提供兩組均值標(biāo)準(zhǔn)差情況時(shí): 利用delta法 當(dāng)文中沒(méi)有提供兩組均值標(biāo)準(zhǔn)差的情況時(shí): Var(αi),Var(βi)采用基于參數(shù)bootstrap法的AN法估計(jì),假設(shè)健康人組服從標(biāo)準(zhǔn)正態(tài)分布,則病人組服從均值和標(biāo)準(zhǔn)差分別為αi,β的正態(tài)分布,這里αi用每個(gè)研究的估計(jì)值,β用上述方法一合并后的估計(jì)值而且只能用匯總的估計(jì)值,然后可模擬B次,利用估算出的權(quán)重λ,計(jì)算每一次的和αb=βbΦ-1(Seb)+Φ-1(Spb),求Var(α),Var(β)。這里需要說(shuō)明的是bootstrap中用到的β必須為匯總的β,因?yàn)樵谡龖B(tài)分布下當(dāng)樣本量固定時(shí)方差越小對(duì)應(yīng)樣本均值和標(biāo)準(zhǔn)差的變異越小,所以當(dāng)改用每個(gè)研究的βi時(shí),βi越小其對(duì)應(yīng)的方差就越小,也就造成βi在用逆方差方法合并時(shí)其對(duì)應(yīng)的權(quán)重就越大,結(jié)果使得β的估計(jì)值嚴(yán)重偏小。 根據(jù)估計(jì)出的α,β就可以繪制我們新提出的融合權(quán)重在內(nèi)的SROC曲線。 4.2模擬研究 從模擬結(jié)果來(lái)看,權(quán)重設(shè)置方法一雖然不能估算異質(zhì)性τ,但是從α和β的估算來(lái)看要比方法二要穩(wěn)定,除了均值和標(biāo)準(zhǔn)差均已知的情況之外,其他情況下方法二MSE都要大于方法一,尤其是方法二中的bootstrap估計(jì)結(jié)果造成很多極端值得產(chǎn)生,β估計(jì)值中極端值現(xiàn)象尤為嚴(yán)重。當(dāng)完全基于各研究提供的均值和標(biāo)準(zhǔn)差來(lái)做meta分析時(shí),我們可以看到,方法一方法二的估計(jì)效果都很理想,從bias及MSE來(lái)看要遠(yuǎn)遠(yuǎn)優(yōu)于其他情況下結(jié)果,在這種情況下推薦使用方法二,因?yàn)榉椒ǘ㧏ias和MSE均比方法一小,而且可以估算異質(zhì)性。當(dāng)數(shù)據(jù)中只有靈敏度和特異度時(shí),方法一提供的方法可以有效估計(jì),但是目前有很多方法可以處理這樣的數(shù)據(jù),所以不推薦使用本文提供的方法,因?yàn)榉椒ㄒ恢荒芄烙?jì)匯總效應(yīng)量,而方法二bootstrap方法計(jì)算耗時(shí)。當(dāng)數(shù)據(jù)是兩種數(shù)據(jù)的混合時(shí),我們看到不管是方法一還是方法二,均值標(biāo)準(zhǔn)差的應(yīng)用都大大降低了bias和MSE,所以從這一方面來(lái)講利用分布參數(shù)信息是很有必要的,在這種情況下我們推薦使用方法一,其相比方法二從模擬結(jié)果來(lái)看要穩(wěn)定,bias相差不大但MSE要小很多。從模擬結(jié)果我們發(fā)現(xiàn)當(dāng)診斷界值為隨機(jī)產(chǎn)生時(shí),用本文提供的方法也可以合理估計(jì)結(jié)果。 綜上我們推薦,當(dāng)數(shù)據(jù)中均值和標(biāo)準(zhǔn)差均已知時(shí)使用本文提出的方法二,當(dāng)各個(gè)研究只提供靈敏度、特異度的信息時(shí)可以使用HSROC模型,當(dāng)兩種數(shù)據(jù)匯合時(shí),目前來(lái)講使用本文提供的方法一較好,方法二在這種情況下需要進(jìn)一步改進(jìn)。 結(jié)論: 本研究創(chuàng)造性地建立了基于加權(quán)Youden指數(shù)確定最佳診斷界值及其置信區(qū)間的方法,同時(shí)建立了對(duì)應(yīng)的靈敏度、特異度及加權(quán)Youden指數(shù)的置信區(qū)間估計(jì)方法。本研究提出了基于加權(quán)Youden指數(shù)的操作性較強(qiáng)的靈敏度和特異度的權(quán)重確定方法,方便了加權(quán)Youden指數(shù)的使用;谖覀兊耐茖(dǎo),我們創(chuàng)新性的建立了新的SROC模型,相比現(xiàn)有模型它能更充分利用各研究中提供的均值、標(biāo)準(zhǔn)差及診斷界值的信息,提高參數(shù)估計(jì)的精度和檢驗(yàn)效能。
【圖文】:
健康人中均服從logistic分布的變量X。我們進(jìn)一步假設(shè)經(jīng)變換后的變量JiT在病人中的期望大于在健康人中的期望,如下圖1-2所示。則X在健康以及病人中的分布函數(shù)可以表示為如下公式(1-1):Pr(X < XI healthy) - —~l + e'd (1-1)Pr(X < XI disease)=——1 + e其中《>0,y5>0。X在病人及健康人中期望值的差值為郵’其在兩人群中標(biāo)準(zhǔn)差的比值為l/yff。當(dāng)0^1時(shí)表示病人中X的變異程度比健康人大,當(dāng)時(shí)相反。圖1中給出的是0<化1的情形。若用C表示診斷界值,則根據(jù)公式(1-1)得 c-e、(c+/)及 logit(FPR) =-c,同理可得 logit(7Pi?)=a-加,可以表示為<Hogit(FPi?)=-c、ij=logit(TPR)=Orfic。從中我們進(jìn)一步可以得出tj = (X + (1-2)根據(jù)Rutter & Gatsonis的叫法,我們把a(bǔ)叫做精確度參數(shù)(accuracyparameter), yS叫做比例參數(shù)或者對(duì)稱性參數(shù)(scale or asymmetry parameter)。如果,1,則基于公式(1-2)可以推導(dǎo)出其對(duì)應(yīng)的ROC對(duì)稱

undifferentiated arthritis)這類高危病人預(yù)測(cè)其患風(fēng)濕性關(guān)節(jié)炎的診斷研究為例,從其原文中可提取原始數(shù)據(jù)為下表2-4,直方圖見(jiàn)圖2-3。從直方圖中我們可以看出,兩組數(shù)據(jù)基本服從正態(tài)分布,因此我們根據(jù)正態(tài)分布下的計(jì)算方法分別用參數(shù)法和非參數(shù)法計(jì)算,計(jì)算結(jié)果見(jiàn)下表2-5及2-6。從表2-5及2-6結(jié)果可以看出參數(shù)法和非參數(shù)法計(jì)算結(jié)果很接近,結(jié)合應(yīng)用背景,考慮到此CPR應(yīng)用中更關(guān)注特異度,則根據(jù)計(jì)算結(jié)果,我們選擇權(quán)重小于0.3時(shí)可以使得特異度在90%以上,,小于0.1時(shí)可以使特異度達(dá)到98%以上。表2-4 兩組CPR得分原始數(shù)據(jù) Score RA(?=175) Non-RA(w=387)0 0 i1 0 82 0 423 0 584 6 785 13 736 22 637 38 378 33 169 36 610 17 511 8 012 1 013 1 014 0 0Mean±Sd 7.760±1.771 4.682±1.88930
【學(xué)位授予單位】:南方醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:R-03
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 Tao Jin;Wei Huang;Kun Jiang;Jun-Jie Xiong;Ping Xue;Muhammad A Javed;Xiao-Nan Yang;Qing Xia;;Urinary trypsinogen-2 for diagnosing acute pancreatitis:a meta-analysis[J];Hepatobiliary & Pancreatic Diseases International;2013年04期
2 袁先武;何仕欽;黎阿龍;;胃癌相關(guān)抗原MG7-Ag對(duì)胃癌診斷價(jià)值的Meta分析[J];國(guó)際檢驗(yàn)醫(yī)學(xué)雜志;2014年05期
3 楊琴;曹軍皓;丁進(jìn)亞;洪純;周杉;孫麗;;血清降鈣素原、白細(xì)胞介素6和C反應(yīng)蛋白在膿毒血癥和全身炎癥反應(yīng)綜合征鑒別診斷中的意義[J];臨床軍醫(yī)雜志;2013年07期
4 焦偉;付承;劉萬(wàn)里;柴君杰;;細(xì)粒棘球絳蟲5種天然抗原制劑診斷效能的初步評(píng)價(jià)[J];中國(guó)寄生蟲學(xué)與寄生蟲病雜志;2013年05期
5 Wen Chen;Jun-Hua Fan;Wei Luo;Peng Peng;Si-Biao Su;;Effectiveness of interferon-gamma release assays for differentiating intestinal tuberculosis from Crohn's disease:A meta-analysis[J];World Journal of Gastroenterology;2013年44期
6 Yu-Biao Xu;Yu-Long Bai;Zhi-Gang Min;Shan-Yu Qin;;Magnetic resonance cholangiography in assessing biliary anatomy in living donors:A meta-analysis[J];World Journal of Gastroenterology;2013年45期
7 Xiang Li;Wei Xu;Jian Shi;Yong Lin;Xin Zeng;;Endoscopic ultrasound elastography for differentiating between pancreatic adenocarcinoma and inflammatory masses:A meta-analysis[J];World Journal of Gastroenterology;2013年37期
8 廖華芳;黃靄雯;王湘慧;汪佩蓉;謝予鑫;;臺(tái)灣地區(qū)三種兒童發(fā)展篩查量表的信效度簡(jiǎn)介[J];中國(guó)康復(fù);2013年06期
9 余華香;李云黨;劉云芳;;可溶性細(xì)胞間黏附分子-1診斷新生兒敗血癥的系統(tǒng)評(píng)價(jià)[J];中國(guó)現(xiàn)代醫(yī)生;2014年06期
10 李麗英;唐曉初;李蘭;;1,5-脫水葡萄糖醇對(duì)糖尿病診斷價(jià)值的Meta分析[J];醫(yī)學(xué)綜述;2014年09期
相關(guān)博士學(xué)位論文 前1條
1 李丹玲;基于靈敏度和特異度任意賦權(quán)的評(píng)價(jià)診斷試驗(yàn)的統(tǒng)計(jì)推斷方法[D];南方醫(yī)科大學(xué);2013年
相關(guān)碩士學(xué)位論文 前6條
1 孫瑜;乳腺專用伽馬成像作為鉬靶診斷乳腺癌進(jìn)一步檢查手段臨床應(yīng)用的Meta分析[D];廣西醫(yī)科大學(xué);2013年
2 陳利華;肺癌的表觀擴(kuò)散系數(shù)值與腫瘤細(xì)胞密度的關(guān)系及其診斷價(jià)值[D];第三軍醫(yī)大學(xué);2013年
3 劉江美;Meta分析中加權(quán)Youden指數(shù)的合并效應(yīng)量估計(jì)方法[D];南方醫(yī)科大學(xué);2013年
4 呂柏錕;基于Meta-analysis的個(gè)性化診斷標(biāo)志物的尋找及其在新生兒膿毒血癥中的應(yīng)用[D];蘇州大學(xué);2014年
5 王寅中;釓塞酸二鈉的臨床應(yīng)用研究—對(duì)肝臟惡性腫瘤診斷價(jià)值的Meta分析及對(duì)肝細(xì)胞期適宜延遲時(shí)間的初步探討[D];蘭州大學(xué);2014年
6 林金鳳;糞便鈣衛(wèi)蛋白檢測(cè)對(duì)炎癥性腸病活動(dòng)度的診斷效能的Meta分析[D];南方醫(yī)科大學(xué);2014年
本文編號(hào):
2702528