【摘要】:研究背景:自發(fā)呈報(bào)系統(tǒng)數(shù)據(jù)庫(kù)是藥品不良反應(yīng)監(jiān)測(cè)的重要依據(jù),是實(shí)現(xiàn)有效藥物警戒的基石,隨著時(shí)間的推移、數(shù)據(jù)的積累以及國(guó)家對(duì)藥品安全性問(wèn)題的重視,上報(bào)至國(guó)家藥品不良反應(yīng)監(jiān)測(cè)中心的不良反應(yīng)報(bào)告日益增多,至2017年底我國(guó)自發(fā)呈報(bào)系統(tǒng)收集到的報(bào)告已超過(guò)1100萬(wàn)份。由于《藥品不良反應(yīng)報(bào)告和監(jiān)測(cè)管理辦法》要求藥品生產(chǎn)企業(yè)、經(jīng)營(yíng)企業(yè)和醫(yī)療機(jī)構(gòu)發(fā)現(xiàn)藥品不良反應(yīng)均應(yīng)進(jìn)行上報(bào),以及錄入跟蹤報(bào)告時(shí)與之前的首次報(bào)告未進(jìn)行關(guān)聯(lián)等原因,故難以避免重復(fù)報(bào)告的問(wèn)題。且近期國(guó)家食品藥品監(jiān)督管理總局頒布《關(guān)于藥品上市許可持有人直接報(bào)告不良反應(yīng)事宜的公告》,要求藥品上市許可持有人必須報(bào)告藥品不良反應(yīng),又會(huì)帶來(lái)新的重復(fù)報(bào)告問(wèn)題。重復(fù)報(bào)告的存在會(huì)引起假陽(yáng)性或假陰性不良反應(yīng)信號(hào),從而影響藥品不良反應(yīng)信號(hào)檢測(cè)的準(zhǔn)確性。如何利用統(tǒng)計(jì)學(xué)方法從海量的不良反應(yīng)數(shù)據(jù)中有效地識(shí)別并去除其中的重復(fù)報(bào)告,從而為之后的不良反應(yīng)信號(hào)檢測(cè)提供可靠的數(shù)據(jù),是當(dāng)前亟待解決的問(wèn)題。研究目的:本研究以我國(guó)藥品不良反應(yīng)自發(fā)呈報(bào)系統(tǒng)數(shù)據(jù)庫(kù)為依托,主要探索兩部分內(nèi)容。首先對(duì)我國(guó)不良反應(yīng)數(shù)據(jù)庫(kù)重復(fù)報(bào)告現(xiàn)狀進(jìn)行初步分析,構(gòu)建適用于我國(guó)數(shù)據(jù)庫(kù)結(jié)構(gòu)的變量匹配模型、概率匹配模型和編輯距離法模型,經(jīng)過(guò)比較篩選出去除重復(fù)報(bào)告的最優(yōu)模型。其次使用最優(yōu)模型識(shí)別并剔除我國(guó)不良反應(yīng)數(shù)據(jù)庫(kù)中的重復(fù)報(bào)告,重新檢測(cè)不良反應(yīng)信號(hào),探索重復(fù)報(bào)告對(duì)信號(hào)檢測(cè)的影響程度,為下一步藥品不良反應(yīng)信號(hào)檢測(cè)提供高質(zhì)量數(shù)據(jù)。研究方法:方法學(xué)研究:首先,按照?qǐng)?bào)告日期隨機(jī)抽取一個(gè)月的數(shù)據(jù),使用變量匹配法找出疑似重復(fù)報(bào)告,然后通過(guò)雙人分開(kāi)對(duì)比報(bào)告中的其他變量,找出其中的重復(fù)報(bào)告,獲得重復(fù)報(bào)告金標(biāo)準(zhǔn)數(shù)據(jù)庫(kù),為模型評(píng)判做準(zhǔn)備;其次,以重復(fù)報(bào)告金標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)為依托,將三種方法運(yùn)用到該數(shù)據(jù)中,從姓名、性別、出生日期、藥品名稱(chēng)、不良反應(yīng)、不良反應(yīng)發(fā)生日期六個(gè)變量中,選擇不同變量組合,組成四種情境(情境1:姓名、性別、出生日期、藥品名稱(chēng)、不良反應(yīng)、不良反應(yīng)發(fā)生日期;情境2:姓名、出生日期、藥品名稱(chēng)、不良反應(yīng)、不良反應(yīng)發(fā)生日期;情境3:姓名、性別、藥品名稱(chēng)、不良反應(yīng)、不良反應(yīng)發(fā)生日期;情境4:姓名、藥品名稱(chēng)、不良反應(yīng)、不良反應(yīng)發(fā)生日期),以查全率與查準(zhǔn)率組成的綜合指標(biāo)F1-Measure為評(píng)判指標(biāo),構(gòu)建最優(yōu)的變量匹配模型、概率匹配模型和編輯距離模型。為了提高運(yùn)行效率,概率匹配模型和編輯距離模型使用多次查找技術(shù)。實(shí)例應(yīng)用:將三種模型應(yīng)用到2014年國(guó)家藥品不良反應(yīng)數(shù)據(jù)中,識(shí)別其中的重復(fù)報(bào)告,將重復(fù)報(bào)告剔除后重新進(jìn)行信號(hào)檢測(cè),并與未去除重復(fù)的信號(hào)檢測(cè)結(jié)果進(jìn)行比較,分析重復(fù)報(bào)告去除前后的新增信號(hào)和消失信號(hào),將新增和消失信號(hào)與已知的不良反應(yīng)數(shù)據(jù)庫(kù)進(jìn)行比對(duì),對(duì)結(jié)果進(jìn)行解釋。研究結(jié)果:1.方法學(xué)研究:(1)重復(fù)報(bào)告金標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)本研究從2014年數(shù)據(jù)庫(kù)中,按照?qǐng)?bào)告日期,抽取3月份86882份報(bào)告,使用納入不同變量的變量匹配法(出生日期、藥品名稱(chēng)、不良反應(yīng)、ADR日期;姓名、性別、出生日期、ADR日期;姓名、藥品名稱(chēng)、不良反應(yīng)),找到疑似重復(fù)報(bào)告1280組。經(jīng)過(guò)雙人分開(kāi)對(duì)比民族、體重、電話(huà)、疾病史、病歷號(hào)、報(bào)告人、就醫(yī)單位等其他變量,確定重復(fù)報(bào)告359組。(2)模型結(jié)果經(jīng)過(guò)4種情境的比較,變量匹配模型在情境4,納入姓名、藥品名稱(chēng)、不良反應(yīng)、不良反應(yīng)發(fā)生日期四個(gè)變量時(shí),F1-Measure最高,為58.82%,查全率和查準(zhǔn)率分別為57.10%和60.65%。概率匹配模型在情境2,納入姓名、出生日期、藥品名稱(chēng)、不良反應(yīng)、不良反應(yīng)發(fā)生日期五個(gè)變量,且閾值為38.5時(shí),F1-Measure最高,為74.93%,查全率和查準(zhǔn)率分別為71.59%和78.59%。而編輯距離模型在情境4,納入姓名、藥品名稱(chēng)、不良反應(yīng)、不良反應(yīng)發(fā)生日期四個(gè)變量,且閾值為3.85時(shí),F1-Measure最高,為75.96%,查全率和查準(zhǔn)率分別為74.37%和77.62%。變量匹配模型、概率匹配模型和編輯距離模型分別檢測(cè)出205、257和267組真陽(yáng)性重復(fù)組合。2.實(shí)例應(yīng)用本研究基于國(guó)家藥品不良反應(yīng)自發(fā)呈報(bào)系統(tǒng)2014年1322641份數(shù)據(jù),采用變量匹配模型、概率匹配模型和編輯距離模型分別篩選重復(fù)報(bào)告。變量匹配模型共發(fā)現(xiàn)4191組重復(fù)報(bào)告,重復(fù)報(bào)告發(fā)生率為0.35%,但對(duì)于姓名缺失的報(bào)告,其真實(shí)性令人懷疑。概率匹配模型共發(fā)現(xiàn)5230組重復(fù)報(bào)告,發(fā)生率為0.36%。但對(duì)于僅不良反應(yīng)發(fā)生日期不同的高度重復(fù)報(bào)告中,該模型不能很好的進(jìn)行識(shí)別,比如白細(xì)胞減少和骨髓抑制不良反應(yīng)報(bào)告。編輯距離模型發(fā)現(xiàn)4309組重復(fù)報(bào)告中,發(fā)生率為0.32%,與變量匹配模型相比,編輯距離模型不僅將完全相同的兩條報(bào)告篩選出來(lái),同時(shí)也將存在微小差異的兩條報(bào)告篩選出來(lái);與概率匹配模型相比,編輯距離模型精確度更高,更值得信任。去除重復(fù)報(bào)告前ROR、PRR和IC三種方法分別檢測(cè)出29921、32428和21994個(gè)藥品不良反應(yīng)信號(hào),使用變量匹配模型、概率匹配模型和編輯距離模型去除重復(fù)報(bào)告,ROR方法得到三種模型結(jié)果分別為28803、28612、28739,PRR為31248、31086、31201,IC分別為21242、21050和21155,信號(hào)數(shù)量有一定的減少,但前后變化較小,說(shuō)明現(xiàn)階段重復(fù)報(bào)告對(duì)不良反應(yīng)信號(hào)檢測(cè)影響有限。將去除重復(fù)之后得到的信號(hào)檢測(cè)結(jié)果與去除重復(fù)之前進(jìn)行比較,發(fā)現(xiàn)消失的信號(hào)中90%以上都是假陽(yáng)性信號(hào)。研究結(jié)論:綜上所述,本研究建議使用變量匹配模型(姓名、藥品名稱(chēng)、不良反應(yīng)及其發(fā)生日期)或者編輯距離模型(姓名、藥品名稱(chēng)、不良反應(yīng)及其發(fā)生日期,閾值為3.85)去除我國(guó)藥品不良反應(yīng)數(shù)據(jù)庫(kù)中的重復(fù)報(bào)告,并且需要進(jìn)一步通過(guò)人工來(lái)確定模型篩選出的重復(fù)報(bào)告。雖然現(xiàn)階段我國(guó)藥品不良反應(yīng)重復(fù)報(bào)告發(fā)生率不足1%,但由于《關(guān)于藥品上市許可持有人直接報(bào)告不良反應(yīng)事宜的公告》的存在,重復(fù)報(bào)告的發(fā)生率必將上升,因此一定要重視數(shù)據(jù)庫(kù)中的重復(fù)報(bào)告。
【學(xué)位授予單位】:中國(guó)人民解放軍海軍軍醫(yī)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:R95
【圖文】:
藥品不良反應(yīng)信號(hào)檢測(cè)中重復(fù)報(bào)告的識(shí)別及消除過(guò) 1000 萬(wàn)份報(bào)告[58]。逐漸完善的不良反應(yīng)監(jiān)測(cè)系統(tǒng)為上市后藥品安全性監(jiān)管提供了大量的數(shù)據(jù)資源[59],然而,由于不良反應(yīng)報(bào)告主要采取報(bào)告人自發(fā)呈報(bào)的形式,故難以避免多次重復(fù)上報(bào)的問(wèn)題,給不良反應(yīng)信號(hào)監(jiān)測(cè)工作帶來(lái)了巨大的挑戰(zhàn)。重復(fù)報(bào)告(Duplicate Case Safety Reports,DR)是指在數(shù)據(jù)庫(kù)中,存在對(duì)同一患者的同一不良反應(yīng)的多份獨(dú)立報(bào)告[60-63]。在不良反應(yīng)自發(fā)呈報(bào)系統(tǒng)中,造成重復(fù)報(bào)告的原因有多種[64]:一是不同的報(bào)告機(jī)構(gòu),如醫(yī)護(hù)人員、管理機(jī)構(gòu)和制藥企業(yè)可能對(duì)同一例不良反應(yīng)都分別進(jìn)行了上報(bào)。這種情況對(duì)于見(jiàn)刊于文獻(xiàn)的不良反應(yīng)十分普遍,因?yàn)槲墨I(xiàn)報(bào)道會(huì)促使不同的機(jī)構(gòu)都重視并且上報(bào)相應(yīng)的不良反應(yīng)到自發(fā)呈報(bào)系統(tǒng)中(如圖 1-1 所示)。二是同一例不良反應(yīng)的早期報(bào)告與后續(xù)報(bào)告之間銜接問(wèn)題也有可能造成重復(fù)。在我國(guó)不良反應(yīng)數(shù)據(jù)庫(kù)中,錄入跟蹤報(bào)告時(shí)需與之前的首次報(bào)告進(jìn)行關(guān)聯(lián),若未按要求操作,則產(chǎn)生重復(fù)報(bào)告。三是人為主觀或客觀原因造成的重復(fù)報(bào)告。

圖 3-2 概率匹配模型示意圖 中,我們假定 T=t 為一個(gè)潛在的但未觀測(cè)到的真值,不相等的概率為 a,觀測(cè)值缺失的概率為 b,觀測(cè)值值為 i 時(shí)的概率為 P(T=i)=βi,在真值為 i,X 為 j 時(shí)的 T 出現(xiàn)且 X,Y 獨(dú)立的情況下得出:jk i ji ki ip 匹配模型可得:1 (1 )jji jaj ib a j ijb 為空 (2-a-2b),可得:
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王丹;;藥品不良反應(yīng)主動(dòng)監(jiān)測(cè)及其發(fā)展趨勢(shì)[J];中國(guó)藥物警戒;2015年10期
2 何勝;柳益君;葉飛躍;趙小榮;馮新翎;;基于F-measure的網(wǎng)絡(luò)布局評(píng)測(cè)算法實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2015年07期
3 孔文明;沈云良;吳李梅;謝碧波;費(fèi)麗娟;;浙江省部分地區(qū)梅毒疫情重復(fù)報(bào)告情況調(diào)查分析[J];疾病監(jiān)測(cè);2014年08期
4 姜華;韓安琪;王美佳;王崢;吳栻玲;;基于改進(jìn)編輯距離的字符串相似度求解算法[J];計(jì)算機(jī)工程;2014年01期
5 汪婧;榮升格;;基于杰卡德相似性的推薦系統(tǒng)研究[J];安徽工程大學(xué)學(xué)報(bào);2013年03期
6 周典瑞;周蓮英;;海量數(shù)據(jù)的相似重復(fù)記錄檢測(cè)算法[J];計(jì)算機(jī)應(yīng)用;2013年08期
7 約爾尼薩·吾不力卡司木;玉素甫·艾白都拉;;基于最小編輯距離和詞匯庫(kù)的維吾爾語(yǔ)文本校對(duì)系統(tǒng)的設(shè)計(jì)與算法實(shí)現(xiàn)[J];信息與電腦(理論版);2013年06期
8 耿魁魁;劉圣;沈愛(ài)宗;王厚超;汝婷婷;;醫(yī)院信息系統(tǒng)中藥品不良反應(yīng)主動(dòng)監(jiān)測(cè)系統(tǒng)的構(gòu)建[J];中國(guó)醫(yī)院藥學(xué)雜志;2012年14期
9 速麗媛;岳勇;姜曉曼;馬林;韓德琳;;成都市乙型病毒性肝炎重復(fù)報(bào)告分析[J];預(yù)防醫(yī)學(xué)情報(bào)雜志;2012年07期
10 夏佳;張曉蘭;;淺談藥物自發(fā)不良反應(yīng)報(bào)告率估計(jì)與低報(bào)的影響因素[J];藥物流行病學(xué)雜志;2012年01期
相關(guān)會(huì)議論文 前1條
1 張程亮;高萍;趙麗;黃銳;曾繁典;劉東;;我國(guó)藥品不良反應(yīng)信息通報(bào)15年回顧分析[A];2016全國(guó)藥物流行病學(xué)學(xué)術(shù)年會(huì)會(huì)議論文集[C];2016年
相關(guān)博士學(xué)位論文 前1條
1 葉小飛;基于自發(fā)呈報(bào)系統(tǒng)與循證醫(yī)學(xué)的藥品不良反應(yīng)信號(hào)挖掘[D];第二軍醫(yī)大學(xué);2011年
相關(guān)碩士學(xué)位論文 前7條
1 孫潤(rùn)志;基于語(yǔ)義理解的文本相似度計(jì)算研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(沈陽(yáng)計(jì)算技術(shù)研究所);2015年
2 翟桂英;基于歐幾里德幾何距離矩陣法的顱面復(fù)原相似度研究[D];遼寧醫(yī)學(xué)院;2013年
3 胡保祥;基于查詢(xún)?nèi)罩镜牟樵?xún)擴(kuò)展研究[D];北京郵電大學(xué);2013年
4 王昱隆;基于惡意代碼分析的計(jì)算機(jī)取證研究與設(shè)計(jì)[D];東北大學(xué);2012年
5 侯闖;支持壓縮數(shù)據(jù)的近似子串查詢(xún)處理技術(shù)的研究與系統(tǒng)實(shí)現(xiàn)[D];東北大學(xué);2010年
6 劉佳;面向領(lǐng)域的Web服務(wù)流程動(dòng)態(tài)構(gòu)建方法研究[D];山東大學(xué);2009年
7 張好軍;Web數(shù)據(jù)集成中數(shù)據(jù)清洗的關(guān)鍵問(wèn)題研究[D];山東大學(xué);2009年
本文編號(hào):
2732430
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/2732430.html