基于數(shù)據(jù)挖掘的問診平臺文本研究
發(fā)布時間:2020-06-28 03:19
【摘要】:近兩年,醫(yī)患問診平臺的發(fā)展使得患者得以在互聯(lián)網(wǎng)上能夠直接對話醫(yī)生,進而解決一些并不需要到醫(yī)院就能決絕的小問題。同時問診平臺上積累的醫(yī)患問答文本數(shù)據(jù)也為洞察研究患者的需求和醫(yī)生的行為提供了數(shù)據(jù)基礎(chǔ)。本文基于互聯(lián)網(wǎng)的醫(yī)療問診平臺《120快速問醫(yī)生》上脂肪肝相關(guān)的醫(yī)患問答文本,運用統(tǒng)計分析以及數(shù)據(jù)挖掘的方法來研究不同患者群關(guān)注脂肪肝的熱點及其導(dǎo)因、不同醫(yī)生群對患者提出治療建議的思路以及具體的藥品使用情況。本文首先介紹了數(shù)據(jù)來源及如何運用爬蟲技術(shù)對平臺相關(guān)的數(shù)據(jù)進行抓取(包括患者提問數(shù)據(jù)、醫(yī)生回復(fù)數(shù)據(jù));在數(shù)據(jù)預(yù)處理階段,本文運用基于患者buying process編碼的方法對患者的關(guān)注熱點,醫(yī)生的治療建議進行編碼分類;接著建立各分類維度屬性的詞庫,并對基于詞庫對所有文本進行打標(biāo)簽;最后在模型建立部分利用K-means聚類分析、決策樹模型、關(guān)聯(lián)分析,對患者進行聚類并描繪不同群體的畫像、對醫(yī)生治療建議思路進行模擬、對其用藥規(guī)律進行分析。同時本文也站在藥企的角度分析了護肝類藥物易善復(fù)的市場情況。
【學(xué)位授予單位】:東北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:R-05
【圖文】:
95.2%的患者將會是在線問診模式的潛在市場,其中有一部分人雖然沒有醫(yī)院就逡逑仍然希望通過更便利的方式了解造成身體不適的原因。此外,在選擇去醫(yī)院看病逡逑中尚有很大數(shù)量的比例并不需要現(xiàn)場治療,有數(shù)據(jù)稱為70%。如果在線問診服務(wù)逡逑也能使這部分人群的需求得到解決。逡逑今人們獲得各類健康資訊途徑渠道很多,但可信度大多都比較低。各種健康建議逡逑有的建議甚至自相矛盾,讓一般大眾無法分辨,特別是網(wǎng)絡(luò)資訊。許多以健康建逡逑子的內(nèi)容,其真實目的是為醫(yī)療健康產(chǎn)品做廣告。人們對真實的網(wǎng)絡(luò)資訊有強烈逡逑,但可靠的網(wǎng)絡(luò)資訊渠道卻十分有限。人們希望能得到方便快捷、有個性化、更逡逑力的醫(yī)療保健建議。這不涉及真正的醫(yī)學(xué)治療,更多只是從健康習(xí)慣和認識上給逡逑議。在線問診模式中,專業(yè)醫(yī)師將與平臺上為公眾提供具有更高可信度的醫(yī)療健逡逑服務(wù),同時在線問診平臺如果可以建立起自身的公信力,將大大滿足市場的需求。逡逑于幾個主流的在線問診平臺近三年的患者提問量進行了對比分析,其結(jié)果如下圖逡逑
圖3.2邋K-means聚類效果圖逡逑Fig3.2邋Effect邋chart邋of邋K-means邋clustering逡逑關(guān)于聚類模型的性能,我們采用誤差平方和作為準(zhǔn)則函數(shù)來做評判。給定數(shù)據(jù)集X,逡逑其中只包含描述屬性,不包含類別屬性。假設(shè)/包含J個聚類的子集不,毛,...,1.,逡逑各聚類子集中樣本的數(shù)量分別為 ̄邐各個聚類子集的均值點分別為逡逑nip邋/z?2,邋?邋?.,N,则误册惤纺z妥莢蠔哄義希佩澹藉澹椋冢齲玻義希椋劍戾澹穡澹兀赍義隙雜諛P橢械撓戎檔難≡,晤U強梢圓捎帽槔夜盞愕姆椒ǎ哄義希保≡窬劾嗍乃閹鞣段В郟Γ椋睿澹剩睿幔藎璺矗劍埽幔澹海椋睿誨義希玻佑齲竭椋羈嫉劍叔澹藉,重复调用AP泊尉劾嗨惴,得祫αP犯鑫蟛釔椒藉義蝦臀,紦溟Z驕蟛釔椒膠偷玫窖欄銎驕蟛釔椒膠馱疲福誨義希常蜃羆眩手檔扔凇┦溝茫體澹藉澹恚潁ǎ,云2,...,^<偐Ud義
本文編號:2732480
【學(xué)位授予單位】:東北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:R-05
【圖文】:
95.2%的患者將會是在線問診模式的潛在市場,其中有一部分人雖然沒有醫(yī)院就逡逑仍然希望通過更便利的方式了解造成身體不適的原因。此外,在選擇去醫(yī)院看病逡逑中尚有很大數(shù)量的比例并不需要現(xiàn)場治療,有數(shù)據(jù)稱為70%。如果在線問診服務(wù)逡逑也能使這部分人群的需求得到解決。逡逑今人們獲得各類健康資訊途徑渠道很多,但可信度大多都比較低。各種健康建議逡逑有的建議甚至自相矛盾,讓一般大眾無法分辨,特別是網(wǎng)絡(luò)資訊。許多以健康建逡逑子的內(nèi)容,其真實目的是為醫(yī)療健康產(chǎn)品做廣告。人們對真實的網(wǎng)絡(luò)資訊有強烈逡逑,但可靠的網(wǎng)絡(luò)資訊渠道卻十分有限。人們希望能得到方便快捷、有個性化、更逡逑力的醫(yī)療保健建議。這不涉及真正的醫(yī)學(xué)治療,更多只是從健康習(xí)慣和認識上給逡逑議。在線問診模式中,專業(yè)醫(yī)師將與平臺上為公眾提供具有更高可信度的醫(yī)療健逡逑服務(wù),同時在線問診平臺如果可以建立起自身的公信力,將大大滿足市場的需求。逡逑于幾個主流的在線問診平臺近三年的患者提問量進行了對比分析,其結(jié)果如下圖逡逑
圖3.2邋K-means聚類效果圖逡逑Fig3.2邋Effect邋chart邋of邋K-means邋clustering逡逑關(guān)于聚類模型的性能,我們采用誤差平方和作為準(zhǔn)則函數(shù)來做評判。給定數(shù)據(jù)集X,逡逑其中只包含描述屬性,不包含類別屬性。假設(shè)/包含J個聚類的子集不,毛,...,1.,逡逑各聚類子集中樣本的數(shù)量分別為 ̄邐各個聚類子集的均值點分別為逡逑nip邋/z?2,邋?邋?.,N,则误册惤纺z妥莢蠔哄義希佩澹藉澹椋冢齲玻義希椋劍戾澹穡澹兀赍義隙雜諛P橢械撓戎檔難≡,晤U強梢圓捎帽槔夜盞愕姆椒ǎ哄義希保≡窬劾嗍乃閹鞣段В郟Γ椋睿澹剩睿幔藎璺矗劍埽幔澹海椋睿誨義希玻佑齲竭椋羈嫉劍叔澹藉,重复调用AP泊尉劾嗨惴,得祫αP犯鑫蟛釔椒藉義蝦臀,紦溟Z驕蟛釔椒膠偷玫窖欄銎驕蟛釔椒膠馱疲福誨義希常蜃羆眩手檔扔凇┦溝茫體澹藉澹恚潁ǎ,云2,...,^<偐Ud義
本文編號:2732480
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2732480.html
最近更新
教材專著