在線健康問答社區(qū)中食材對疾病作用關(guān)系的知識挖掘研究
發(fā)布時間:2021-08-12 16:30
隨著人們健康管理意識的提高,人們正在進行著積極的自我健康管理。在線健康問答社區(qū)為醫(yī)患交流和人們獲取基本健康醫(yī)療知識提供了途徑。在線健康社區(qū)中囊括了大量的醫(yī)患問答。這些問答兼具社交媒體數(shù)據(jù)的覆蓋廣,更新速度快,信息良莠不齊,內(nèi)容貼近病患的日常健康管理需要等特點。因此,基于在線健康社區(qū)挖掘的知識對于主流的文獻知識具有互補性,可以發(fā)現(xiàn)最新的健康醫(yī)學(xué)知識。本文采用尋醫(yī)問藥網(wǎng)社區(qū)問答數(shù)據(jù),研究如何從在線健康社區(qū)中挖掘健康管理知識,主要包括知識的自動化提取和知識質(zhì)量的可靠性評估。具體來說,首先以疾病與食材作用關(guān)系為例研究在線健康社區(qū)的知識自動化提取。采取多源詞典匹配進行實體名識別,卷積神經(jīng)網(wǎng)絡(luò)方法進行關(guān)系分類,提取了常見30種疾病與215種食材的作用關(guān)系。實證顯示模型效果顯著,其F1(兼顧準確率和召回率的綜合指標)為0.80,而人工標注的準確率為0.84,支持向量機的F1為0.74。在此基礎(chǔ)上,本文對所抽取知識的可靠性進行評估。在評估方法上,文章構(gòu)造了文本特征,時間特征,問答關(guān)聯(lián)性特征,回答者個人信息特征,搜索引擎驅(qū)動的特征,話題特征;采取機器學(xué)習(xí)方法進行答案的自動化評價。實證發(fā)現(xiàn)這些特征可以顯著...
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
尋醫(yī)問藥網(wǎng)上醫(yī)生回答頁面
圖 3- 2 關(guān)系提取流程的示意圖Fig.3-2 process diagram of relation extraction食材名識別提取之前,需要對文中出現(xiàn)的實體名進行識別。采取擴展辭典與啟料中出現(xiàn)的疾病名稱和中藥名稱。
句子的向量化表示Fig.3-3Vectorrepresentationofsentence
【參考文獻】:
期刊論文
[1]基于文本挖掘的問答社區(qū)健康信息行為研究——以“百度知道”為例[J]. 鄧勝利,劉瑾. 信息資源管理學(xué)報. 2016(03)
[2]社會化問答網(wǎng)站答案認可度的影響因素研究——以知乎為例[J]. 施國良,陳旭,杜璐鋒. 現(xiàn)代情報. 2016(06)
[3]多特征層次化答案質(zhì)量評價方法研究[J]. 崔敏君,段利國,李愛萍. 計算機科學(xué). 2016(01)
[4]在線問答社區(qū)信息質(zhì)量評價研究綜述[J]. 姜雯,許鑫. 現(xiàn)代圖書情報技術(shù). 2014(06)
[5]社會化問答平臺的答案質(zhì)量評估——以“知乎”、“百度知道”為例[J]. 賈佳,宋恩梅,蘇環(huán). 信息資源管理學(xué)報. 2013(02)
[6]基于相似度的問答社區(qū)問答質(zhì)量評價方法[J]. 來社安,蔡中民. 計算機應(yīng)用與軟件. 2013(02)
[7]網(wǎng)絡(luò)社區(qū)信息質(zhì)量及可靠性評價研究——基于用戶視角[J]. 沈旺,國佳,李賀. 現(xiàn)代圖書情報技術(shù). 2013(01)
[8]社區(qū)問答系統(tǒng)中“問答對”的質(zhì)量評價[J]. 劉高軍,馬硯忠,段建勇. 北方工業(yè)大學(xué)學(xué)報. 2012(03)
[9]中文社區(qū)問答中問題答案質(zhì)量評價和預(yù)測[J]. 李晨,巢文涵,陳小明,李舟軍. 計算機科學(xué). 2011(06)
[10]問答社區(qū)中回答質(zhì)量的評價方法研究[J]. 孔維澤,劉奕群,張敏,馬少平. 中文信息學(xué)報. 2011(01)
博士論文
[1]網(wǎng)絡(luò)健康社區(qū)中的文本挖掘方法研究[D]. 呂英杰.上海交通大學(xué) 2013
碩士論文
[1]醫(yī)患問答社區(qū)文本挖掘研究[D]. 佟鐵.遼寧科技大學(xué) 2015
本文編號:3338671
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
尋醫(yī)問藥網(wǎng)上醫(yī)生回答頁面
圖 3- 2 關(guān)系提取流程的示意圖Fig.3-2 process diagram of relation extraction食材名識別提取之前,需要對文中出現(xiàn)的實體名進行識別。采取擴展辭典與啟料中出現(xiàn)的疾病名稱和中藥名稱。
句子的向量化表示Fig.3-3Vectorrepresentationofsentence
【參考文獻】:
期刊論文
[1]基于文本挖掘的問答社區(qū)健康信息行為研究——以“百度知道”為例[J]. 鄧勝利,劉瑾. 信息資源管理學(xué)報. 2016(03)
[2]社會化問答網(wǎng)站答案認可度的影響因素研究——以知乎為例[J]. 施國良,陳旭,杜璐鋒. 現(xiàn)代情報. 2016(06)
[3]多特征層次化答案質(zhì)量評價方法研究[J]. 崔敏君,段利國,李愛萍. 計算機科學(xué). 2016(01)
[4]在線問答社區(qū)信息質(zhì)量評價研究綜述[J]. 姜雯,許鑫. 現(xiàn)代圖書情報技術(shù). 2014(06)
[5]社會化問答平臺的答案質(zhì)量評估——以“知乎”、“百度知道”為例[J]. 賈佳,宋恩梅,蘇環(huán). 信息資源管理學(xué)報. 2013(02)
[6]基于相似度的問答社區(qū)問答質(zhì)量評價方法[J]. 來社安,蔡中民. 計算機應(yīng)用與軟件. 2013(02)
[7]網(wǎng)絡(luò)社區(qū)信息質(zhì)量及可靠性評價研究——基于用戶視角[J]. 沈旺,國佳,李賀. 現(xiàn)代圖書情報技術(shù). 2013(01)
[8]社區(qū)問答系統(tǒng)中“問答對”的質(zhì)量評價[J]. 劉高軍,馬硯忠,段建勇. 北方工業(yè)大學(xué)學(xué)報. 2012(03)
[9]中文社區(qū)問答中問題答案質(zhì)量評價和預(yù)測[J]. 李晨,巢文涵,陳小明,李舟軍. 計算機科學(xué). 2011(06)
[10]問答社區(qū)中回答質(zhì)量的評價方法研究[J]. 孔維澤,劉奕群,張敏,馬少平. 中文信息學(xué)報. 2011(01)
博士論文
[1]網(wǎng)絡(luò)健康社區(qū)中的文本挖掘方法研究[D]. 呂英杰.上海交通大學(xué) 2013
碩士論文
[1]醫(yī)患問答社區(qū)文本挖掘研究[D]. 佟鐵.遼寧科技大學(xué) 2015
本文編號:3338671
本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/3338671.html
最近更新
教材專著