天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

健康領(lǐng)域中文自動問答的問題解析研究——以肺癌為例

發(fā)布時間:2024-05-11 16:37
  【目的】本研究針對中文消費者健康問題自動問答系統(tǒng)的問題解析部分,以肺癌健康領(lǐng)域為例,構(gòu)建高質(zhì)量的問題解析模型,實現(xiàn)對肺癌領(lǐng)域消費者健康問題的自動解析(包括問題類型、問題實體識別以及實體間關(guān)系抽取),為開發(fā)健康領(lǐng)域自動問答系統(tǒng)打下基礎(chǔ),本研究旨在(1)形成肺癌領(lǐng)域消費者健康問題的關(guān)鍵信息標(biāo)注體系;(2)利用人工標(biāo)注技術(shù)生成標(biāo)注語料庫;(3)實現(xiàn)基于深度學(xué)習(xí)方法的肺癌領(lǐng)域消費者健康問題自動解析。【方法】基于從在線醫(yī)療問答平臺爬取的10000條真實的肺癌領(lǐng)域消費者健康問題,構(gòu)建基于BiLSTM模型的問題解析模型。運用統(tǒng)計與對比方法構(gòu)建中文肺癌領(lǐng)域消費者健康問題的關(guān)鍵信息標(biāo)注體系;利用人工標(biāo)注技術(shù)標(biāo)注語料;運用BiLSTM-CRF模型識別問題的提問意向及關(guān)鍵語義成分;使用Attention-Based BiLSTM模型實現(xiàn)實體之間(問題類型與實體間)的關(guān)系抽取;將上述解析結(jié)果使用通用數(shù)據(jù)交換格式JSON儲存!窘Y(jié)果】根據(jù)本研究構(gòu)建的關(guān)鍵信息標(biāo)注體系(含20種問題實體、22種問題類型)通過3輪標(biāo)注與專家校對,對10000條真實肺癌領(lǐng)域消費者健康問題進(jìn)行人工標(biāo)注,形成了包含38505個問題實體與1...

【文章頁數(shù)】:82 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
1 緒論
    1.1 研究背景和意義
        1.1.1 研究背景
        1.1.2 研究意義
            1.1.2.1 理論價值
            1.1.2.2 實踐價值
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 國外研究現(xiàn)狀
            1.2.1.1 基于語言學(xué)方法的問題解析
            1.2.1.2 基于統(tǒng)計學(xué)方法的問題解析
            1.2.1.3 基于語義學(xué)方法的問題解析
            1.2.1.4 基于混合方法的問題解析
        1.2.2 國內(nèi)研究現(xiàn)狀
            1.2.2.1 分詞與詞性標(biāo)注
            1.2.2.2 句法分析
            1.2.2.3 語義分析
            1.2.2.4 問題分類
            1.2.2.5 關(guān)鍵詞抽取
            1.2.2.6 文獻(xiàn)總結(jié)
    1.3 研究目標(biāo)和內(nèi)容
    1.4 技術(shù)路線圖
    1.5 論文結(jié)構(gòu)安排
2 相關(guān)概念介紹
    2.1 自動問答系統(tǒng)
        2.1.1 自動問答系統(tǒng)分類
        2.1.2 自動問答系統(tǒng)發(fā)展
        2.1.3 醫(yī)療領(lǐng)域自動問答系統(tǒng)
    2.2 問題解析
3 研究數(shù)據(jù)
    3.1 數(shù)據(jù)來源
    3.2 數(shù)據(jù)篩選
    3.3 數(shù)據(jù)標(biāo)注體系
    3.4 數(shù)據(jù)標(biāo)注
        3.4.1 標(biāo)注流程
        3.4.2 標(biāo)注結(jié)果一致性檢驗
    3.5 數(shù)據(jù)標(biāo)注結(jié)果統(tǒng)計性描述
4 研究方法
    4.1 詞嵌入
    4.2 實體識別
    4.3 依存句法分析
    4.4 實體關(guān)系抽取
5 基于BILSTM的肺癌領(lǐng)域消費者健康問題解析模型
    5.1 技術(shù)路線
    5.2 文本預(yù)處理
    5.3 字向量映射
    5.4 模型訓(xùn)練
        5.4.1 基于BiLSTM-CRF模型的命名實體識別
        5.4.2 依存句法分析
        5.4.3 基于Attention-BiLSTM模型的實體關(guān)系抽取
    5.5 模型評估
6 實驗結(jié)果分析
    6.1 問題實體識別
    6.2 問題類型識別
    6.3 關(guān)系抽取
    6.4 問題理解結(jié)果
7 討論與局限性
    7.1 討論
        7.1.1 肺癌領(lǐng)域消費者健康問題關(guān)鍵信息標(biāo)注
        7.1.2 肺癌領(lǐng)域消費者健康問題理解模型
        7.1.3 向其它健康領(lǐng)域的泛化
    7.2 局限性
8 結(jié)論與展望
    8.1 結(jié)論
    8.2 展望
致謝
參考文獻(xiàn)
自動問答系統(tǒng)的問題解析關(guān)鍵技術(shù)研究綜述
    參考文獻(xiàn)
附件1 攻讀學(xué)位期間發(fā)表論文目錄



本文編號:3970126

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3970126.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6b4ba***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com