天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

醫(yī)患問答社區(qū)文本挖掘研究

發(fā)布時(shí)間:2017-06-09 01:05

  本文關(guān)鍵詞:醫(yī)患問答社區(qū)文本挖掘研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)的快速發(fā)展,越來越多的人們參與其中交流信息。醫(yī)患問答社區(qū)是醫(yī)生和患者可以在線交流的網(wǎng)絡(luò)健康社區(qū),社區(qū)中保留了大量的問答信息,其中包括病例信息、醫(yī)學(xué)常識(shí)和用藥健康等豐富的知識(shí),對(duì)其深入挖掘可以為醫(yī)學(xué)研究,商業(yè)運(yùn)作等提供有價(jià)值的參考資料。傳統(tǒng)的方法多是通過問卷調(diào)查或人工分析方式來進(jìn)行探索研究,但當(dāng)面對(duì)日益增長(zhǎng)的海量信息時(shí),傳統(tǒng)方法的缺陷日益凸顯。本文對(duì)醫(yī)患問答社區(qū)中的藥名實(shí)體識(shí)別和情感分析兩個(gè)主題進(jìn)行研究,構(gòu)建了基于機(jī)器學(xué)習(xí)的層次結(jié)構(gòu)多策略方法進(jìn)行知識(shí)挖掘。針對(duì)中文網(wǎng)絡(luò)健康社區(qū)中的文本口語化和藥名實(shí)體不規(guī)范等問題,本文采用條件隨機(jī)場(chǎng)模型結(jié)合改進(jìn)的最大匹配算法對(duì)藥名實(shí)體進(jìn)行抽取,并補(bǔ)充模糊匹配和搜索引擎的方法對(duì)其中的不規(guī)范藥名實(shí)體規(guī)范化。本文接下來對(duì)識(shí)別出的醫(yī)藥文本進(jìn)行情感分析研究,首先采取二次二分類的方法進(jìn)行情感分析,使用支持向量機(jī)模型對(duì)主客觀文本分類,分別選取了N元特征,文體特征和情感詞特征等。然后用情感詞典匹配的方法對(duì)主觀文本極性分類,其中對(duì)于情感詞典沒有收錄領(lǐng)域情感詞的問題,本文利用情感新詞發(fā)現(xiàn)的方法補(bǔ)充領(lǐng)域情感詞。最后對(duì)真實(shí)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),驗(yàn)證了本文方法的可行性和合理性。目前對(duì)中文網(wǎng)絡(luò)健康社區(qū)的研究還處于初步階段,本文結(jié)合藥名實(shí)體識(shí)別和情感分析兩種方法對(duì)中文網(wǎng)絡(luò)健康社區(qū)中的醫(yī)藥信息抽取研究,挖掘出的內(nèi)容為網(wǎng)絡(luò)健康社區(qū)中的用藥狀況和病癥差異等研究提供了重要的幫助,同時(shí)為大數(shù)據(jù)時(shí)代的醫(yī)藥信息化挖掘管理提供了新思路。
【關(guān)鍵詞】:網(wǎng)絡(luò)健康社區(qū) 藥名實(shí)體識(shí)別 情感分析
【學(xué)位授予單位】:遼寧科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【目錄】:
  • 中文摘要5-6
  • ABSTRACT6-9
  • 1. 緒論9-15
  • 1.1. 研究背景9-10
  • 1.2. 研究現(xiàn)狀10-13
  • 1.2.1 命名實(shí)體識(shí)別11-12
  • 1.2.2 情感分析12-13
  • 1.3. 研究?jī)?nèi)容13-14
  • 1.4. 本文結(jié)構(gòu)14-15
  • 2. 相關(guān)理論與資源15-23
  • 2.1. 條件隨機(jī)場(chǎng)15-17
  • 2.1.1. 簡(jiǎn)介15
  • 2.1.2. 形式化描述15-16
  • 2.1.3. 參數(shù)化估計(jì)16-17
  • 2.2. 支持向量機(jī)17-20
  • 2.2.1. 線性可分支持向量機(jī)18
  • 2.2.2. 函數(shù)間隔與幾何間隔18-20
  • 2.2.3. 間隔最大化20
  • 2.3. 評(píng)測(cè)方法20-21
  • 2.4. 數(shù)據(jù)資源21-23
  • 2.4.1. 數(shù)據(jù)集資源21
  • 2.4.2. 詞典資源21-23
  • 3. 藥物實(shí)體識(shí)別及標(biāo)準(zhǔn)化23-34
  • 3.1. 問題引出23
  • 3.2. 系統(tǒng)流程23-30
  • 3.2.1. 數(shù)據(jù)集24
  • 3.2.2. 藥名實(shí)體識(shí)別24-27
  • 3.2.3. 標(biāo)準(zhǔn)化及擴(kuò)充藥名詞典27-30
  • 3.3. 實(shí)驗(yàn)結(jié)果與分析30-33
  • 3.3.1. 藥名實(shí)體識(shí)別實(shí)驗(yàn)30-31
  • 3.3.2. 標(biāo)準(zhǔn)化及擴(kuò)充藥名詞典實(shí)驗(yàn)結(jié)果31-33
  • 3.4. 本章總結(jié)33-34
  • 4. 醫(yī)患問答社區(qū)情感分析34-49
  • 4.1. 問題引出34
  • 4.2. 系統(tǒng)流程34-42
  • 4.2.1. 數(shù)據(jù)集35
  • 4.2.2. 基于支持向量機(jī)的主客觀文本分類35-37
  • 4.2.3. 基于情感詞典的情感極性分析37-42
  • 4.3. 實(shí)驗(yàn)結(jié)果與分析42-48
  • 4.3.1. 特征選擇評(píng)價(jià)42-48
  • 4.4. 本章總結(jié)48-49
  • 5.結(jié)論49-51
  • 參考文獻(xiàn)51-55
  • 攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況55-56
  • 致謝56-57
  • 作者簡(jiǎn)介57-58

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前1條

1 孫鎮(zhèn);王惠臨;;命名實(shí)體識(shí)別研究進(jìn)展綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2010年06期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 邱莎;基于統(tǒng)計(jì)的生物命名實(shí)體識(shí)別研究[D];四川大學(xué);2006年


  本文關(guān)鍵詞:醫(yī)患問答社區(qū)文本挖掘研究,由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):434106

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/434106.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7b6d9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com