天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于關(guān)系模型的語(yǔ)料庫(kù)查詢(xún)處理問(wèn)題研究

發(fā)布時(shí)間:2017-05-24 10:26

  本文關(guān)鍵詞:基于關(guān)系模型的語(yǔ)料庫(kù)查詢(xún)處理問(wèn)題研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著信息科學(xué)領(lǐng)域基于統(tǒng)計(jì)的自然語(yǔ)言處理技術(shù)和人文學(xué)科領(lǐng)域描述性語(yǔ)言學(xué)研究的發(fā)展,一些研究機(jī)構(gòu)、企業(yè)和組織甚至個(gè)人都開(kāi)發(fā)、建設(shè)和積累了大量不同規(guī)模的語(yǔ)料庫(kù)。這些語(yǔ)料庫(kù)作為寶貴財(cái)產(chǎn),已經(jīng)成為改善和提高自然語(yǔ)言處理方法效率和質(zhì)量的關(guān)鍵基礎(chǔ),也為語(yǔ)言分析、語(yǔ)言教學(xué)、翻譯研究和語(yǔ)言學(xué)習(xí)提供重要的數(shù)據(jù)資源和知識(shí)。目前,有關(guān)語(yǔ)料庫(kù)的研究領(lǐng)域已經(jīng)形成了一個(gè)獨(dú)立的學(xué)科——語(yǔ)料庫(kù)語(yǔ)言學(xué)。如何快速、有效地從語(yǔ)料庫(kù)中抽取相關(guān)信息成為語(yǔ)料庫(kù)語(yǔ)言學(xué)研究中一個(gè)至關(guān)重要的問(wèn)題。對(duì)語(yǔ)料庫(kù)數(shù)據(jù)建模并研究其上的查詢(xún)處理問(wèn)題,是語(yǔ)料庫(kù)中信息抽取技術(shù)的基礎(chǔ)。本文針對(duì)語(yǔ)料庫(kù)的數(shù)據(jù)模型、基本查詢(xún)問(wèn)題及查詢(xún)處理方法、關(guān)鍵字查詢(xún)問(wèn)題及查詢(xún)處理方法、基于語(yǔ)句的語(yǔ)義查詢(xún)問(wèn)題及查詢(xún)處理方法和語(yǔ)料庫(kù)查詢(xún)系統(tǒng)體系結(jié)構(gòu)及原型系統(tǒng)的實(shí)現(xiàn)等幾個(gè)關(guān)鍵問(wèn)題進(jìn)行了研究,論文的主要研究?jī)?nèi)容如下:首先,使用形式化方法對(duì)語(yǔ)料庫(kù)的概念定義進(jìn)行精細(xì)化的重定義。將語(yǔ)料庫(kù)的形式化定義與關(guān)系模型相結(jié)合,對(duì)語(yǔ)料庫(kù)數(shù)據(jù)建立一種可計(jì)算的D-Corpus邏輯模型。分析并證明了D-Corpus模型的完備性。其次,根據(jù)D-Corpus模型,對(duì)傳統(tǒng)語(yǔ)料庫(kù)上以KWIC輸出為中心的語(yǔ)料庫(kù)查詢(xún)語(yǔ)義進(jìn)行分析,給出語(yǔ)料庫(kù)上的基本查詢(xún)問(wèn)題的形式化定義,并分析了這些查詢(xún)問(wèn)題的數(shù)據(jù)復(fù)雜度。根據(jù)這些查詢(xún)問(wèn)題,定義了面向語(yǔ)料庫(kù)查詢(xún)處理的包括選擇、投影、并、差、笛卡爾積、重命名和遞歸在內(nèi)的代數(shù)操作,并在此基礎(chǔ)上提出了面向語(yǔ)料庫(kù)查詢(xún)處理的非遞歸算法和遞歸算法,并通過(guò)實(shí)驗(yàn)對(duì)算法進(jìn)行了分析和驗(yàn)證。第三,研究面向語(yǔ)料庫(kù)的支持遞歸語(yǔ)義的關(guān)鍵字查詢(xún)問(wèn)題及其查詢(xún)處理方法。由于面向語(yǔ)料庫(kù)的關(guān)鍵字查詢(xún)要求解決用戶(hù)所提交關(guān)鍵字中存在的遞歸語(yǔ)義,而傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)上的關(guān)鍵字查詢(xún)方法中定義的數(shù)據(jù)圖無(wú)法回答這種語(yǔ)義。為此,提出了一種描述關(guān)系內(nèi)元組連接關(guān)系的語(yǔ)料庫(kù)數(shù)據(jù)圖模型,并將關(guān)鍵字查詢(xún)問(wèn)題轉(zhuǎn)換為圖中搜索分組Steiner樹(shù)的問(wèn)題,給出了數(shù)據(jù)圖上關(guān)于頂點(diǎn)和邊的評(píng)分方法,提出了基于動(dòng)態(tài)規(guī)劃策略的結(jié)果樹(shù)枚舉算法,最后通過(guò)實(shí)驗(yàn)分析也驗(yàn)證了算法的有效性。第四,提出語(yǔ)料庫(kù)上基于語(yǔ)句的語(yǔ)義查詢(xún)問(wèn)題和查詢(xún)處理方法。針對(duì)傳統(tǒng)方法的不足,提出一種基于依存語(yǔ)法分析和語(yǔ)義網(wǎng)的語(yǔ)義查詢(xún)處理方法。首先,通過(guò)考慮語(yǔ)句依存語(yǔ)法樹(shù)中的依存關(guān)系集的相似性,提出基于語(yǔ)義網(wǎng)的句子的語(yǔ)義相似度計(jì)算方法。其次,提出一種基于有效依存結(jié)構(gòu)的語(yǔ)句句法結(jié)構(gòu)相似度計(jì)算方法。再次,提出基于綜合考慮語(yǔ)句語(yǔ)義相似度和句法相似度的語(yǔ)句相似度計(jì)算方法。最后,根據(jù)語(yǔ)句相似度的計(jì)算方法提出語(yǔ)料庫(kù)上基于語(yǔ)句的語(yǔ)義查詢(xún)處理算法,并通過(guò)實(shí)驗(yàn)和分析驗(yàn)證了算法的有效性。最后,給出了語(yǔ)料庫(kù)查詢(xún)系統(tǒng)體系結(jié)構(gòu),并依據(jù)該體系結(jié)構(gòu)設(shè)計(jì)和實(shí)現(xiàn)了一個(gè)語(yǔ)料庫(kù)查詢(xún)?cè)拖到y(tǒng)R-CQS。將本文提出的三類(lèi)查詢(xún)問(wèn)題及其查詢(xún)處理方法在原型系統(tǒng)中進(jìn)行了應(yīng)用測(cè)試。
【關(guān)鍵詞】:語(yǔ)料庫(kù) 關(guān)系模型 查詢(xún)處理 關(guān)鍵字查詢(xún) 語(yǔ)義查詢(xún)
【學(xué)位授予單位】:燕山大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP391.1
【目錄】:
  • 摘要4-6
  • Abstract6-11
  • 第1章 緒論11-28
  • 1.1 語(yǔ)料庫(kù)11-14
  • 1.1.1 語(yǔ)料庫(kù)的概念11-12
  • 1.1.2 語(yǔ)料庫(kù)實(shí)例12-13
  • 1.1.3 語(yǔ)料庫(kù)的特點(diǎn)13-14
  • 1.2 研究背景與意義14-16
  • 1.2.1 語(yǔ)料庫(kù)的發(fā)展背景14
  • 1.2.2 語(yǔ)料庫(kù)中信息抽取的技術(shù)與應(yīng)用背景14-16
  • 1.2.3 語(yǔ)料庫(kù)查詢(xún)處理問(wèn)題研究的意義16
  • 1.3 語(yǔ)料庫(kù)上信息抽取相關(guān)技術(shù)的研究現(xiàn)狀16-25
  • 1.3.1 面向無(wú)結(jié)構(gòu)語(yǔ)料庫(kù)信息抽取的技術(shù)及其應(yīng)用16-18
  • 1.3.2 面向半結(jié)構(gòu)語(yǔ)料庫(kù)的信息抽取技術(shù)及其應(yīng)用18-21
  • 1.3.3 面向結(jié)構(gòu)化語(yǔ)料庫(kù)的信息抽取技術(shù)及其應(yīng)用21-23
  • 1.3.4 現(xiàn)有語(yǔ)料庫(kù)查詢(xún)系統(tǒng)的對(duì)比及研究中存在的問(wèn)題23-25
  • 1.4 課題研究的主要內(nèi)容25-26
  • 1.5 論文結(jié)構(gòu)26-28
  • 第2章 描述語(yǔ)料庫(kù)的數(shù)據(jù)模型28-37
  • 2.1 引言28
  • 2.2 語(yǔ)料庫(kù)的概念及XML表示28-31
  • 2.3 語(yǔ)料庫(kù)的形式化定義31-32
  • 2.3.1 語(yǔ)料庫(kù)基本元素的形式化定義31
  • 2.3.2 語(yǔ)料庫(kù)的形式化定義31-32
  • 2.4 語(yǔ)料庫(kù)的邏輯模型及其完備性32-36
  • 2.4.1 關(guān)系模型的定義32-33
  • 2.4.2 語(yǔ)料庫(kù)的數(shù)據(jù)模型33-35
  • 2.4.3 模型的完備性35-36
  • 2.5 本章小結(jié)36-37
  • 第3章 語(yǔ)料庫(kù)基本查詢(xún)問(wèn)題及其查詢(xún)處理37-63
  • 3.1 引言37
  • 3.2 語(yǔ)料庫(kù)的查詢(xún)問(wèn)題描述37-42
  • 3.2.1 基本定義37-39
  • 3.2.2 問(wèn)題描述39-42
  • 3.3 語(yǔ)料庫(kù)查詢(xún)問(wèn)題的復(fù)雜度42-49
  • 3.3.1 基礎(chǔ)知識(shí)42-44
  • 3.3.2 復(fù)雜度分析44-49
  • 3.4 語(yǔ)料庫(kù)的查詢(xún)處理方法49-57
  • 3.4.1 面向語(yǔ)料庫(kù)的關(guān)系代數(shù)操作49-50
  • 3.4.2 語(yǔ)料庫(kù)查詢(xún)的重寫(xiě)算法及分析50-52
  • 3.4.3 語(yǔ)料庫(kù)的查詢(xún)處理方法及分析52-55
  • 3.4.4 語(yǔ)料庫(kù)的查詢(xún)優(yōu)化策略55-57
  • 3.5 實(shí)驗(yàn)分析57-61
  • 3.5.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集57
  • 3.5.2 實(shí)驗(yàn)結(jié)果與分析57-61
  • 3.6 本章小結(jié)61-63
  • 第4章 語(yǔ)料庫(kù)關(guān)鍵字查詢(xún)問(wèn)題及其查詢(xún)處理63-86
  • 4.1 引言63-64
  • 4.2 問(wèn)題描述64-69
  • 4.2.1 研究動(dòng)機(jī)64-67
  • 4.2.2 數(shù)據(jù)模型67-69
  • 4.2.3 問(wèn)題描述69
  • 4.3 評(píng)分策略69-73
  • 4.3.1 頂點(diǎn)評(píng)分方法70-71
  • 4.3.2 邊評(píng)分方法71-72
  • 4.3.3 元組連接樹(shù)相關(guān)度評(píng)分方法72-73
  • 4.4 數(shù)據(jù)圖的創(chuàng)建73-74
  • 4.4.1 算法描述73-74
  • 4.4.2 算法分析74
  • 4.5 關(guān)鍵字索引74-76
  • 4.5.1 語(yǔ)料庫(kù)關(guān)鍵字倒排索引的組織74-75
  • 4.5.2 關(guān)鍵字倒排索引的創(chuàng)建算法75
  • 4.5.3 算法分析75-76
  • 4.6 結(jié)果樹(shù)枚舉76-81
  • 4.6.1 元組連接樹(shù)擴(kuò)展操作76-77
  • 4.6.2 結(jié)果樹(shù)近似枚舉算法77-78
  • 4.6.3 實(shí)例分析78-79
  • 4.6.4 算法正確性分析79-80
  • 4.6.5 算法復(fù)雜度分析80
  • 4.6.6 算法優(yōu)化策略80-81
  • 4.7 語(yǔ)料庫(kù)關(guān)鍵字查詢(xún)處理算法81
  • 4.8 實(shí)驗(yàn)分析81-85
  • 4.8.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集81-82
  • 4.8.2 實(shí)驗(yàn)結(jié)果與分析82-85
  • 4.9 本章小結(jié)85-86
  • 第5章 語(yǔ)料庫(kù)上基于語(yǔ)句的語(yǔ)義查詢(xún)問(wèn)題及其查詢(xún)處理86-106
  • 5.1 引言86-87
  • 5.2 基礎(chǔ)知識(shí)87-92
  • 5.2.1 依存語(yǔ)法87-89
  • 5.2.2 向量空間模型89-91
  • 5.2.3 基于WordNet的詞匯相似度91-92
  • 5.3 問(wèn)題描述92
  • 5.4 語(yǔ)義相似度的度量92-97
  • 5.4.1 文本正態(tài)化93-94
  • 5.4.2 單詞節(jié)點(diǎn)依存關(guān)系集94-97
  • 5.4.3 語(yǔ)句的語(yǔ)義相似度97
  • 5.5 句法相似度的度量97-99
  • 5.5.1 語(yǔ)句的有效依存結(jié)構(gòu)集98-99
  • 5.5.2 語(yǔ)句的句法相似度99
  • 5.6 語(yǔ)句相似度的度量99-100
  • 5.7 基于語(yǔ)句相似度的語(yǔ)義查詢(xún)處理算法100-101
  • 5.7.1 算法思想100
  • 5.7.2 算法描述100-101
  • 5.8 實(shí)驗(yàn)分析101-105
  • 5.8.1 語(yǔ)句相似度算法的有效性分析101-104
  • 5.8.2 基于語(yǔ)句相似度的語(yǔ)義查詢(xún)處理算法有效性分析104-105
  • 5.9 本章小結(jié)105-106
  • 第6章 語(yǔ)料庫(kù)查詢(xún)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)106-117
  • 6.1 語(yǔ)料庫(kù)查詢(xún)系統(tǒng)概述106-108
  • 6.1.1 語(yǔ)料庫(kù)查詢(xún)系統(tǒng)的基本概念107
  • 6.1.2 語(yǔ)料庫(kù)查詢(xún)系統(tǒng)的邏輯功能107-108
  • 6.2 語(yǔ)料庫(kù)查詢(xún)系統(tǒng)體系結(jié)構(gòu)108-109
  • 6.3 語(yǔ)料庫(kù)查詢(xún)?cè)拖到y(tǒng)R-CQS的實(shí)現(xiàn)109-116
  • 6.3.1 開(kāi)發(fā)環(huán)境109-110
  • 6.3.2 數(shù)據(jù)管理模塊110-111
  • 6.3.3 索引模塊測(cè)試111
  • 6.3.4 面向語(yǔ)料庫(kù)的查詢(xún)處理模塊測(cè)試111-116
  • 6.4 本章小結(jié)116-117
  • 結(jié)論117-119
  • 參考文獻(xiàn)119-128
  • 攻讀博士學(xué)位期間承擔(dān)的科研任務(wù)與主要成果128-130
  • 致謝130

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 李北星;分布式數(shù)據(jù)庫(kù)管理系統(tǒng)中的查詢(xún)處理設(shè)計(jì)[J];計(jì)算機(jī)工程與設(shè)計(jì);1987年03期

2 T.F.Keefe ,M.B.Thuraisingham ,W.T.Tsai ,范宏深;安全查詢(xún)處理策略[J];計(jì)算機(jī)工程與科學(xué);1991年01期

3 李芝棠,朱儉,殷軍,張江陵;單關(guān)系查詢(xún)處理機(jī)的任務(wù)生成[J];計(jì)算機(jī)應(yīng)用;1992年02期

4 馮志林;分布式數(shù)據(jù)庫(kù)系統(tǒng)中基于半連接的查詢(xún)處理[J];計(jì)算機(jī)應(yīng)用與軟件;1989年03期

5 郝忠孝,馬宗民,胡春海;基于空值環(huán)境下擴(kuò)展關(guān)系模型的查詢(xún)處理研究[J];計(jì)算機(jī)研究與發(fā)展;1994年10期

6 馮玉才,張鵬程;基于近似查詢(xún)的在線分組聚集及其應(yīng)用[J];計(jì)算機(jī)工程;2005年16期

7 黃艷;朱會(huì)東;;一種基于移動(dòng)Agent的查詢(xún)處理策略[J];計(jì)算機(jī)工程;2007年01期

8 錢(qián)江波;徐宏炳;董逸生;劉學(xué)軍;王永利;楊雪梅;;共享連接結(jié)果的連續(xù)查詢(xún)處理[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年01期

9 肖予欽,張巨,景寧,李軍;基于R樹(shù)的方向關(guān)系查詢(xún)處理[J];軟件學(xué)報(bào);2004年01期

10 李國(guó)祿;分布式數(shù)據(jù)庫(kù)系統(tǒng)中的查詢(xún)處理[J];青海師專(zhuān)學(xué)報(bào).教育科學(xué);2005年S3期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 韓璐;王朝坤;鄒鵬;徐亞軍;;不確定圖數(shù)據(jù)上的不確定查詢(xún)處理[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

2 陳紅;王珊;;多階段并行多查詢(xún)處理框架[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

3 陳良剛;劉震;施伯樂(lè);;位置相關(guān)查詢(xún)處理[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

4 廖巍;景寧;李軍;吳秋云;;一種通用的可伸縮增量連續(xù)查詢(xún)處理框架[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年

5 朱金清;王偉;周軍鋒;孟小峰;;基于相關(guān)性語(yǔ)義的高效XML Twig查詢(xún)處理方法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(二)[C];2008年

6 夏添;蔡文淵;徐林昊;錢(qián)衛(wèi)寧;周水庚;周傲英;;P2P環(huán)境下的查詢(xún)處理代價(jià)估算[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年

7 祝遠(yuǎn)玲;馮玉;王珊;;PBASE的并行查詢(xún)處理策略[A];數(shù)據(jù)庫(kù)研究與進(jìn)展95——第十三屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集[C];1995年

8 丁治明;郭黎敏;;一種支持通用θ-Join的并行查詢(xún)處理機(jī)制[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

9 熊蜀光;李建中;王宏志;高宏;;一種基于編碼的圖模型XML數(shù)據(jù)的存儲(chǔ)與查詢(xún)處理方法[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年

10 肖剛;莊嚴(yán);鄭振楣;石樹(shù)剛;;SamBase中的對(duì)象查詢(xún)處理[A];數(shù)據(jù)庫(kù)研究與進(jìn)展95——第十三屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集[C];1995年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前8條

1 劉鼎甲;基于關(guān)系模型的語(yǔ)料庫(kù)查詢(xún)處理問(wèn)題研究[D];燕山大學(xué);2015年

2 鄧波;分布式序敏感查詢(xún)處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年

3 陳紅;并行多查詢(xún)處理關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2000年

4 王振華;P2P環(huán)境下查詢(xún)處理關(guān)鍵技術(shù)的研究[D];東北大學(xué);2011年

5 吳愛(ài)華;不一致數(shù)據(jù)的查詢(xún)處理[D];復(fù)旦大學(xué);2010年

6 李曉光;XML非完全結(jié)構(gòu)查詢(xún)處理中若干關(guān)鍵技術(shù)的研究[D];東北大學(xué);2006年

7 張蓉;結(jié)構(gòu)化對(duì)等計(jì)算機(jī)系統(tǒng)中的查詢(xún)處理[D];復(fù)旦大學(xué);2007年

8 李瑞軒;異構(gòu)信息集成中的查詢(xún)處理與優(yōu)化研究[D];華中科技大學(xué);2004年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 Les Kimball Kamara;連接數(shù)據(jù)知識(shí)庫(kù)語(yǔ)義查詢(xún)處理[D];東北大學(xué);2014年

2 曹佩;延遲容忍網(wǎng)絡(luò)的訂閱查詢(xún)處理[D];寧波大學(xué);2013年

3 劉偉偉;分布式空間信息集成查詢(xún)處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2009年

4 李東亮;不確定多媒體數(shù)據(jù)個(gè)性化查詢(xún)處理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2012年

5 武亮亮;增量的連續(xù)k近鄰查詢(xún)處理方法的研究[D];燕山大學(xué);2010年

6 李義國(guó);基于不完全約束的XML查詢(xún)處理關(guān)鍵技術(shù)研究[D];燕山大學(xué);2010年

7 熊蜀光;圖模型XML數(shù)據(jù)上查詢(xún)處理方法的研究[D];哈爾濱工業(yè)大學(xué);2006年

8 曲東;面向Ziv-Lempel壓縮文本的多查詢(xún)處理技術(shù)[D];東北大學(xué);2010年

9 劉英童;P2P環(huán)境下基于模式匹配的復(fù)雜查詢(xún)處理的研究[D];哈爾濱工業(yè)大學(xué);2007年

10 馮林;XML查詢(xún)處理結(jié)構(gòu)中的一種邏輯優(yōu)化算法[D];西南大學(xué);2008年


  本文關(guān)鍵詞:基于關(guān)系模型的語(yǔ)料庫(kù)查詢(xún)處理問(wèn)題研究,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):390531

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/390531.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)b2179***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com