天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于語(yǔ)義的文獻(xiàn)關(guān)鍵字提取技術(shù)的研究

發(fā)布時(shí)間:2023-04-27 21:07
  隨著信息技術(shù)的不斷發(fā)展,快速增長(zhǎng)的數(shù)據(jù)涌現(xiàn)在人們眼前,各式各樣的信息充斥在生活的各個(gè)角落。因此,如何準(zhǔn)確地從眾多數(shù)據(jù)信息中獲取到真正有意義的關(guān)鍵部分已成為研究的技術(shù)熱點(diǎn)。目前的關(guān)鍵字提取算法中大部分是基于詞頻和詞長(zhǎng)的研究,也有基于語(yǔ)義和詞匯鏈的研究。在基于詞頻和詞長(zhǎng)的關(guān)鍵字提取中依賴(lài)詞的長(zhǎng)度,長(zhǎng)度較長(zhǎng)的分詞更容易成為關(guān)鍵字,但對(duì)于一些特殊情況卻適用性不強(qiáng),同時(shí)沒(méi)有加入詞在全文中的語(yǔ)義信息;基于語(yǔ)義的研究忽略了詞本身的詞長(zhǎng)等基本屬性,同時(shí)時(shí)間開(kāi)銷(xiāo)較大,不能夠準(zhǔn)確高效地提取到文獻(xiàn)關(guān)鍵字信息。在準(zhǔn)確性和效率之間的兼容性較差。本文也正是基于以上問(wèn)題進(jìn)行的研究。關(guān)鍵字反應(yīng)的是文章的主旨信息和核心概念。在閱讀和檢索查找等方面,精準(zhǔn)的關(guān)鍵字信息能夠給讀者帶來(lái)極大的便利。所以在關(guān)鍵字的提取技術(shù)上,也有著不斷地改進(jìn)和優(yōu)化。其中基于語(yǔ)義的提取算法通過(guò)消歧和語(yǔ)義分析能得到詞語(yǔ)在文章中更真實(shí)的含義和意圖。本文通過(guò)與傳統(tǒng)的TF-IDF和KEA等經(jīng)典算法的研究比較,提出了一種基于語(yǔ)義的GSW(Group character tree,Semantic similarity and Word-length prio...

【文章頁(yè)數(shù)】:66 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 國(guó)內(nèi)研究現(xiàn)狀
        1.2.2 國(guó)外研究現(xiàn)狀
    1.3 主要工作及研究意義
        1.3.1 主要工作
        1.3.2 研究意義
    1.4 論文結(jié)構(gòu)
第2章 相關(guān)算法與技術(shù)
    2.1 中文分詞優(yōu)化技術(shù)
        2.1.1 基于詞典存儲(chǔ)的分詞優(yōu)化
        2.1.2 基于字符串匹配的分詞優(yōu)化
    2.2 關(guān)鍵字提取算法
        2.2.1 TF-IDF
        2.2.2 基于詞長(zhǎng)改進(jìn)的TF-IDF算法
        2.2.3 KEA算法
        2.2.4 基于語(yǔ)義的關(guān)鍵字提取算法
    2.3 數(shù)據(jù)分析工具
第3章 GSW算法
    3.1 相關(guān)工作
    3.2 GCT分詞法
        3.2.1 字符樹(shù)和trie索引樹(shù)
        3.2.2 分組字符樹(shù)原理和GCT算法
        3.2.3 性能比較
    3.3 SDBT消歧算法
        3.3.1 同義詞詞林和語(yǔ)義距離
        3.3.2 基于語(yǔ)義距離—B+樹(shù)的消歧算法
        3.3.3 實(shí)驗(yàn)評(píng)估
    3.4 WPR-TOC關(guān)鍵字提取算法
        3.4.1 候選詞合并
        3.4.2 樸素貝葉斯算法和特征選取
        3.4.3 詞長(zhǎng)優(yōu)先比原理
        3.4.4 WPR-TOC算法
    3.5 本章小結(jié)
第4章 系統(tǒng)實(shí)現(xiàn)和性能測(cè)試
    4.1 基于語(yǔ)義的關(guān)鍵字提取的意義
    4.2 系統(tǒng)概述
        4.2.1 系統(tǒng)實(shí)現(xiàn)
        4.2.2 處理流程
    4.3 性能測(cè)試
        4.3.1 實(shí)驗(yàn)數(shù)據(jù)和開(kāi)發(fā)平臺(tái)
        4.3.2 實(shí)驗(yàn)設(shè)計(jì)
    4.4 結(jié)果分析
    4.5 本章小結(jié)
第5章 總結(jié)與展望
    5.1 論文總結(jié)
    5.2 工作展望
參考文獻(xiàn)
作者簡(jiǎn)介及在學(xué)期間所取得的科研成果
致謝



本文編號(hào):3803066

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3803066.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶05717***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com