天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于相似性度量的專利分類方法研究

發(fā)布時(shí)間:2024-02-17 17:33
  隨著人類社會(huì)日新月異的變化,技術(shù)的革新速度越來越快,同一領(lǐng)域的行業(yè)競爭變得愈發(fā)激烈,這對企業(yè)在某一領(lǐng)域下的技術(shù)創(chuàng)新提出了更高的要求。專利作為一種含有豐富信息的特殊知識文本,在教育、金融、生產(chǎn)等一系列領(lǐng)域中為技術(shù)發(fā)展提供強(qiáng)有力的支撐。面對海量的專利文本,如何改變傳統(tǒng)的文本分類算法使其適應(yīng)專利文本的特性成為現(xiàn)在專利分類亟待解決的問題。相似性度量是指通過某種方法來衡量數(shù)據(jù)之間相似程度的一種度量方法。由于目前基于統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的專利分類方法,在分類精度方面很難再有更大的提高,因此如何選擇一個(gè)優(yōu)秀的相似性度量方法使其達(dá)到更好的分類效果,是當(dāng)前的研究重點(diǎn)和熱點(diǎn)。本文根據(jù)專利文本的特點(diǎn)結(jié)合傳統(tǒng)的相似性度量方法提出了兩種基于相似性度量的專利分類方法。首先,使用TF-IDF方法從專利摘要中篩選出特征項(xiàng),通過CHI統(tǒng)計(jì)量判斷特征項(xiàng)與類別之間的關(guān)聯(lián)性,然而CHI統(tǒng)計(jì)量會(huì)夸大某些不具備分類信息的低頻詞的重要程度,影響分類準(zhǔn)確性。因此將CHI統(tǒng)計(jì)量與夾角余弦相似度結(jié)合,提出了一種新的基于摘要相似度的專利分類方法;诖朔椒,考慮專利的結(jié)構(gòu)化和非結(jié)構(gòu)化特征,提出了一種基于IPC分類號和摘要混合相似度的專利分類方法...

【文章頁數(shù)】:64 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景及意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 專利分類研究現(xiàn)狀
        1.2.2 專利相似度計(jì)算研究現(xiàn)狀
    1.3 主要研究內(nèi)容和預(yù)期研究結(jié)果
    1.4 本文的組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)介紹
    2.1 文本的特征提取
        2.1.1 特征項(xiàng)選取
        2.1.2 特征項(xiàng)權(quán)重計(jì)算
    2.2 文本相似性度量方法
    2.3 文本分類算法及評價(jià)方法
        2.3.1 文本分類算法
        2.3.2 評價(jià)方法
    2.4 本章小結(jié)
第3章 基于摘要相似度的專利分類方法
    3.1 CHI統(tǒng)計(jì)量
        3.1.1 CHI統(tǒng)計(jì)量的局限性
        3.1.2 改進(jìn)的CHI統(tǒng)計(jì)方法
    3.2 基于摘要相似度的專利分類方法
        3.2.1 算法思想
        3.2.2 算法步驟
    3.3 基于混合相似度的專利分類方法
        3.3.1 基于IPC的專利文本相似性度量
        3.3.2 基于混合相似度的專利分類方法
    3.4 實(shí)驗(yàn)結(jié)果及分析
        3.4.1 實(shí)驗(yàn)環(huán)境及配置
        3.4.2 實(shí)驗(yàn)數(shù)據(jù)集
        3.4.3 實(shí)驗(yàn)設(shè)計(jì)及步驟
        3.4.4 實(shí)驗(yàn)結(jié)果及分析
    3.5 本章小結(jié)
第4章 基于權(quán)利要求書相似度的專利分類方法
    4.1 權(quán)利要求書SAO-x結(jié)構(gòu)提取
        4.1.1 SAO結(jié)構(gòu)
        4.1.2 SAO-x結(jié)構(gòu)
        4.1.3 權(quán)利要求書SAO-x結(jié)構(gòu)提取
    4.2 基于權(quán)利要求書相似度的專利分類方法
        4.2.1 算法思想
        4.2.2 算法步驟
    4.3 實(shí)驗(yàn)結(jié)果及分析
        4.3.1 實(shí)驗(yàn)環(huán)境及配置
        4.3.2 實(shí)驗(yàn)數(shù)據(jù)集
        4.3.3 實(shí)驗(yàn)設(shè)計(jì)及步驟
        4.3.4 實(shí)驗(yàn)結(jié)果及分析
    4.4 本章小結(jié)
結(jié)論
攻讀碩士學(xué)位期間發(fā)表的論文和取得的科研成果
參考文獻(xiàn)
致謝



本文編號:3901148

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3901148.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d1baa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com