國際專利分類法與中圖分類法類目映射研究
發(fā)布時間:2022-02-22 10:43
信息資源的海量劇增,導致我國科技信息用戶在“信息爆炸”的環(huán)境中,飽受“知識饑荒”和“找不到真正所需求的和最新的信息和數(shù)據(jù)”。專利作為一種具有特殊性質(zhì)的文獻,包含了先進的技術方案,但同時存在管理困難、相對孤立、使用率低等弊端!秶H專利分類法》(International Patent Classification,以下簡稱IPC)是目前國際上最通用的管理和利用專利文獻的工具,通過在IPC與《中國圖書館分類法》(Chinese Library Classification,以下簡稱CLC)的類目之間建立映射從而建立二者的關聯(lián),為實現(xiàn)專利和期刊資源交叉瀏覽和交叉檢索提供極大的便利。本文在調(diào)研相關領域現(xiàn)有的方法后,采用兩種映射方法來實現(xiàn)IPC與CLC之間的類目映射,二者分別基于類目相似度和交叉檢索原理。在計算類目相似度的過程中本文為類目定義一個概念模型,同時引入兩種詞匯相似度計算方法。考慮到用這種方法建立映射過程中受到的人工干預比較大,為了降低人工干預對實驗結果的影響,本文設計了另一種基于交叉檢索的方法進行映射實驗,該方法的實現(xiàn)更多依賴于數(shù)學統(tǒng)計而非某種知識組織。最后通過實驗證明這兩種方法的...
【文章來源】:北京林業(yè)大學北京市211工程院校教育部直屬院校
【文章頁數(shù)】:52 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景
1.2 研究目的和意義
1.3 研究內(nèi)容及方法
1.4 IPC與CLC的體系結構分析
1.4.1 編制原則的差異
1.4.2 體系結構的差異
1.4.3 類目描述的差異
1.5 分類法映射研究現(xiàn)狀
1.5.1 國外分類法映射研究
1.5.2 國內(nèi)分類法映射研究
1.6 論文組織結構
2 IPC、CLC映射方法研究與實現(xiàn)
2.1 基于類目相似度實現(xiàn)分類法映射
2.1.1 基本原理
2.1.2 類目概念模型的設計
2.1.3 類目特征詞的抽取
2.1.3.1 現(xiàn)有關鍵詞抽取技術
2.1.3.2 詞庫設計
2.1.3.3 方法概述
2.1.3.4 最大匹配算法
2.1.3.5 權重計算
2.1.4 詞匯相似度計算
2.1.4.1 基于主題詞表的相似度計算
2.1.4.2 基于雙序列比對的相似度計算
2.1.5 類目相似度計算
2.1.5.1 類目特征詞集的相似度
2.1.5.2 類目所在環(huán)境的相似度
2.2 基于交叉檢索實現(xiàn)分類法映射
2.2.1 基本原理
2.2.2 實現(xiàn)方法
2.3 小結
3 實驗驗證
3.1 實驗數(shù)據(jù)
3.1.1 中文期刊語料庫
3.1.2 專利文獻庫
3.2 關鍵詞抽取實驗
3.3 詞匯相似度計算實驗
3.4 映射實驗
3.4.1 基于交叉檢索的映射實驗
3.4.2 基于類目相似度的映射實驗
3.5 小結
4 結論與展望
4.1 結論
4.2 展望
參考文獻
個人簡介
導師簡介
獲得成果目錄清單
致謝
【參考文獻】:
期刊論文
[1]我國專利文獻信息利用的現(xiàn)狀與問題及對策[J]. 李保集,郭小秦. 科技情報開發(fā)與經(jīng)濟. 2009(06)
[2]正向最大匹配法在中文分詞技術中的應用[J]. 胡錫衡. 鞍山師范學院學報. 2008(02)
[3]《中國圖書館分類法》(第四版)修訂構想[J]. 卜書慶,汪東波. 國家圖書館學刊. 2008(02)
[4]一種基于TFIDF方法的中文關鍵詞抽取算法[J]. 徐文海,溫有奎. 情報理論與實踐. 2008(02)
[5]自動標引研究的回顧與展望[J]. 章成志. 現(xiàn)代圖書情報技術. 2007(11)
[6]知識組織系統(tǒng)的互操作及其實現(xiàn)[J]. 司莉. 現(xiàn)代圖書情報技術. 2007(03)
[7]跨領域多來源主題詞表集成與服務研究[J]. 朱禮軍,趙新力,喬曉東,孫欽山. 現(xiàn)代圖書情報技術. 2007(01)
[8]一種改進的MM分詞方法的研究與實現(xiàn)[J]. 路永剛,趙偉. 長春工業(yè)大學學報(自然科學版). 2006(04)
[9]一種基于詞匯鏈的關鍵詞抽取方法[J]. 索紅光,劉玉樹,曹淑英. 中文信息學報. 2006(06)
[10]分類法映射在學科信息門戶交叉瀏覽中的應用——以Renardus為例[J]. 李育嫦. 圖書館學研究. 2006(10)
碩士論文
[1]基于情報檢索語言互操作技術的集成詞庫構建研究[D]. 劉華梅.南京農(nóng)業(yè)大學 2006
本文編號:3639290
【文章來源】:北京林業(yè)大學北京市211工程院校教育部直屬院校
【文章頁數(shù)】:52 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景
1.2 研究目的和意義
1.3 研究內(nèi)容及方法
1.4 IPC與CLC的體系結構分析
1.4.1 編制原則的差異
1.4.2 體系結構的差異
1.4.3 類目描述的差異
1.5 分類法映射研究現(xiàn)狀
1.5.1 國外分類法映射研究
1.5.2 國內(nèi)分類法映射研究
1.6 論文組織結構
2 IPC、CLC映射方法研究與實現(xiàn)
2.1 基于類目相似度實現(xiàn)分類法映射
2.1.1 基本原理
2.1.2 類目概念模型的設計
2.1.3 類目特征詞的抽取
2.1.3.1 現(xiàn)有關鍵詞抽取技術
2.1.3.2 詞庫設計
2.1.3.3 方法概述
2.1.3.4 最大匹配算法
2.1.3.5 權重計算
2.1.4 詞匯相似度計算
2.1.4.1 基于主題詞表的相似度計算
2.1.4.2 基于雙序列比對的相似度計算
2.1.5 類目相似度計算
2.1.5.1 類目特征詞集的相似度
2.1.5.2 類目所在環(huán)境的相似度
2.2 基于交叉檢索實現(xiàn)分類法映射
2.2.1 基本原理
2.2.2 實現(xiàn)方法
2.3 小結
3 實驗驗證
3.1 實驗數(shù)據(jù)
3.1.1 中文期刊語料庫
3.1.2 專利文獻庫
3.2 關鍵詞抽取實驗
3.3 詞匯相似度計算實驗
3.4 映射實驗
3.4.1 基于交叉檢索的映射實驗
3.4.2 基于類目相似度的映射實驗
3.5 小結
4 結論與展望
4.1 結論
4.2 展望
參考文獻
個人簡介
導師簡介
獲得成果目錄清單
致謝
【參考文獻】:
期刊論文
[1]我國專利文獻信息利用的現(xiàn)狀與問題及對策[J]. 李保集,郭小秦. 科技情報開發(fā)與經(jīng)濟. 2009(06)
[2]正向最大匹配法在中文分詞技術中的應用[J]. 胡錫衡. 鞍山師范學院學報. 2008(02)
[3]《中國圖書館分類法》(第四版)修訂構想[J]. 卜書慶,汪東波. 國家圖書館學刊. 2008(02)
[4]一種基于TFIDF方法的中文關鍵詞抽取算法[J]. 徐文海,溫有奎. 情報理論與實踐. 2008(02)
[5]自動標引研究的回顧與展望[J]. 章成志. 現(xiàn)代圖書情報技術. 2007(11)
[6]知識組織系統(tǒng)的互操作及其實現(xiàn)[J]. 司莉. 現(xiàn)代圖書情報技術. 2007(03)
[7]跨領域多來源主題詞表集成與服務研究[J]. 朱禮軍,趙新力,喬曉東,孫欽山. 現(xiàn)代圖書情報技術. 2007(01)
[8]一種改進的MM分詞方法的研究與實現(xiàn)[J]. 路永剛,趙偉. 長春工業(yè)大學學報(自然科學版). 2006(04)
[9]一種基于詞匯鏈的關鍵詞抽取方法[J]. 索紅光,劉玉樹,曹淑英. 中文信息學報. 2006(06)
[10]分類法映射在學科信息門戶交叉瀏覽中的應用——以Renardus為例[J]. 李育嫦. 圖書館學研究. 2006(10)
碩士論文
[1]基于情報檢索語言互操作技術的集成詞庫構建研究[D]. 劉華梅.南京農(nóng)業(yè)大學 2006
本文編號:3639290
本文鏈接:http://sikaile.net/tushudanganlunwen/3639290.html