WWW科技信息資源自動(dòng)標(biāo)引的理論與實(shí)踐研究
發(fā)布時(shí)間:2020-12-07 16:49
隨著因特網(wǎng)的迅速發(fā)展和廣泛應(yīng)用,它逐漸成為目前最大的信息資源寶庫(kù)和最主要的信息交流渠道,由于因特網(wǎng)信息資源的顯著特點(diǎn)是量大而無(wú)序,故隨之出現(xiàn)了“數(shù)據(jù)豐富,知識(shí)貧乏”現(xiàn)象,F(xiàn)有的搜索引擎大多是基于關(guān)鍵字的全文檢索系統(tǒng),較少考慮信息的語(yǔ)義問(wèn)題,因而不能夠滿(mǎn)足用戶(hù)的不同需求,廣大用戶(hù)也很難利用它們來(lái)獲取因特網(wǎng)中許多有價(jià)值的知識(shí)。為此,本論文針對(duì)WWW科技信息資源自動(dòng)標(biāo)引展開(kāi)理論和實(shí)踐兩方面的研究,其主要研究目的如下:為處理因特網(wǎng)信息資源提供技術(shù)支持,為普通用戶(hù)檢索因特網(wǎng)信息資源提供便利,為建設(shè)中國(guó)數(shù)字圖書(shū)館提供新的研究思路。 論文提出了基于《中國(guó)分類(lèi)主題詞表》的WWW科技信息資源自動(dòng)標(biāo)引系統(tǒng)(STAI)設(shè)計(jì)方案,該系統(tǒng)具有WWW網(wǎng)頁(yè)的格式自動(dòng)檢測(cè)與轉(zhuǎn)換、自動(dòng)分詞與自由詞標(biāo)引、自動(dòng)分類(lèi)標(biāo)引和主題標(biāo)引等功能。STAI系統(tǒng)是一個(gè)自動(dòng)化程度較高的易用型軟件,該試驗(yàn)系統(tǒng)可以同時(shí)實(shí)現(xiàn)中英文網(wǎng)頁(yè)的自動(dòng)標(biāo)引,兼顧了如何結(jié)合自然語(yǔ)言與情報(bào)檢索語(yǔ)言二者在信息檢索方面各自的優(yōu)越性。在STAI系統(tǒng)設(shè)計(jì)和實(shí)踐過(guò)程中,本論文做出了一定的創(chuàng)新性嘗試。例如,采用了結(jié)構(gòu)化程序設(shè)計(jì)方法等先進(jìn)的程序設(shè)計(jì)思想,重視Activ...
【文章來(lái)源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心)北京市
【文章頁(yè)數(shù)】:130 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
第1章 引論
1.1 研究背景
1.2 研究目的
1.3 研究意義
1.4 主要技術(shù)難點(diǎn)
1.5 論文的組織安排
第2章 書(shū)面漢語(yǔ)自動(dòng)分詞
2.1 書(shū)面漢語(yǔ)自動(dòng)分詞概述
2.1.1 書(shū)面漢語(yǔ)自動(dòng)分詞的研究意義
2.1.2 書(shū)面漢語(yǔ)自動(dòng)分詞的難點(diǎn)
2.2 書(shū)面漢語(yǔ)自動(dòng)分詞方法評(píng)介
2.2.1 基于字符串匹配的分詞方法(機(jī)械匹配法)
2.2.2 基于理解的分詞方法
2.2.3 基于統(tǒng)計(jì)的分詞方法
2.2.4 基于標(biāo)志的分詞方法
2.2.5 基于神經(jīng)網(wǎng)絡(luò)的分詞方法
2.3 主要書(shū)面漢語(yǔ)自動(dòng)分詞系統(tǒng)評(píng)介
第3章 文獻(xiàn)自動(dòng)標(biāo)引
3.1 自動(dòng)標(biāo)引相關(guān)概念
3.1.1 文獻(xiàn)標(biāo)引
3.1.2 文獻(xiàn)自動(dòng)標(biāo)引
3.2 英語(yǔ)文獻(xiàn)自動(dòng)標(biāo)引方法
3.3 漢語(yǔ)文獻(xiàn)自動(dòng)標(biāo)引方法
第4章 文獻(xiàn)自動(dòng)分類(lèi)
4.1 文獻(xiàn)自動(dòng)分類(lèi)概述
4.1.1 文獻(xiàn)自動(dòng)分類(lèi)的研究意義
4.1.2 文獻(xiàn)自動(dòng)分類(lèi)的主要方法
4.2 自動(dòng)分類(lèi)國(guó)外研究概況
4.3 自動(dòng)分類(lèi)國(guó)內(nèi)研究概況
4.3.1 基于詞典法的中文自動(dòng)分類(lèi)系統(tǒng)
4.3.2 基于專(zhuān)家系統(tǒng)的中文自動(dòng)分類(lèi)系統(tǒng)
4.3.3 現(xiàn)有中文自動(dòng)分類(lèi)系統(tǒng)存在的缺陷
4.4 自動(dòng)分類(lèi)的未來(lái)發(fā)展方向
第5章 STAI系統(tǒng)的總體設(shè)計(jì)思想
5.1 STAI系統(tǒng)概述
5.2 STAI系統(tǒng)的功能設(shè)計(jì)
5.2.1 網(wǎng)頁(yè)格式的自動(dòng)檢測(cè)與轉(zhuǎn)換
5.2.2 關(guān)鍵詞的自動(dòng)抽取
5.2.3 WWW網(wǎng)頁(yè)的自動(dòng)標(biāo)引
5.3 STAI系統(tǒng)的體系結(jié)構(gòu)設(shè)計(jì)
5.4 STAI系統(tǒng)的開(kāi)發(fā)環(huán)境
5.4.1 STAI系統(tǒng)的軟件開(kāi)發(fā)環(huán)境
5.4.2 STAI系統(tǒng)的硬件開(kāi)發(fā)環(huán)境
5.5 STAI系統(tǒng)的數(shù)據(jù)庫(kù)設(shè)計(jì)
5.5.1 STAI數(shù)據(jù)庫(kù)的概念設(shè)計(jì)
5.5.2 STAI數(shù)據(jù)庫(kù)的邏輯設(shè)計(jì)
第6章 格式預(yù)處理模塊的實(shí)現(xiàn)
6.1 BIG5/GB碼的自動(dòng)檢測(cè)和轉(zhuǎn)換
6.1.1 BIG5/GB碼的自動(dòng)識(shí)別
6.1.2 BIG5/GB碼的自動(dòng)轉(zhuǎn)換
6.2 創(chuàng)建BIG5/GB內(nèi)碼自動(dòng)檢測(cè)和轉(zhuǎn)換ActiveX控件
6.2.1 BIG5GBControl控件的創(chuàng)建步驟
6.2.2 BIG5GBControl控件的實(shí)現(xiàn)情況
6.3 因特網(wǎng)文檔格式的轉(zhuǎn)換
6.3.1 因特網(wǎng)上的主要文檔格式
6.3.2 將HTML格式自動(dòng)轉(zhuǎn)換成純文本格式的實(shí)現(xiàn)
第7章 自動(dòng)分詞與自由詞標(biāo)引模塊的實(shí)現(xiàn)
7.1 自動(dòng)分詞與自出詞標(biāo)引模塊的主要設(shè)計(jì)思路
7.2 構(gòu)造適用于書(shū)面漢語(yǔ)自動(dòng)分詞的機(jī)器詞典
7.2.1 中文詞典概況
7.2.2 構(gòu)建適用于WWW科技信息資源自動(dòng)標(biāo)引的中文分詞詞典
7.3 自動(dòng)分詞與自由詞標(biāo)引模塊的實(shí)現(xiàn)情況分析
第8章 自動(dòng)分類(lèi)和主題標(biāo)引模塊的實(shí)現(xiàn)
8.1 自動(dòng)分類(lèi)和主題標(biāo)引模塊的主要設(shè)計(jì)思路
8.1.1 自動(dòng)分類(lèi)和主題標(biāo)引模塊的技術(shù)難點(diǎn)
8.1.2 自動(dòng)分類(lèi)和主題標(biāo)引模塊的主要算法
8.2 構(gòu)造用于自動(dòng)分類(lèi)標(biāo)引和主題標(biāo)引的分類(lèi)機(jī)器詞典
8.3 自動(dòng)分類(lèi)和主題標(biāo)引模塊的實(shí)現(xiàn)情況分析
第9章 結(jié)束語(yǔ)
9.1 研究工作總結(jié)
9.2 今后研究計(jì)劃
參考文獻(xiàn)
研究成果和發(fā)表文章目錄
致謝
【參考文獻(xiàn)】:
期刊論文
[1]國(guó)內(nèi)外數(shù)字圖書(shū)館研究現(xiàn)狀及未來(lái)走向[J]. 肖明,沈英. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2000(06)
[2]中國(guó)文獻(xiàn)分類(lèi)學(xué)研究50年(1949-1999)[J]. 白國(guó)應(yīng). 中國(guó)圖書(shū)館學(xué)報(bào). 1999(05)
[3]中文信息自動(dòng)分類(lèi)系統(tǒng)及其神經(jīng)網(wǎng)絡(luò)優(yōu)化算法[J]. 刁倩,王永成,張惠惠. 信息與控制. 1999(03)
[4]語(yǔ)言社群類(lèi)型與臺(tái)灣的外來(lái)詞[J]. 史有為. 語(yǔ)言文字應(yīng)用. 1999(02)
[5]二十年來(lái)現(xiàn)代漢語(yǔ)新詞語(yǔ)的特點(diǎn)及其產(chǎn)生渠道[J]. 朱永鍇,林倫倫. 語(yǔ)言文字應(yīng)用. 1999(02)
[6]自動(dòng)分類(lèi)研究現(xiàn)狀與展望[J]. 成穎,史九林. 情報(bào)學(xué)報(bào). 1999(01)
[7]缺乏抽詞詞典是自動(dòng)抽詞標(biāo)引難以普及的主要原因[J]. 張琪玉. 圖書(shū)與情報(bào). 1998(02)
[8]中文文獻(xiàn)主題的自動(dòng)標(biāo)引[J]. 王永成,顧曉明,王麗霞. 情報(bào)學(xué)報(bào). 1998(03)
[9]圖書(shū)分類(lèi)中應(yīng)用專(zhuān)家系統(tǒng)的嘗試[J]. 鄧要武,崔光益,王連俊. 圖書(shū)館雜志. 1998(04)
[10]基于《金融檔案分類(lèi)表》的自動(dòng)分類(lèi)算法研究[J]. 劉開(kāi)瑛,鄭家恒,劉靜. 情報(bào)學(xué)報(bào). 1997(05)
博士論文
[1]Internet科技信息資源門(mén)戶(hù)網(wǎng)站(STIP)系統(tǒng)的實(shí)踐研究[D]. 張智雄.中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心 2000
本文編號(hào):2903581
【文章來(lái)源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心)北京市
【文章頁(yè)數(shù)】:130 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
第1章 引論
1.1 研究背景
1.2 研究目的
1.3 研究意義
1.4 主要技術(shù)難點(diǎn)
1.5 論文的組織安排
第2章 書(shū)面漢語(yǔ)自動(dòng)分詞
2.1 書(shū)面漢語(yǔ)自動(dòng)分詞概述
2.1.1 書(shū)面漢語(yǔ)自動(dòng)分詞的研究意義
2.1.2 書(shū)面漢語(yǔ)自動(dòng)分詞的難點(diǎn)
2.2 書(shū)面漢語(yǔ)自動(dòng)分詞方法評(píng)介
2.2.1 基于字符串匹配的分詞方法(機(jī)械匹配法)
2.2.2 基于理解的分詞方法
2.2.3 基于統(tǒng)計(jì)的分詞方法
2.2.4 基于標(biāo)志的分詞方法
2.2.5 基于神經(jīng)網(wǎng)絡(luò)的分詞方法
2.3 主要書(shū)面漢語(yǔ)自動(dòng)分詞系統(tǒng)評(píng)介
第3章 文獻(xiàn)自動(dòng)標(biāo)引
3.1 自動(dòng)標(biāo)引相關(guān)概念
3.1.1 文獻(xiàn)標(biāo)引
3.1.2 文獻(xiàn)自動(dòng)標(biāo)引
3.2 英語(yǔ)文獻(xiàn)自動(dòng)標(biāo)引方法
3.3 漢語(yǔ)文獻(xiàn)自動(dòng)標(biāo)引方法
第4章 文獻(xiàn)自動(dòng)分類(lèi)
4.1 文獻(xiàn)自動(dòng)分類(lèi)概述
4.1.1 文獻(xiàn)自動(dòng)分類(lèi)的研究意義
4.1.2 文獻(xiàn)自動(dòng)分類(lèi)的主要方法
4.2 自動(dòng)分類(lèi)國(guó)外研究概況
4.3 自動(dòng)分類(lèi)國(guó)內(nèi)研究概況
4.3.1 基于詞典法的中文自動(dòng)分類(lèi)系統(tǒng)
4.3.2 基于專(zhuān)家系統(tǒng)的中文自動(dòng)分類(lèi)系統(tǒng)
4.3.3 現(xiàn)有中文自動(dòng)分類(lèi)系統(tǒng)存在的缺陷
4.4 自動(dòng)分類(lèi)的未來(lái)發(fā)展方向
第5章 STAI系統(tǒng)的總體設(shè)計(jì)思想
5.1 STAI系統(tǒng)概述
5.2 STAI系統(tǒng)的功能設(shè)計(jì)
5.2.1 網(wǎng)頁(yè)格式的自動(dòng)檢測(cè)與轉(zhuǎn)換
5.2.2 關(guān)鍵詞的自動(dòng)抽取
5.2.3 WWW網(wǎng)頁(yè)的自動(dòng)標(biāo)引
5.3 STAI系統(tǒng)的體系結(jié)構(gòu)設(shè)計(jì)
5.4 STAI系統(tǒng)的開(kāi)發(fā)環(huán)境
5.4.1 STAI系統(tǒng)的軟件開(kāi)發(fā)環(huán)境
5.4.2 STAI系統(tǒng)的硬件開(kāi)發(fā)環(huán)境
5.5 STAI系統(tǒng)的數(shù)據(jù)庫(kù)設(shè)計(jì)
5.5.1 STAI數(shù)據(jù)庫(kù)的概念設(shè)計(jì)
5.5.2 STAI數(shù)據(jù)庫(kù)的邏輯設(shè)計(jì)
第6章 格式預(yù)處理模塊的實(shí)現(xiàn)
6.1 BIG5/GB碼的自動(dòng)檢測(cè)和轉(zhuǎn)換
6.1.1 BIG5/GB碼的自動(dòng)識(shí)別
6.1.2 BIG5/GB碼的自動(dòng)轉(zhuǎn)換
6.2 創(chuàng)建BIG5/GB內(nèi)碼自動(dòng)檢測(cè)和轉(zhuǎn)換ActiveX控件
6.2.1 BIG5GBControl控件的創(chuàng)建步驟
6.2.2 BIG5GBControl控件的實(shí)現(xiàn)情況
6.3 因特網(wǎng)文檔格式的轉(zhuǎn)換
6.3.1 因特網(wǎng)上的主要文檔格式
6.3.2 將HTML格式自動(dòng)轉(zhuǎn)換成純文本格式的實(shí)現(xiàn)
第7章 自動(dòng)分詞與自由詞標(biāo)引模塊的實(shí)現(xiàn)
7.1 自動(dòng)分詞與自出詞標(biāo)引模塊的主要設(shè)計(jì)思路
7.2 構(gòu)造適用于書(shū)面漢語(yǔ)自動(dòng)分詞的機(jī)器詞典
7.2.1 中文詞典概況
7.2.2 構(gòu)建適用于WWW科技信息資源自動(dòng)標(biāo)引的中文分詞詞典
7.3 自動(dòng)分詞與自由詞標(biāo)引模塊的實(shí)現(xiàn)情況分析
第8章 自動(dòng)分類(lèi)和主題標(biāo)引模塊的實(shí)現(xiàn)
8.1 自動(dòng)分類(lèi)和主題標(biāo)引模塊的主要設(shè)計(jì)思路
8.1.1 自動(dòng)分類(lèi)和主題標(biāo)引模塊的技術(shù)難點(diǎn)
8.1.2 自動(dòng)分類(lèi)和主題標(biāo)引模塊的主要算法
8.2 構(gòu)造用于自動(dòng)分類(lèi)標(biāo)引和主題標(biāo)引的分類(lèi)機(jī)器詞典
8.3 自動(dòng)分類(lèi)和主題標(biāo)引模塊的實(shí)現(xiàn)情況分析
第9章 結(jié)束語(yǔ)
9.1 研究工作總結(jié)
9.2 今后研究計(jì)劃
參考文獻(xiàn)
研究成果和發(fā)表文章目錄
致謝
【參考文獻(xiàn)】:
期刊論文
[1]國(guó)內(nèi)外數(shù)字圖書(shū)館研究現(xiàn)狀及未來(lái)走向[J]. 肖明,沈英. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2000(06)
[2]中國(guó)文獻(xiàn)分類(lèi)學(xué)研究50年(1949-1999)[J]. 白國(guó)應(yīng). 中國(guó)圖書(shū)館學(xué)報(bào). 1999(05)
[3]中文信息自動(dòng)分類(lèi)系統(tǒng)及其神經(jīng)網(wǎng)絡(luò)優(yōu)化算法[J]. 刁倩,王永成,張惠惠. 信息與控制. 1999(03)
[4]語(yǔ)言社群類(lèi)型與臺(tái)灣的外來(lái)詞[J]. 史有為. 語(yǔ)言文字應(yīng)用. 1999(02)
[5]二十年來(lái)現(xiàn)代漢語(yǔ)新詞語(yǔ)的特點(diǎn)及其產(chǎn)生渠道[J]. 朱永鍇,林倫倫. 語(yǔ)言文字應(yīng)用. 1999(02)
[6]自動(dòng)分類(lèi)研究現(xiàn)狀與展望[J]. 成穎,史九林. 情報(bào)學(xué)報(bào). 1999(01)
[7]缺乏抽詞詞典是自動(dòng)抽詞標(biāo)引難以普及的主要原因[J]. 張琪玉. 圖書(shū)與情報(bào). 1998(02)
[8]中文文獻(xiàn)主題的自動(dòng)標(biāo)引[J]. 王永成,顧曉明,王麗霞. 情報(bào)學(xué)報(bào). 1998(03)
[9]圖書(shū)分類(lèi)中應(yīng)用專(zhuān)家系統(tǒng)的嘗試[J]. 鄧要武,崔光益,王連俊. 圖書(shū)館雜志. 1998(04)
[10]基于《金融檔案分類(lèi)表》的自動(dòng)分類(lèi)算法研究[J]. 劉開(kāi)瑛,鄭家恒,劉靜. 情報(bào)學(xué)報(bào). 1997(05)
博士論文
[1]Internet科技信息資源門(mén)戶(hù)網(wǎng)站(STIP)系統(tǒng)的實(shí)踐研究[D]. 張智雄.中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心 2000
本文編號(hào):2903581
本文鏈接:http://sikaile.net/tushudanganlunwen/2903581.html
最近更新
教材專(zhuān)著