天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于概念空間的文本語義索引

發(fā)布時間:2018-11-15 09:13
【摘要】:正 1 引言據(jù)統(tǒng)計,在現(xiàn)今的聯(lián)機存儲信息中,80%以上的信息以文本的形式存在。信息的多元化、復(fù)雜化,致使信息的自動索引成為急需解決的問題。本文研究的內(nèi)容是建立一個基于概念空間的文本語義索引。目前的文本索引都是建立在文本空間,或關(guān)鍵詞空間上的,而建立在概念空間上的索引具有條理清晰、人機界面友好、符合通常檢索習(xí)慣等許多優(yōu)勢,這也是文本語義索引發(fā)展的方向。另外.在建立文本索引的過程中,國內(nèi)外大多使用Hopfield神經(jīng)網(wǎng)絡(luò)聯(lián)想的方法,本文首次使用直接聚類法代替了Hopfield神經(jīng)網(wǎng)絡(luò)聯(lián)想功能,這樣使得索引具有很好的可擴展性;谡Z義關(guān)聯(lián)度的文本索引可以廣泛應(yīng)用于Internet搜索引擎、數(shù)字圖書館、電子商務(wù)等眾多領(lǐng)域中。建立文本索引的過程主要有以下幾部分: 1)對文檔分類,建立文檔的概念空間,在概念空間的層次上組織文檔并確定文檔中出現(xiàn)的關(guān)鍵詞。
[Abstract]:According to statistics, more than 80% of the online storage information exists in the form of text. The diversification and complexity of information makes automatic indexing of information an urgent problem. The content of this paper is to build a semantic index of text based on concept space. At present, all text indexes are built on the text space or keyword space, but the index based on the concept space has many advantages, such as clear structure, friendly man-machine interface, consistent with the common retrieval habits and so on. This is also the direction of text semantic index. In addition. In the process of establishing text index, most of the methods of Hopfield neural network association are used at home and abroad. In this paper, the direct clustering method is used to replace the Hopfield neural network association function for the first time, which makes the index have good expansibility. Text indexing based on semantic correlation can be widely used in many fields, such as Internet search engine, digital library, electronic commerce and so on. The process of establishing text index includes the following parts: 1) classifying documents, establishing concept space of documents, organizing documents at the level of concept space and determining the keywords appearing in documents.
【作者單位】: 中國科技大學(xué)研究生院計算機學(xué)部 中科院計算技術(shù)研究所智能信息處理開放實驗室 中科院計算技術(shù)研究所智能信息處理開放實驗室 中科院計算技術(shù)研究所智能信息處理開放實驗室
【基金】:國家自然科學(xué)基金(課題號60073019、69803010)
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前10條

1 李源,何清,史忠植;基于概念語義空間的聯(lián)想檢索[J];北京科技大學(xué)學(xué)報;2001年06期

2 郭俊榮;楊捧;王紫薇;;一種基于信息粒度的信息檢索優(yōu)化方法[J];計算機仿真;2010年08期

3 黃海英;林士敏;嚴小衛(wèi);;基于概念空間的文本分類研究[J];計算機科學(xué);2003年03期

4 黨齊民,呂冬煜;基于詞關(guān)聯(lián)語義的文本分類研究[J];計算機應(yīng)用;2004年04期

5 羅三定,陸文彥,王浩,賈維嘉;基于概念的文本類別特征提取與文本模糊匹配[J];計算機工程與應(yīng)用;2002年16期

6 史田華;;語義檢索技術(shù)研究[J];圖書館雜志;2001年11期

7 丁露;崔平;;SOM聚類算法在文本分類上的應(yīng)用[J];現(xiàn)代情報;2007年09期

8 陳燕;龍建勛;;基于明確語義分析的自動文摘算法[J];計算機工程;2011年03期

9 張學(xué)福;;基于詞共現(xiàn)的可視化概念空間研究[J];情報學(xué)報;2008年02期

10 張明寶;馬靜;施秀麗;;領(lǐng)域本體在信息檢索中的應(yīng)用研究[J];情報學(xué)報;2010年02期

相關(guān)會議論文 前10條

1 李素建;李蕓;紀鷺寧;徐睿峰;;詞典匹配和串頻統(tǒng)計相結(jié)合在自動主題分析中的應(yīng)用[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

2 趙恩彪;隋金君;王自亮;李智;;電荷法測量粉塵濃度技術(shù)研究[A];第八屆全國采礦學(xué)術(shù)會議論文集[C];2009年

3 李曉棟;胡清華;;汽輪機故障診斷文本支持系統(tǒng)的研究與建立[A];2004電站自動化信息化學(xué)術(shù)技術(shù)交流會議論文集[C];2004年

4 張靖;趙明清;;粗糙集理論在建立線性計量經(jīng)濟模型中的應(yīng)用[A];中國企業(yè)運籌學(xué)學(xué)術(shù)交流大會論文集[C];2005年

5 肖詩斌;孫麗華;王弘尉;施水才;;指標信息抽取技術(shù)的研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

6 丁春;;論自由詞向關(guān)鍵詞轉(zhuǎn)換的意義[A];學(xué)報編輯論叢(第十二集)[C];2004年

7 齊敏霞;左廷榮;于曉明;;壽光商務(wù)小區(qū)暖通空調(diào)節(jié)能設(shè)計[A];全國暖通空調(diào)制冷2008年學(xué)術(shù)年會資料集[C];2008年

8 趙[,

本文編號:2332872


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2332872.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dc313***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com