Internet推動(dòng)的化學(xué)信息學(xué)重要進(jìn)展
【圖文】:
絡(luò)化學(xué)信息的文本索引(chemistrytext index)開(kāi)始,逐步向建立化合物索引、以及向建立化合物相關(guān)的數(shù)據(jù)的索引發(fā)展(圖1)。其中建立化學(xué)文本索引形成的工具從網(wǎng)絡(luò)化學(xué)信息資源導(dǎo)航系統(tǒng)(chemistry webdirectory)向化學(xué)(文本)專業(yè)搜索引擎(chemistrysearch engine)發(fā)展。圖1 Web化學(xué)信息專門檢索工具從文本檢索引向化合物索引、乃至化合物性質(zhì)數(shù)據(jù)的索引發(fā)展Fig.1 The evolution of web searching tools specific forchemical information, from text index to compound index,further to chemical property data index最近兩三年值得關(guān)注的熱點(diǎn)是建立化合物索引(compound index)的努力,目標(biāo)是建立化合物搜索引擎(chemical/compound search engine)實(shí)現(xiàn)分布在網(wǎng)絡(luò)上多來(lái)源化學(xué)數(shù)據(jù)庫(kù)的統(tǒng)一檢索。一類方法是通過(guò)各個(gè)化學(xué)數(shù)據(jù)庫(kù)主動(dòng)將自己庫(kù)的化合物索引提交到一個(gè)中心站點(diǎn)(DB index deposit),在此基礎(chǔ)上生成化合物的統(tǒng)一索引;另一類方法是通過(guò)化學(xué)深層網(wǎng)(chemistry deep web)深層數(shù)據(jù)結(jié)構(gòu)挖掘和目標(biāo)數(shù)據(jù)·1850·化 學(xué) 進(jìn) 展第20卷
相關(guān)的領(lǐng)域知識(shí)相結(jié)合,設(shè)計(jì)并建立了一個(gè)規(guī)模為1 000萬(wàn)頁(yè)面的化學(xué)(文本)搜索引擎原型系統(tǒng)ChemEngine。ChemEngine的系統(tǒng)結(jié)構(gòu)如圖3所示,與通用搜索引擎的結(jié)構(gòu)類似,由網(wǎng)絡(luò)爬蟲(chóng)、索引器和檢索器三大塊組成,所不同的是ChemEngine的爬蟲(chóng)是一個(gè)化學(xué)主題爬蟲(chóng)(chemistry focused crawler),其檢索器(searcher)可根據(jù)化學(xué)相關(guān)主題進(jìn)行檢索結(jié)果的自動(dòng)分類[23—32]。ChemEngine所解決的關(guān)鍵問(wèn)題是如何在化學(xué)相關(guān)領(lǐng)域知識(shí)的指導(dǎo)下實(shí)現(xiàn)化學(xué)相關(guān)的web頁(yè)面的自動(dòng)發(fā)現(xiàn)和選擇性爬行。ChemEngine利用ChIN[8,9]所積累的網(wǎng)絡(luò)化學(xué)信息源知識(shí)如ChIN的URL庫(kù)、ChIN所索引資源的描述數(shù)圖3 化學(xué)專業(yè)搜索引擎ChemEngine的系統(tǒng)架構(gòu)圖Fig.3 The architecture of chemistry focused search engineChemEngine據(jù)、化學(xué)化工專業(yè)字典等領(lǐng)域知識(shí),采用文本自動(dòng)分類方法用于web頁(yè)面的化學(xué)相關(guān)性判斷,系統(tǒng)分析了建立化學(xué)主題爬蟲(chóng)的各種影響因素
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 夏詔杰;梁春燕;郭力;;化學(xué)主題網(wǎng)絡(luò)爬蟲(chóng)的設(shè)計(jì)和實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2006年10期
2 梁春燕,郭力,夏詔杰,楊章遠(yuǎn);網(wǎng)絡(luò)搜索引擎的性能優(yōu)化策略和相關(guān)技術(shù)[J];計(jì)算機(jī)工程與應(yīng)用;2004年36期
3 儲(chǔ)春梅,李曉霞,郭力;定向查詢引擎在Web化學(xué)數(shù)據(jù)庫(kù)集成檢索中的應(yīng)用[J];計(jì)算機(jī)與應(yīng)用化學(xué);2005年08期
4 祝宇;夏詔杰;聶峰光;郭力;;支持向量機(jī)在化學(xué)主題爬蟲(chóng)中的應(yīng)用[J];計(jì)算機(jī)與應(yīng)用化學(xué);2006年04期
【共引文獻(xiàn)】
相關(guān)期刊論文 前1條
1 唐培麗;解飛;陳志雨;;基于概念檢索的中文搜索引擎研究[J];長(zhǎng)春大學(xué)學(xué)報(bào);2006年04期
相關(guān)碩士學(xué)位論文 前6條
1 董立;Web信息挖掘在公共信息安全中的應(yīng)用[D];山東大學(xué);2007年
2 于歌;搜索引擎中自動(dòng)分類關(guān)鍵技術(shù)研究[D];燕山大學(xué);2006年
3 徐金雷;專業(yè)搜索引擎的排序算法研究[D];南京師范大學(xué);2007年
4 杜光芹;效用驅(qū)動(dòng)的主題Web挖掘算法研究[D];山東師范大學(xué);2007年
5 方利偉;個(gè)性化在線答疑系統(tǒng)的研究與實(shí)現(xiàn)[D];浙江師范大學(xué);2007年
6 周阿連;基于智能Agent的社區(qū)化信息檢索系統(tǒng)的研究[D];大連海事大學(xué);2007年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前9條
1 王建勇,單松巍,雷鳴,謝正茂,李曉明;海量Web搜索引擎系統(tǒng)中用戶行為的分布特征及其啟示[J];中國(guó)科學(xué)E輯;2001年04期
2 王繼成,蕭嶸,孫正興,張福炎;Web信息檢索研究進(jìn)展[J];計(jì)算機(jī)研究與發(fā)展;2001年02期
3 李曉黎,劉繼敏,史忠植;基于支持向量機(jī)與無(wú)監(jiān)督聚類相結(jié)合的中文網(wǎng)頁(yè)分類器[J];計(jì)算機(jī)學(xué)報(bào);2001年01期
4 李曉霞,楊章遠(yuǎn),許志宏;Internet化學(xué)資源的發(fā)展?fàn)顩r與展望[J];計(jì)算機(jī)與應(yīng)用化學(xué);1999年05期
5 黃蘇華,李曉霞,郭力,劉宗紅,楊章遠(yuǎn);基于數(shù)據(jù)庫(kù)的Internet化學(xué)資源導(dǎo)航信息管理與自動(dòng)發(fā)布[J];計(jì)算機(jī)與應(yīng)用化學(xué);2000年03期
6 劉宗紅,李曉霞,郭力,黃蘇華,楊章遠(yuǎn);基于數(shù)據(jù)庫(kù)的Internet化學(xué)資源導(dǎo)航系統(tǒng)與用戶的交互[J];計(jì)算機(jī)與應(yīng)用化學(xué);2000年05期
7 王華彥,李曉霞,郭力,楊章遠(yuǎn);Internet化學(xué)資源導(dǎo)航系統(tǒng)中的相關(guān)資源鏈接[J];計(jì)算機(jī)與應(yīng)用化學(xué);2003年Z1期
8 儲(chǔ)春梅,李曉霞,郭力;定向查詢引擎在Web化學(xué)數(shù)據(jù)庫(kù)集成檢索中的應(yīng)用[J];計(jì)算機(jī)與應(yīng)用化學(xué);2005年08期
9 龐劍鋒,卜東波,白碩;基于向量空間模型的文本自動(dòng)分類系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2001年09期
【相似文獻(xiàn)】
相關(guān)會(huì)議論文 前7條
1 李曉霞;郭力;袁小龍;聶峰光;;Internet推動(dòng)的化學(xué)信息學(xué)重要進(jìn)展[A];中國(guó)化學(xué)會(huì)第26屆學(xué)術(shù)年會(huì)化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)分會(huì)場(chǎng)論文集[C];2008年
2 沈天翔;朱福成;黃迎;謝微;姚建華;;化學(xué)信息學(xué)與“e-科學(xué)”[A];第九屆全國(guó)計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2007年
3 喬園園;李飛;;Mashup開(kāi)發(fā)模式及實(shí)例CHEMap[A];第九屆全國(guó)計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2007年
4 李曉霞;袁小龍;夏詔杰;井銀鈴;聶峰光;唐武成;郭力;;利用ChemDB Portal檢索化學(xué)深層網(wǎng)[A];中國(guó)化學(xué)會(huì)第27屆學(xué)術(shù)年會(huì)第15分會(huì)場(chǎng)摘要集[C];2010年
5 張勇;傅堯;;基于量化的數(shù)據(jù)庫(kù)[A];第九屆全國(guó)計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2007年
6 李佳;黃迎;徐雯麗;胡靜;姚建華;;虛擬技術(shù)與化學(xué)研究[A];中國(guó)化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第16分會(huì)場(chǎng)摘要集[C];2012年
7 李佳;黃迎;解麗娜;凌敏;胡靜;陳碧玲;馮j;姚建華;;虛擬技術(shù)在化學(xué)研究中的應(yīng)用[A];公共安全中的化學(xué)問(wèn)題研究進(jìn)展(第二卷)[C];2011年
相關(guān)碩士學(xué)位論文 前5條
1 劉志剛;天然藥物網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中活性分子3D結(jié)構(gòu)的實(shí)現(xiàn)及其構(gòu)效關(guān)系研究[D];四川大學(xué);2002年
2 曹慶文;常用化學(xué)數(shù)據(jù)資源庫(kù)的構(gòu)建和基于ASP的WEB管理信息系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];四川大學(xué);2003年
3 張靜;MDL數(shù)據(jù)庫(kù)與虛擬篩選技術(shù)跨平臺(tái)對(duì)接技術(shù)研究與應(yīng)用[D];長(zhǎng)春理工大學(xué);2009年
4 曹東升;QSPR/QSAR中分子結(jié)構(gòu)信息的挖掘和建模中奇異樣本檢測(cè)[D];中南大學(xué);2009年
5 李創(chuàng)業(yè);化合物結(jié)構(gòu)的網(wǎng)絡(luò)檢索[D];河北工業(yè)大學(xué);2007年
,本文編號(hào):2573192
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2573192.html