基于學(xué)術(shù)社區(qū)的學(xué)術(shù)搜索引擎設(shè)計(jì)
本文選題:學(xué)術(shù)社區(qū) + 學(xué)術(shù)搜索引擎; 參考:《計(jì)算機(jī)科學(xué)》2011年08期
【摘要】:學(xué)術(shù)社區(qū)和學(xué)術(shù)搜索引擎在科研活動(dòng)中日趨重要。給出了一個(gè)基于學(xué)術(shù)社區(qū)的學(xué)術(shù)搜索引擎的設(shè)計(jì)方案,指出了它應(yīng)具備的功能,提出了應(yīng)著重解決的關(guān)鍵問題,并對(duì)部分問題提出了實(shí)現(xiàn)思路。給出了系統(tǒng)的架構(gòu)設(shè)計(jì),并討論了文獻(xiàn)資料的整合算法,將分散在不同位置、提供不同內(nèi)容的學(xué)術(shù)信息組合為一個(gè)整體,有效地解決了文獻(xiàn)提取問題。針對(duì)普通中文分詞組件在對(duì)姓名進(jìn)行分詞時(shí)準(zhǔn)確率較低的問題,設(shè)計(jì)了一個(gè)專門針對(duì)姓名進(jìn)行分詞的高效的算法。在開源框架Nutch和HBase的基礎(chǔ)上,實(shí)現(xiàn)了一個(gè)學(xué)術(shù)搜索引擎,并在實(shí)驗(yàn)中驗(yàn)證了設(shè)計(jì)的有效性。
[Abstract]:Academic community and academic search engine are becoming more and more important in scientific research activities. This paper presents a design scheme of academic search engine based on academic community, points out its function, puts forward some key problems that should be solved emphatically, and puts forward some realization ideas for some problems. The architecture design of the system is given, and the algorithm of document data integration is discussed. The academic information, which is scattered in different places and provides different contents, is combined into a whole, which effectively solves the problem of document extraction. In order to solve the problem that the accuracy of the common Chinese word partitioning component is low when the name is partitioned, an efficient algorithm is designed to deal with the name segmentation. Based on the open source frameworks Nutch and HBase, an academic search engine is implemented, and the effectiveness of the design is verified in the experiment.
【作者單位】: 中山大學(xué)信息科學(xué)與技術(shù)學(xué)院;華南師范大學(xué)計(jì)算機(jī)學(xué)院;
【基金】:國家自然科學(xué)基金時(shí)態(tài)角色關(guān)系模型及協(xié)同感知技術(shù)研究(60970044) 廣東自然科技計(jì)劃項(xiàng)目面向?qū)W術(shù)信息服務(wù)領(lǐng)域的協(xié)同軟件平臺(tái)(2010B010600031)資助
【分類號(hào)】:TP391.3
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 王麗娟;關(guān)守義;王曉龍;王熙照;;基于屬性權(quán)重的Fuzzy C Mean算法[J];計(jì)算機(jī)學(xué)報(bào);2006年10期
2 朱恒民;王寧生;;一種改進(jìn)的相似重復(fù)記錄檢測方法[J];控制與決策;2006年07期
3 郭志懋,周傲英;數(shù)據(jù)質(zhì)量和數(shù)據(jù)清洗研究綜述[J];軟件學(xué)報(bào);2002年11期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張嵐;金濤;;學(xué)術(shù)搜索引擎Google Scholar與Scirus使用技巧[J];江西圖書館學(xué)刊;2008年03期
2 于寧;龐海燕;;科學(xué)搜索引擎與學(xué)術(shù)搜索工具——Scirus與Google Scholar比較研究[J];現(xiàn)代情報(bào);2009年06期
3 蘇建華;汪洋;;學(xué)術(shù)搜索引擎的特點(diǎn)及發(fā)展趨勢——從OJOSE與CNKI知識(shí)搜索的比較談起[J];圖書館學(xué)刊;2008年02期
4 張薔;;學(xué)術(shù)搜索引擎的特點(diǎn)及發(fā)展趨勢——基于Google Scholar、百度國學(xué)、CNKI、Scirus的比較研究[J];軟件導(dǎo)刊;2010年09期
5 陳紅勤;;學(xué)術(shù)隱蔽網(wǎng)絡(luò)和學(xué)術(shù)搜索引擎[J];現(xiàn)代情報(bào);2008年07期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)博士學(xué)位論文 前1條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
,本文編號(hào):1873425
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1873425.html