一種基于雙數(shù)組Trie的B2B規(guī)則串提取方法
[Abstract]:In order to solve the problem that it is difficult to extract product specification information from B2B vertical search engine, a rule string extraction method based on double array Trie (Double-Array Trie) is proposed. In this method, the rule string is constructed according to the rule characteristics of "parameter name: parameter value" string in B2B system, and the double array Trie tree is generated, and the subtree with the most branch nodes is given priority to improve the storage efficiency. In this method, all the rule strings can be obtained by scanning the search text once, and the candidate strings can be filtered effectively by adding constraints to the rules in order to improve the extraction accuracy of the rule strings. The experimental results show that this method can reduce the complexity of the traditional rule string search algorithm, and the time complexity of the rule string search is O (n).
【作者單位】: 北京科技大學(xué)計算機與通信工程學(xué)院知識工程研究所;
【基金】:國家自然科學(xué)基金項目(61175048,60875029) 科技部創(chuàng)新方法工作專項項目(2010IM020900)資助
【分類號】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周作濤;;垂直搜索在電子商務(wù)中的應(yīng)用分析[J];陜西理工學(xué)院學(xué)報(自然科學(xué)版);2008年03期
2 孫玲芳;黎維良;;基于定題爬蟲的網(wǎng)頁分類的多級判定算法[J];科學(xué)技術(shù)與工程;2009年18期
3 趙宏中;李亞;;垂直搜索引擎應(yīng)用研究[J];現(xiàn)代商貿(mào)工業(yè);2010年04期
4 劉金亮;蘇琳;石云;;基于Nutch的垂直搜索技術(shù)研究[J];電腦知識與技術(shù);2011年24期
5 孔祥春;李義杰;鄭凱明;;垂直搜索引擎應(yīng)用研究[J];計算機系統(tǒng)應(yīng)用;2009年07期
6 劉運強;;垂直搜索引擎的研究與設(shè)計[J];計算機應(yīng)用與軟件;2010年07期
7 鄭凱明;;垂直搜索引擎應(yīng)用研究[J];赤峰學(xué)院學(xué)報(自然科學(xué)版);2011年02期
8 燕苗;;搜索引擎技術(shù)研究與發(fā)展[J];科技傳播;2011年10期
9 馮蕾;;九城集團閃電收購雅蜂網(wǎng) B2B市場競爭達(dá)到白熱化[J];電子商務(wù);2007年05期
10 鄭如濱;撒力;謝婷;;基于Heritrix與Lucene的垂直搜索引擎研究[J];電腦知識與技術(shù);2008年29期
相關(guān)會議論文 前8條
1 周明;劉曉華;蔣龍;Matt Scott;;利用網(wǎng)絡(luò)挖掘技術(shù)建立英語學(xué)習(xí)平臺[A];中國計算機語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
2 郭莉;劉燕兵;譚建龍;;基于存儲壓縮的多模式串匹配算法[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
3 劉源;詹舒波;;基于Solr的行業(yè)垂直搜索平臺的研究[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國青年通信學(xué)術(shù)會議論文集(上)[C];2008年
4 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會、河北省計算機學(xué)會、河北省自動化學(xué)會、河北省人工智能學(xué)會、河北省計算機輔助設(shè)計研究會、河北省軟件行業(yè)協(xié)會聯(lián)合學(xué)術(shù)年會論文集[C];2007年
5 劉悅;許洪波;程學(xué)旗;;互聯(lián)網(wǎng)挖掘和搜索的研究進(jìn)展[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年
6 孫亞夫;常峰;;本地搜索服務(wù)的結(jié)構(gòu)設(shè)計與關(guān)鍵技術(shù)[A];提高全民科學(xué)素質(zhì)、建設(shè)創(chuàng)新型國家——2006中國科協(xié)年會論文集(下冊)[C];2006年
7 付瑞吉;秦兵;劉挺;;面向音樂領(lǐng)域的文本檢索與挖掘系統(tǒng)[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
8 郭瑞杰;程學(xué)旗;許洪波;張剛;王斌;;FirteX—高性能全文索引和檢索平臺[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
相關(guān)重要報紙文章 前10條
1 殷林;“垂直搜索”將成就電子商務(wù)新天地[N];中國商報;2007年
2 蔣文;幫海外買家篩選中國供應(yīng)商[N];中國經(jīng)營報;2006年
3 張艷紅;微軟涉足保健行業(yè)[N];中國企業(yè)報;2007年
4 陸貴興;視頻搜索暗潮涌動[N];計算機世界;2006年
5 康威;互聯(lián)網(wǎng)將更社區(qū)化[N];計算機世界;2007年
6 王一;無線搜索的技術(shù)崇拜[N];通信產(chǎn)業(yè)報;2007年
7 陳翔;用友移動商街新年鎖定500萬用戶[N];中國計算機報;2008年
8 羅添;微軟CEO否認(rèn)再度全盤收購雅虎[N];北京商報;2008年
9 王澤蘊邋李琨;IBM院士王云:數(shù)據(jù)庫的下一代技術(shù)一點也不炫[N];中國計算機報;2007年
10 本報記者 魏建玲邋李曉麗;雅虎營銷:用戶第一,客戶第二[N];國際商報;2007年
相關(guān)博士學(xué)位論文 前1條
1 寇月;Deep Web實體搜索的關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 易平;生活服務(wù)行業(yè)垂直搜索的設(shè)計與實現(xiàn)[D];暨南大學(xué);2010年
2 王振華;檔案領(lǐng)域垂直搜索技術(shù)的研究與實現(xiàn)[D];東華大學(xué);2011年
3 史磊峰;移動垂直搜索系統(tǒng)的研究[D];北京交通大學(xué);2010年
4 鄔亞文;威客垂直搜索系統(tǒng)的設(shè)計與實現(xiàn)[D];華南理工大學(xué);2010年
5 王晶;基于垂直搜索技術(shù)的競爭情報采集系統(tǒng)的設(shè)計與實現(xiàn)[D];上海交通大學(xué);2011年
6 雷洪;一個垂直搜索系統(tǒng)的設(shè)計與實現(xiàn)[D];中山大學(xué);2012年
7 李濤;垂直搜索的算法研究[D];山東科技大學(xué);2011年
8 陶秋紅;中文垂直搜索技術(shù)的研究與實現(xiàn)[D];河北科技大學(xué);2012年
9 安增文;垂直搜索中信息屬性抽取和分類模型研究與實現(xiàn)[D];中國石油大學(xué);2010年
10 仇亞東;面向農(nóng)業(yè)領(lǐng)域的垂直搜索技術(shù)的研究[D];南京農(nóng)業(yè)大學(xué);2010年
,本文編號:2481453
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2481453.html