一種基于雙數(shù)組Trie的B2B規(guī)則串提取方法
[Abstract]:In order to solve the problem that it is difficult to extract product specification information from B2B vertical search engine, a rule string extraction method based on double array Trie (Double-Array Trie) is proposed. In this method, the rule string is constructed according to the rule characteristics of "parameter name: parameter value" string in B2B system, and the double array Trie tree is generated, and the subtree with the most branch nodes is given priority to improve the storage efficiency. In this method, all the rule strings can be obtained by scanning the search text once, and the candidate strings can be filtered effectively by adding constraints to the rules in order to improve the extraction accuracy of the rule strings. The experimental results show that this method can reduce the complexity of the traditional rule string search algorithm, and the time complexity of the rule string search is O (n).
【作者單位】: 北京科技大學(xué)計(jì)算機(jī)與通信工程學(xué)院知識(shí)工程研究所;
【基金】:國家自然科學(xué)基金項(xiàng)目(61175048,60875029) 科技部創(chuàng)新方法工作專項(xiàng)項(xiàng)目(2010IM020900)資助
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周作濤;;垂直搜索在電子商務(wù)中的應(yīng)用分析[J];陜西理工學(xué)院學(xué)報(bào)(自然科學(xué)版);2008年03期
2 孫玲芳;黎維良;;基于定題爬蟲的網(wǎng)頁分類的多級(jí)判定算法[J];科學(xué)技術(shù)與工程;2009年18期
3 趙宏中;李亞;;垂直搜索引擎應(yīng)用研究[J];現(xiàn)代商貿(mào)工業(yè);2010年04期
4 劉金亮;蘇琳;石云;;基于Nutch的垂直搜索技術(shù)研究[J];電腦知識(shí)與技術(shù);2011年24期
5 孔祥春;李義杰;鄭凱明;;垂直搜索引擎應(yīng)用研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2009年07期
6 劉運(yùn)強(qiáng);;垂直搜索引擎的研究與設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用與軟件;2010年07期
7 鄭凱明;;垂直搜索引擎應(yīng)用研究[J];赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年02期
8 燕苗;;搜索引擎技術(shù)研究與發(fā)展[J];科技傳播;2011年10期
9 馮蕾;;九城集團(tuán)閃電收購雅蜂網(wǎng) B2B市場(chǎng)競(jìng)爭(zhēng)達(dá)到白熱化[J];電子商務(wù);2007年05期
10 鄭如濱;撒力;謝婷;;基于Heritrix與Lucene的垂直搜索引擎研究[J];電腦知識(shí)與技術(shù);2008年29期
相關(guān)會(huì)議論文 前8條
1 周明;劉曉華;蔣龍;Matt Scott;;利用網(wǎng)絡(luò)挖掘技術(shù)建立英語學(xué)習(xí)平臺(tái)[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
2 郭莉;劉燕兵;譚建龍;;基于存儲(chǔ)壓縮的多模式串匹配算法[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
3 劉源;詹舒波;;基于Solr的行業(yè)垂直搜索平臺(tái)的研究[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
4 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年
5 劉悅;許洪波;程學(xué)旗;;互聯(lián)網(wǎng)挖掘和搜索的研究進(jìn)展[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
6 孫亞夫;常峰;;本地搜索服務(wù)的結(jié)構(gòu)設(shè)計(jì)與關(guān)鍵技術(shù)[A];提高全民科學(xué)素質(zhì)、建設(shè)創(chuàng)新型國家——2006中國科協(xié)年會(huì)論文集(下冊(cè))[C];2006年
7 付瑞吉;秦兵;劉挺;;面向音樂領(lǐng)域的文本檢索與挖掘系統(tǒng)[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年
8 郭瑞杰;程學(xué)旗;許洪波;張剛;王斌;;FirteX—高性能全文索引和檢索平臺(tái)[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
相關(guān)重要報(bào)紙文章 前10條
1 殷林;“垂直搜索”將成就電子商務(wù)新天地[N];中國商報(bào);2007年
2 蔣文;幫海外買家篩選中國供應(yīng)商[N];中國經(jīng)營報(bào);2006年
3 張艷紅;微軟涉足保健行業(yè)[N];中國企業(yè)報(bào);2007年
4 陸貴興;視頻搜索暗潮涌動(dòng)[N];計(jì)算機(jī)世界;2006年
5 康威;互聯(lián)網(wǎng)將更社區(qū)化[N];計(jì)算機(jī)世界;2007年
6 王一;無線搜索的技術(shù)崇拜[N];通信產(chǎn)業(yè)報(bào);2007年
7 陳翔;用友移動(dòng)商街新年鎖定500萬用戶[N];中國計(jì)算機(jī)報(bào);2008年
8 羅添;微軟CEO否認(rèn)再度全盤收購雅虎[N];北京商報(bào);2008年
9 王澤蘊(yùn)邋李琨;IBM院士王云:數(shù)據(jù)庫的下一代技術(shù)一點(diǎn)也不炫[N];中國計(jì)算機(jī)報(bào);2007年
10 本報(bào)記者 魏建玲邋李曉麗;雅虎營銷:用戶第一,客戶第二[N];國際商報(bào);2007年
相關(guān)博士學(xué)位論文 前1條
1 寇月;Deep Web實(shí)體搜索的關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 易平;生活服務(wù)行業(yè)垂直搜索的設(shè)計(jì)與實(shí)現(xiàn)[D];暨南大學(xué);2010年
2 王振華;檔案領(lǐng)域垂直搜索技術(shù)的研究與實(shí)現(xiàn)[D];東華大學(xué);2011年
3 史磊峰;移動(dòng)垂直搜索系統(tǒng)的研究[D];北京交通大學(xué);2010年
4 鄔亞文;威客垂直搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2010年
5 王晶;基于垂直搜索技術(shù)的競(jìng)爭(zhēng)情報(bào)采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];上海交通大學(xué);2011年
6 雷洪;一個(gè)垂直搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];中山大學(xué);2012年
7 李濤;垂直搜索的算法研究[D];山東科技大學(xué);2011年
8 陶秋紅;中文垂直搜索技術(shù)的研究與實(shí)現(xiàn)[D];河北科技大學(xué);2012年
9 安增文;垂直搜索中信息屬性抽取和分類模型研究與實(shí)現(xiàn)[D];中國石油大學(xué);2010年
10 仇亞東;面向農(nóng)業(yè)領(lǐng)域的垂直搜索技術(shù)的研究[D];南京農(nóng)業(yè)大學(xué);2010年
,本文編號(hào):2481453
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2481453.html