面向網(wǎng)絡(luò)化制造資源的垂直搜索技術(shù)研究與應(yīng)用
發(fā)布時間:2021-11-29 04:35
本文是在謝慶生教授主持的中國國家自然科學(xué)基金資助項目“面向協(xié)同商務(wù)制造資源管理的關(guān)鍵技術(shù)研究”(計劃批準(zhǔn)號:50475185),國家863計劃項目”面向機電行業(yè)的ASP應(yīng)用服務(wù)平臺開發(fā)與應(yīng)用”(課題編號:2003AA414013、2004AA414070),國家863計劃項目”面向ASP平臺的產(chǎn)品創(chuàng)新設(shè)計與制造資源管理構(gòu)件的研究和應(yīng)用”(課題編號:2002AA415310)等項目的支撐下,以制造業(yè)信息化理論方法為基礎(chǔ),以區(qū)域汽車零部件等行業(yè)為應(yīng)用背景,對網(wǎng)絡(luò)化制造系統(tǒng)建模及應(yīng)用實現(xiàn)等進行研究。網(wǎng)絡(luò)化制造資源檢索是實現(xiàn)網(wǎng)絡(luò)化制造的基礎(chǔ)技術(shù),其核心是利用網(wǎng)絡(luò)尋求合適的企業(yè)合作伙伴,實現(xiàn)企業(yè)間的資源共享、優(yōu)勢互補,提高企業(yè)競爭力。這也是本論文的研究目的。在貴州大學(xué)現(xiàn)代制造技術(shù)實驗室現(xiàn)有研究的基礎(chǔ)上,本文著重研究了面向網(wǎng)絡(luò)化制造資源檢索系統(tǒng)的主題爬蟲設(shè)計和中文分詞技術(shù)。主題爬蟲技術(shù)主要包括種子鏈接的獲取、爬行算法、相似度分析、頁面解析、摘要技術(shù)等。通過在主題爬蟲中增加評價網(wǎng)頁模塊,讓程序優(yōu)先抓取與主題相似度高的網(wǎng)頁中的鏈接,提高了爬蟲的工作效率。在中文分詞模塊,通過一種改進的詞典存儲格式及相應(yīng)...
【文章來源】:貴州大學(xué)貴州省 211工程院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于TR工E索引樹的分詞詞典嘰制3)基于逐字二分的分詞詞典機制逐字二分詞典機制是在整詞二分詞典機制上的一種改進方案
圖5一3:新的基于PA丁 RICIAtree的分詞詞典機制5)雙字哈希機制由圖5一4可知,該詞典結(jié)構(gòu)由三部分組成[到:(l)首字Hash索引,首字Hash索引的每個單元包括三項內(nèi)容:①關(guān)鍵字(2字節(jié)):詞的第一個漢字A;②是否為詞(lbio:標(biāo)示單個首字A是否為詞;③次字Hash索引指針(4字節(jié)):指向以漢字A起始的所有詞語的第二個漢字的索引。(2)次字Hash索引(僅對能跟第一個字構(gòu)成’詞或i司的前綴’的字建立,與第一個字無關(guān)的漢字并無相應(yīng)結(jié)點)次字Hash索引的每個單元也包括三項內(nèi)容:①關(guān)鍵字(2字節(jié)):詞的第二個漢字B:一45一
【參考文獻】:
期刊論文
[1]Web文本分類技術(shù)研究及其實現(xiàn)[J]. 饒文碧,柯慧燕. 計算機技術(shù)與發(fā)展. 2006(03)
[2]Internet上文本的自動摘要技術(shù)[J]. 尹存燕,戴新宇,陳家駿. 計算機工程. 2006(03)
[3]基于ASP的動態(tài)聯(lián)盟制造資源管理框架研究[J]. 李少波,謝慶生. 中國機械工程. 2005(06)
[4]元搜索引擎的原理與設(shè)計[J]. 郭少友. 情報科學(xué). 2005(02)
[5]主題爬蟲的設(shè)計與實現(xiàn)[J]. 汪濤,樊孝忠. 計算機應(yīng)用. 2004(S1)
[6]一種基于文章主題和內(nèi)容的自動摘要方法[J]. 陳燕敏,王曉龍,劉遠(yuǎn)超,樓喜中. 計算機工程與應(yīng)用. 2004(33)
[7]基于Lucene的搜索引擎設(shè)計與實現(xiàn)[J]. 高琰,谷士文,譚立球,費耀平. 微機發(fā)展. 2004(10)
[8]基于智能技術(shù)的生物資源搜索引擎[J]. 許彥彬,倪遠(yuǎn)平,胡曉. 計算機工程與設(shè)計. 2004(09)
[9]中文信息檢索引擎中的分詞與檢索技術(shù)[J]. 吳棟,滕育平. 計算機應(yīng)用. 2004(07)
[10]使用Java編程解析Web頁面[J]. 劉遵雄,聶國星. 計算機系統(tǒng)應(yīng)用. 2004(07)
博士論文
[1]自動主題搜索的應(yīng)用研究[D]. 陳定權(quán).中國科學(xué)院研究生院(文獻情報中心) 2003
碩士論文
[1]主題搜索引擎中網(wǎng)絡(luò)蜘蛛搜索策略研究[D]. 陳杰.浙江大學(xué) 2006
[2]主題搜索引擎研究[D]. 李東升.哈爾濱工程大學(xué) 2005
本文編號:3525853
【文章來源】:貴州大學(xué)貴州省 211工程院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于TR工E索引樹的分詞詞典嘰制3)基于逐字二分的分詞詞典機制逐字二分詞典機制是在整詞二分詞典機制上的一種改進方案
圖5一3:新的基于PA丁 RICIAtree的分詞詞典機制5)雙字哈希機制由圖5一4可知,該詞典結(jié)構(gòu)由三部分組成[到:(l)首字Hash索引,首字Hash索引的每個單元包括三項內(nèi)容:①關(guān)鍵字(2字節(jié)):詞的第一個漢字A;②是否為詞(lbio:標(biāo)示單個首字A是否為詞;③次字Hash索引指針(4字節(jié)):指向以漢字A起始的所有詞語的第二個漢字的索引。(2)次字Hash索引(僅對能跟第一個字構(gòu)成’詞或i司的前綴’的字建立,與第一個字無關(guān)的漢字并無相應(yīng)結(jié)點)次字Hash索引的每個單元也包括三項內(nèi)容:①關(guān)鍵字(2字節(jié)):詞的第二個漢字B:一45一
【參考文獻】:
期刊論文
[1]Web文本分類技術(shù)研究及其實現(xiàn)[J]. 饒文碧,柯慧燕. 計算機技術(shù)與發(fā)展. 2006(03)
[2]Internet上文本的自動摘要技術(shù)[J]. 尹存燕,戴新宇,陳家駿. 計算機工程. 2006(03)
[3]基于ASP的動態(tài)聯(lián)盟制造資源管理框架研究[J]. 李少波,謝慶生. 中國機械工程. 2005(06)
[4]元搜索引擎的原理與設(shè)計[J]. 郭少友. 情報科學(xué). 2005(02)
[5]主題爬蟲的設(shè)計與實現(xiàn)[J]. 汪濤,樊孝忠. 計算機應(yīng)用. 2004(S1)
[6]一種基于文章主題和內(nèi)容的自動摘要方法[J]. 陳燕敏,王曉龍,劉遠(yuǎn)超,樓喜中. 計算機工程與應(yīng)用. 2004(33)
[7]基于Lucene的搜索引擎設(shè)計與實現(xiàn)[J]. 高琰,谷士文,譚立球,費耀平. 微機發(fā)展. 2004(10)
[8]基于智能技術(shù)的生物資源搜索引擎[J]. 許彥彬,倪遠(yuǎn)平,胡曉. 計算機工程與設(shè)計. 2004(09)
[9]中文信息檢索引擎中的分詞與檢索技術(shù)[J]. 吳棟,滕育平. 計算機應(yīng)用. 2004(07)
[10]使用Java編程解析Web頁面[J]. 劉遵雄,聶國星. 計算機系統(tǒng)應(yīng)用. 2004(07)
博士論文
[1]自動主題搜索的應(yīng)用研究[D]. 陳定權(quán).中國科學(xué)院研究生院(文獻情報中心) 2003
碩士論文
[1]主題搜索引擎中網(wǎng)絡(luò)蜘蛛搜索策略研究[D]. 陳杰.浙江大學(xué) 2006
[2]主題搜索引擎研究[D]. 李東升.哈爾濱工程大學(xué) 2005
本文編號:3525853
本文鏈接:http://sikaile.net/kejilunwen/jixiegongcheng/3525853.html
最近更新
教材專著