面向制造領域的知識融合與推理技術(shù)研究
發(fā)布時間:2022-01-15 20:02
隨著物聯(lián)網(wǎng)、數(shù)字化技術(shù)、人工智能的蓬勃發(fā)展,知識融合與推理技術(shù)在知識工程應用中也越來越重要。在知識處理過程中,較高的詞向量維度導致運算成本較高;在知識建模過程中,提高效率的多人協(xié)同建模使得模型碎片化嚴重,缺乏有效的融合方法;在對知識推理過程中,基于構(gòu)建的本體模型準確根據(jù)信息展開知識推理,提供準確的知識結(jié)果是知識應用任務中的重要環(huán)節(jié)。針對以上所述問題,本論文開展如下研究工作:為提高算法運算效率、降低訓練成本、保證下游任務高效進行,本文研究制造領域知識語義詞向量降維方法;谂廊〉闹圃祛I域知識語料,通過對詞向量的準確性與訓練成本進行分析研究對詞向量進行二次降維的必要性;采用改進的棧式自編碼器以及PCA兩種降維方式對高維向量降維,利用對同一詞語相同維度的語義相關性與訓練成本的對比實驗,證明該方法對詞向量降維的有效性與合理性。為解決多人協(xié)同建模過程中本體模型的碎片化、歧義化以及冗余程度較高的問題,本文研究制造知識本體全局相似度及其融合方法。構(gòu)建實體相似度模型,從實體角度研究節(jié)點間的相似關系;提出最大路徑子圖模型,從路徑結(jié)構(gòu)角度研究碎片本體基于路徑結(jié)構(gòu)方面的相似;基于上述兩個模型定義碎片本體全局...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:85 頁
【學位級別】:碩士
【部分圖文】:
知識推送技術(shù)路線圖
哈爾濱工業(yè)大學工學碩士學位論文-13-圖2-6所示,同一詞匯的兩種語言表現(xiàn)形式在向量空間中相對位置接近。利用詞向量這個線性計算的特征可以通過向量的計算來對詞語的的含義信息進行比較。圖2-5詞語在空間中的展示圖2-6語義關系展示2.3.1基于Word2Vec詞向量訓練過程分析采用連續(xù)詞袋模型(CBOW),將其在Word2Vec工具進行訓練的執(zhí)行,介紹微觀角度的詞向量究竟在網(wǎng)絡中歷經(jīng)如何的計算過程得到向量結(jié)果。預先將獲取到的中文語料庫進行停用詞去除、分詞等處理,依次選取語料庫中的詞匯作為目標詞匯,將所確定的上下文詞匯作為神經(jīng)網(wǎng)絡的輸入。為清晰描述訓練過程,簡單組建語料庫由四個詞語組成:{數(shù)控機床潤滑裝置}為例,以“機床”為中心詞,設置窗口大小window_size為2。換言之,此訓練過程為:根據(jù)語料庫中的上下詞“數(shù)控”、“潤滑”、“裝置”來預測訓練目標,即中心詞“機床”。詳細訓練過程如下所示:(1)預處理數(shù)據(jù)。將所有后續(xù)需要展開訓練的詞匯以獨熱式進行表示;該過程實質(zhì)為所訓練的詞進行逐一編號處理。如表2-1所示,將所有詞語表示為獨熱式編碼;如圖2-7所示,將獨熱式表示的詞語作為神經(jīng)網(wǎng)路的輸入。
哈爾濱工業(yè)大學工學碩士學位論文-13-圖2-6所示,同一詞匯的兩種語言表現(xiàn)形式在向量空間中相對位置接近。利用詞向量這個線性計算的特征可以通過向量的計算來對詞語的的含義信息進行比較。圖2-5詞語在空間中的展示圖2-6語義關系展示2.3.1基于Word2Vec詞向量訓練過程分析采用連續(xù)詞袋模型(CBOW),將其在Word2Vec工具進行訓練的執(zhí)行,介紹微觀角度的詞向量究竟在網(wǎng)絡中歷經(jīng)如何的計算過程得到向量結(jié)果。預先將獲取到的中文語料庫進行停用詞去除、分詞等處理,依次選取語料庫中的詞匯作為目標詞匯,將所確定的上下文詞匯作為神經(jīng)網(wǎng)絡的輸入。為清晰描述訓練過程,簡單組建語料庫由四個詞語組成:{數(shù)控機床潤滑裝置}為例,以“機床”為中心詞,設置窗口大小window_size為2。換言之,此訓練過程為:根據(jù)語料庫中的上下詞“數(shù)控”、“潤滑”、“裝置”來預測訓練目標,即中心詞“機床”。詳細訓練過程如下所示:(1)預處理數(shù)據(jù)。將所有后續(xù)需要展開訓練的詞匯以獨熱式進行表示;該過程實質(zhì)為所訓練的詞進行逐一編號處理。如表2-1所示,將所有詞語表示為獨熱式編碼;如圖2-7所示,將獨熱式表示的詞語作為神經(jīng)網(wǎng)路的輸入。
【參考文獻】:
期刊論文
[1]飛機結(jié)構(gòu)件智能生產(chǎn)線管理系統(tǒng)研究[J]. 劉葳,陳云雷,池力. 中國設備工程. 2020(11)
[2]基于Protégé的交通地理本體構(gòu)建方法[J]. 馬苗苗,陳春輝. 北京測繪. 2019(12)
[3]基于分布式內(nèi)存計算的三元N-gram算法的并行化研究[J]. 龔永罡,田潤琳,廉小親,吳萌. 計算機產(chǎn)品與流通. 2019(03)
[4]詞向量發(fā)展綜述[J]. 嚴紅. 現(xiàn)代計算機(專業(yè)版). 2019(08)
[5]基于詞向量技術(shù)與主題詞特征的微博立場檢測[J]. 鄭海洋,高俊波,邱杰,焦鳳. 計算機系統(tǒng)應用. 2018(09)
[6]基于詞向量特征擴展的中文短文本分類研究[J]. 雷朔,劉旭敏,徐維祥. 計算機應用與軟件. 2018(08)
[7]基于OWL的本體建模與推理研究[J]. 徐享忠,楊建東,湯再江. 裝甲兵工程學院學報. 2017(05)
[8]網(wǎng)絡大數(shù)據(jù)中的知識融合框架研究[J]. 周利琴,范昊,潘建鵬. 情報雜志. 2018(01)
[9]大數(shù)據(jù)環(huán)境下知識融合的關鍵問題研究綜述[J]. 唐曉波,朱娟. 圖書館雜志. 2017(07)
[10]深度學習降維過程中的信息損失度量研究[J]. 石志國,楊志勇. 小型微型計算機系統(tǒng). 2017(07)
碩士論文
[1]基于模糊本體融合與推理的知識發(fā)現(xiàn)研究[D]. 張良韜.武漢大學 2019
[2]基于GloVe的文本聚類研究與改進[D]. 徐露.華南理工大學 2019
[3]基于中心點選取與深度表示學習的文本聚類研究[D]. 王彬宇.戰(zhàn)略支援部隊信息工程大學 2018
[4]基于word2vec和卷積神經(jīng)網(wǎng)絡的文本分類研究[D]. 李林.西南大學 2018
[5]基于神經(jīng)網(wǎng)絡和決策樹的文本分類及其應用研究[D]. 雷飛.電子科技大學 2018
[6]使用本體推理技術(shù)獲取ER模型[D]. 許曉星.吉林大學 2017
[7]基于word2vec詞向量的文本分類研究[D]. 朱磊.西南大學 2017
[8]本體推理中組合推理機制的研究[D]. 侯天祝.西南交通大學 2016
[9]文本分類停用詞處理和特征選擇技術(shù)研究[D]. 馬治濤.西安電子科技大學 2014
[10]基于不一致本體非修正的知識推理方法[D]. 王省思.大連海事大學 2014
本文編號:3591238
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:85 頁
【學位級別】:碩士
【部分圖文】:
知識推送技術(shù)路線圖
哈爾濱工業(yè)大學工學碩士學位論文-13-圖2-6所示,同一詞匯的兩種語言表現(xiàn)形式在向量空間中相對位置接近。利用詞向量這個線性計算的特征可以通過向量的計算來對詞語的的含義信息進行比較。圖2-5詞語在空間中的展示圖2-6語義關系展示2.3.1基于Word2Vec詞向量訓練過程分析采用連續(xù)詞袋模型(CBOW),將其在Word2Vec工具進行訓練的執(zhí)行,介紹微觀角度的詞向量究竟在網(wǎng)絡中歷經(jīng)如何的計算過程得到向量結(jié)果。預先將獲取到的中文語料庫進行停用詞去除、分詞等處理,依次選取語料庫中的詞匯作為目標詞匯,將所確定的上下文詞匯作為神經(jīng)網(wǎng)絡的輸入。為清晰描述訓練過程,簡單組建語料庫由四個詞語組成:{數(shù)控機床潤滑裝置}為例,以“機床”為中心詞,設置窗口大小window_size為2。換言之,此訓練過程為:根據(jù)語料庫中的上下詞“數(shù)控”、“潤滑”、“裝置”來預測訓練目標,即中心詞“機床”。詳細訓練過程如下所示:(1)預處理數(shù)據(jù)。將所有后續(xù)需要展開訓練的詞匯以獨熱式進行表示;該過程實質(zhì)為所訓練的詞進行逐一編號處理。如表2-1所示,將所有詞語表示為獨熱式編碼;如圖2-7所示,將獨熱式表示的詞語作為神經(jīng)網(wǎng)路的輸入。
哈爾濱工業(yè)大學工學碩士學位論文-13-圖2-6所示,同一詞匯的兩種語言表現(xiàn)形式在向量空間中相對位置接近。利用詞向量這個線性計算的特征可以通過向量的計算來對詞語的的含義信息進行比較。圖2-5詞語在空間中的展示圖2-6語義關系展示2.3.1基于Word2Vec詞向量訓練過程分析采用連續(xù)詞袋模型(CBOW),將其在Word2Vec工具進行訓練的執(zhí)行,介紹微觀角度的詞向量究竟在網(wǎng)絡中歷經(jīng)如何的計算過程得到向量結(jié)果。預先將獲取到的中文語料庫進行停用詞去除、分詞等處理,依次選取語料庫中的詞匯作為目標詞匯,將所確定的上下文詞匯作為神經(jīng)網(wǎng)絡的輸入。為清晰描述訓練過程,簡單組建語料庫由四個詞語組成:{數(shù)控機床潤滑裝置}為例,以“機床”為中心詞,設置窗口大小window_size為2。換言之,此訓練過程為:根據(jù)語料庫中的上下詞“數(shù)控”、“潤滑”、“裝置”來預測訓練目標,即中心詞“機床”。詳細訓練過程如下所示:(1)預處理數(shù)據(jù)。將所有后續(xù)需要展開訓練的詞匯以獨熱式進行表示;該過程實質(zhì)為所訓練的詞進行逐一編號處理。如表2-1所示,將所有詞語表示為獨熱式編碼;如圖2-7所示,將獨熱式表示的詞語作為神經(jīng)網(wǎng)路的輸入。
【參考文獻】:
期刊論文
[1]飛機結(jié)構(gòu)件智能生產(chǎn)線管理系統(tǒng)研究[J]. 劉葳,陳云雷,池力. 中國設備工程. 2020(11)
[2]基于Protégé的交通地理本體構(gòu)建方法[J]. 馬苗苗,陳春輝. 北京測繪. 2019(12)
[3]基于分布式內(nèi)存計算的三元N-gram算法的并行化研究[J]. 龔永罡,田潤琳,廉小親,吳萌. 計算機產(chǎn)品與流通. 2019(03)
[4]詞向量發(fā)展綜述[J]. 嚴紅. 現(xiàn)代計算機(專業(yè)版). 2019(08)
[5]基于詞向量技術(shù)與主題詞特征的微博立場檢測[J]. 鄭海洋,高俊波,邱杰,焦鳳. 計算機系統(tǒng)應用. 2018(09)
[6]基于詞向量特征擴展的中文短文本分類研究[J]. 雷朔,劉旭敏,徐維祥. 計算機應用與軟件. 2018(08)
[7]基于OWL的本體建模與推理研究[J]. 徐享忠,楊建東,湯再江. 裝甲兵工程學院學報. 2017(05)
[8]網(wǎng)絡大數(shù)據(jù)中的知識融合框架研究[J]. 周利琴,范昊,潘建鵬. 情報雜志. 2018(01)
[9]大數(shù)據(jù)環(huán)境下知識融合的關鍵問題研究綜述[J]. 唐曉波,朱娟. 圖書館雜志. 2017(07)
[10]深度學習降維過程中的信息損失度量研究[J]. 石志國,楊志勇. 小型微型計算機系統(tǒng). 2017(07)
碩士論文
[1]基于模糊本體融合與推理的知識發(fā)現(xiàn)研究[D]. 張良韜.武漢大學 2019
[2]基于GloVe的文本聚類研究與改進[D]. 徐露.華南理工大學 2019
[3]基于中心點選取與深度表示學習的文本聚類研究[D]. 王彬宇.戰(zhàn)略支援部隊信息工程大學 2018
[4]基于word2vec和卷積神經(jīng)網(wǎng)絡的文本分類研究[D]. 李林.西南大學 2018
[5]基于神經(jīng)網(wǎng)絡和決策樹的文本分類及其應用研究[D]. 雷飛.電子科技大學 2018
[6]使用本體推理技術(shù)獲取ER模型[D]. 許曉星.吉林大學 2017
[7]基于word2vec詞向量的文本分類研究[D]. 朱磊.西南大學 2017
[8]本體推理中組合推理機制的研究[D]. 侯天祝.西南交通大學 2016
[9]文本分類停用詞處理和特征選擇技術(shù)研究[D]. 馬治濤.西安電子科技大學 2014
[10]基于不一致本體非修正的知識推理方法[D]. 王省思.大連海事大學 2014
本文編號:3591238
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3591238.html
最近更新
教材專著