糧食產(chǎn)后損失知識圖譜的構(gòu)建及建模分析研究
發(fā)布時(shí)間:2021-01-04 00:42
我國是一個(gè)資源極度緊缺的國家,糧食供求關(guān)系長期偏緊,減少糧食產(chǎn)后損失潛力巨大,具有重要的戰(zhàn)略意義。隨著糧食物聯(lián)網(wǎng)等技術(shù)的發(fā)展,糧食產(chǎn)后損失數(shù)據(jù)呈現(xiàn)增長迅速、來源繁多、結(jié)構(gòu)復(fù)雜、獲取和管理困難等諸多問題。尤其是來源繁多、結(jié)構(gòu)復(fù)雜的問題直接制約著糧食損失信息高效檢索與關(guān)聯(lián)分析。因此,生成糧食產(chǎn)后損失變量之間的關(guān)系模型、構(gòu)建糧食產(chǎn)后損失浪費(fèi)數(shù)據(jù)體系、建立糧食產(chǎn)后損失分類模型對節(jié)糧減損有著至關(guān)重要的支撐作用。針對上述問題,本文通過構(gòu)建知識圖譜,并基于圖譜中的實(shí)體屬性信息進(jìn)行糧食產(chǎn)后損失數(shù)據(jù)建模分析研究,具體工作如下:第一,本文基于scrapy框架爬取統(tǒng)計(jì)局、糧食局等網(wǎng)站的相關(guān)數(shù)據(jù),對這些數(shù)據(jù)進(jìn)行清洗、標(biāo)注,進(jìn)而整合形成語料庫,并對其數(shù)據(jù)進(jìn)行分詞及詞性標(biāo)注。同時(shí)結(jié)合基于啟發(fā)式規(guī)則和k最近鄰算法對數(shù)據(jù)進(jìn)行篩選和分類。其中,分類劃分了14個(gè)實(shí)體類別,如糧食產(chǎn)后損失、植物學(xué)名詞等。實(shí)體抽取實(shí)驗(yàn)結(jié)果表明,k最近鄰算法加權(quán)后的分類準(zhǔn)確度率比加權(quán)前的準(zhǔn)確率高5.3%,驗(yàn)證了本方法在實(shí)體識別方面的有效性。第二,針對實(shí)體間的關(guān)系提取問題,將其任務(wù)抽象為分類問題。本文通過句法分析生成語句的句法分析樹,獲得詞法信息...
【文章來源】:南京財(cái)經(jīng)大學(xué)江蘇省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
實(shí)體查詢結(jié)果
圖 3.2 網(wǎng)頁基本信息由于百科頁面的每個(gè)頁面均圍繞一個(gè)詞條進(jìn)行全方面的介紹,每個(gè)詞條名作為知識圖譜中的一個(gè)實(shí)體,實(shí)體發(fā)現(xiàn)過程等價(jià)于詞條頁面發(fā)現(xiàn),即每個(gè)詞條頁面的分類等價(jià)于實(shí)體的分類。本文先用啟發(fā)式規(guī)則對信息的詞性進(jìn)行篩選。如果經(jīng)過規(guī)則處理之后直接過濾的就不必進(jìn)行分類計(jì)算,可以降低單純用分類計(jì)算方法
圖 3.5 實(shí)驗(yàn)結(jié)果對比圖本實(shí)驗(yàn)從準(zhǔn)確率的角度來評估模型的性能。由上圖可知,加權(quán)前的分類為 0.803,加權(quán)后的分類準(zhǔn)確率為 0.856,加權(quán)后比加權(quán)前準(zhǔn)確率高了 5比。在 kNN 算法中,由于向量距離是由網(wǎng)頁五個(gè)屬性的線性加權(quán)得來屬性特征在實(shí)體抽取的過程中有著不同程度的影響。如果對重要程度較
【參考文獻(xiàn)】:
期刊論文
[1]基于Stacking模型融合的失壓故障識別算法[J]. 羅智青,莫漢培,王汝輝,胡順東,方紹懷,陳世濤. 能源與環(huán)保. 2019(02)
[2]基于TextCNN的用戶評論情感極性判別[J]. 劉春磊,武佳琪,檀亞寧. 電子世界. 2019(03)
[3]中文實(shí)體關(guān)系抽取研究綜述[J]. 武文雅,陳鈺楓,徐金安,張玉潔. 計(jì)算機(jī)與現(xiàn)代化. 2018(08)
[4]基于BAS-BP模型的風(fēng)暴潮災(zāi)害損失預(yù)測[J]. 王甜甜,劉強(qiáng). 海洋環(huán)境科學(xué). 2018(03)
[5]基于Neo4j圖數(shù)據(jù)庫的課程體系知識圖譜系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 肖慶都,屈亮亮,侯霞. 電腦知識與技術(shù). 2017(36)
[6]基于詞典匹配的蒙古文命名實(shí)體識別研究[J]. 包敏娜,斯·勞格勞. 中央民族大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版). 2017(03)
[7]近年我國糧食產(chǎn)后損失評估及減損對策[J]. 尹國彬. 糧食與飼料工業(yè). 2017(03)
[8]知識圖譜的發(fā)展與構(gòu)建[J]. 李濤,王次臣,李華康. 南京理工大學(xué)學(xué)報(bào). 2017(01)
[9]大數(shù)據(jù)環(huán)境下歷史人物知識圖譜構(gòu)建與實(shí)現(xiàn)[J]. 周亦,周明全,王學(xué)松,黃友良. 系統(tǒng)仿真學(xué)報(bào). 2016(10)
[10]基于句法語義特征的中文實(shí)體關(guān)系抽取[J]. 甘麗新,萬常選,劉德喜,鐘青,江騰蛟. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
博士論文
[1]基于多種數(shù)據(jù)源的中文知識圖譜構(gòu)建方法研究[D]. 胡芳槐.華東理工大學(xué) 2015
碩士論文
[1]基于深度學(xué)習(xí)的中文實(shí)體關(guān)系抽取方法研究[D]. 唐敏.西南交通大學(xué) 2018
[2]生物醫(yī)學(xué)命名實(shí)體識別研究[D]. 鄭強(qiáng).國防科學(xué)技術(shù)大學(xué) 2009
[3]區(qū)域性非營業(yè)小型車輛損失預(yù)測模型[D]. 殷娜.沈陽航空工業(yè)學(xué)院 2007
本文編號:2955803
【文章來源】:南京財(cái)經(jīng)大學(xué)江蘇省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
實(shí)體查詢結(jié)果
圖 3.2 網(wǎng)頁基本信息由于百科頁面的每個(gè)頁面均圍繞一個(gè)詞條進(jìn)行全方面的介紹,每個(gè)詞條名作為知識圖譜中的一個(gè)實(shí)體,實(shí)體發(fā)現(xiàn)過程等價(jià)于詞條頁面發(fā)現(xiàn),即每個(gè)詞條頁面的分類等價(jià)于實(shí)體的分類。本文先用啟發(fā)式規(guī)則對信息的詞性進(jìn)行篩選。如果經(jīng)過規(guī)則處理之后直接過濾的就不必進(jìn)行分類計(jì)算,可以降低單純用分類計(jì)算方法
圖 3.5 實(shí)驗(yàn)結(jié)果對比圖本實(shí)驗(yàn)從準(zhǔn)確率的角度來評估模型的性能。由上圖可知,加權(quán)前的分類為 0.803,加權(quán)后的分類準(zhǔn)確率為 0.856,加權(quán)后比加權(quán)前準(zhǔn)確率高了 5比。在 kNN 算法中,由于向量距離是由網(wǎng)頁五個(gè)屬性的線性加權(quán)得來屬性特征在實(shí)體抽取的過程中有著不同程度的影響。如果對重要程度較
【參考文獻(xiàn)】:
期刊論文
[1]基于Stacking模型融合的失壓故障識別算法[J]. 羅智青,莫漢培,王汝輝,胡順東,方紹懷,陳世濤. 能源與環(huán)保. 2019(02)
[2]基于TextCNN的用戶評論情感極性判別[J]. 劉春磊,武佳琪,檀亞寧. 電子世界. 2019(03)
[3]中文實(shí)體關(guān)系抽取研究綜述[J]. 武文雅,陳鈺楓,徐金安,張玉潔. 計(jì)算機(jī)與現(xiàn)代化. 2018(08)
[4]基于BAS-BP模型的風(fēng)暴潮災(zāi)害損失預(yù)測[J]. 王甜甜,劉強(qiáng). 海洋環(huán)境科學(xué). 2018(03)
[5]基于Neo4j圖數(shù)據(jù)庫的課程體系知識圖譜系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 肖慶都,屈亮亮,侯霞. 電腦知識與技術(shù). 2017(36)
[6]基于詞典匹配的蒙古文命名實(shí)體識別研究[J]. 包敏娜,斯·勞格勞. 中央民族大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版). 2017(03)
[7]近年我國糧食產(chǎn)后損失評估及減損對策[J]. 尹國彬. 糧食與飼料工業(yè). 2017(03)
[8]知識圖譜的發(fā)展與構(gòu)建[J]. 李濤,王次臣,李華康. 南京理工大學(xué)學(xué)報(bào). 2017(01)
[9]大數(shù)據(jù)環(huán)境下歷史人物知識圖譜構(gòu)建與實(shí)現(xiàn)[J]. 周亦,周明全,王學(xué)松,黃友良. 系統(tǒng)仿真學(xué)報(bào). 2016(10)
[10]基于句法語義特征的中文實(shí)體關(guān)系抽取[J]. 甘麗新,萬常選,劉德喜,鐘青,江騰蛟. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
博士論文
[1]基于多種數(shù)據(jù)源的中文知識圖譜構(gòu)建方法研究[D]. 胡芳槐.華東理工大學(xué) 2015
碩士論文
[1]基于深度學(xué)習(xí)的中文實(shí)體關(guān)系抽取方法研究[D]. 唐敏.西南交通大學(xué) 2018
[2]生物醫(yī)學(xué)命名實(shí)體識別研究[D]. 鄭強(qiáng).國防科學(xué)技術(shù)大學(xué) 2009
[3]區(qū)域性非營業(yè)小型車輛損失預(yù)測模型[D]. 殷娜.沈陽航空工業(yè)學(xué)院 2007
本文編號:2955803
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2955803.html
最近更新
教材專著