天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

本體與條件隨機(jī)場(chǎng)結(jié)合的涉農(nóng)商品名稱抽取與類別標(biāo)注

發(fā)布時(shí)間:2019-08-09 10:22
【摘要】:傳統(tǒng)的基于條件隨機(jī)場(chǎng)(CRF)的信息抽取方法在進(jìn)行涉農(nóng)商品名稱抽取與類別標(biāo)注時(shí),需要大量的訓(xùn)練語(yǔ)料,標(biāo)注工作量大,且抽取精度不高。為解決該問(wèn)題,提出了一種基于農(nóng)業(yè)本體與CRF相結(jié)合的涉農(nóng)商品名稱抽取與類別標(biāo)注方法,將涉農(nóng)商品名稱的自動(dòng)抽取與分類看作序列標(biāo)注的任務(wù)。首先是原始數(shù)據(jù)的分詞處理和詞、詞性、地理屬性、本體概念特征選擇;然后,采用改進(jìn)的擬牛頓算法訓(xùn)練CRF模型參數(shù),用維特比算法實(shí)現(xiàn)解碼,共完成4組對(duì)比實(shí)驗(yàn),識(shí)別出7種類別,并將CRF和隱馬爾可夫模型(HMM)、最大熵馬爾可夫模型(MEMM)通過(guò)實(shí)驗(yàn)進(jìn)行比較;最后,將CRF應(yīng)用于農(nóng)產(chǎn)品供求趨勢(shì)分析。結(jié)合合適的特征模板,本體概念的加入使CRF開(kāi)放測(cè)試的總體準(zhǔn)確率提高10.20%,召回率提高59.78%,F值提高37.17%,證明了本體與CRF結(jié)合方法在涉農(nóng)商品名稱和類別抽取中的可行性和有效性,可以促進(jìn)農(nóng)產(chǎn)品供求對(duì)接。
【圖文】:

本體概念,層次樹(shù),農(nóng)業(yè)


簞羋磯鉲煞蚰P?MaximumEntropyMarkovModel,MEMM)進(jìn)行比較,同時(shí)用于農(nóng)產(chǎn)品供求趨勢(shì)的分析。表明農(nóng)業(yè)本體與CRF相結(jié)合進(jìn)行涉農(nóng)商品名稱抽取與類別標(biāo)注方法的有效性。1農(nóng)業(yè)本體與CRF1.1農(nóng)業(yè)本體本體是關(guān)于概念體系的明確的、形式化的規(guī)范說(shuō)明[13],農(nóng)業(yè)本體是專業(yè)性的本體,表示的知識(shí)都是針對(duì)農(nóng)業(yè)學(xué)科領(lǐng)域,提供了關(guān)于該領(lǐng)域中概念的詞表以及概念之間的關(guān)系[14-15]。概念層次是本體的骨架,主要反映概念之間的父類子類關(guān)系。文中使用阿里巴巴農(nóng)業(yè)(https://www.1688.com/)概念層次體系,結(jié)構(gòu)如圖1所示,該分類體系有4個(gè)層次,包括218個(gè)葉子節(jié)點(diǎn),目前已有超過(guò)170萬(wàn)個(gè)農(nóng)業(yè)供求信息映射到該分類體系中,因此基本可以涵蓋各種農(nóng)產(chǎn)品供求類型,具有很強(qiáng)的覆蓋性。利用本體中的父子類概念知識(shí)表示詞所對(duì)應(yīng)的概念,賦予詞以語(yǔ)義。生鮮水果作為蘋(píng)果、草莓的父類概念,可用生鮮水果描述蘋(píng)果、草莓;種植業(yè)作為生鮮水果、農(nóng)作物種子種苗的父類概念,使用種植業(yè)來(lái)描述生鮮水果、農(nóng)作物種子種苗,也可使用種植業(yè)來(lái)描述蘋(píng)果、草莓、蔬菜種子種苗等,進(jìn)一步增強(qiáng)知識(shí)泛化能力。圖1農(nóng)業(yè)本體概念層次樹(shù)Fig.1Concepthierarchiesofagriculturalontology1.2條件隨機(jī)場(chǎng)CRF是用來(lái)標(biāo)注和劃分序列結(jié)構(gòu)數(shù)據(jù)的概率化的無(wú)向圖模型[4],具有表達(dá)元素長(zhǎng)距離依賴性和交疊性特征的能力,在模型中可包含眾多領(lǐng)域知識(shí)[16]。1.2.1CRF模型對(duì)于給定的輸出標(biāo)記序列y=(y1,y2,…,yn)和輸入觀察序列x=(x1,x2,…,xn),CRF通過(guò)定義條件概念p(y|x,λ)來(lái)描述模型。圖2表示CRF鏈?zhǔn)浇Y(jié)構(gòu)。圖2CRF鏈?zhǔn)浇Y(jié)構(gòu)Fig.2CRFchainstructureCRF定義的條件概率公式為:p(y|x,λ)=1Z(x)exp(∑n

鏈?zhǔn)浇Y(jié)構(gòu)


,也可使用種植業(yè)來(lái)描述蘋(píng)果、草莓、蔬菜種子種苗等,進(jìn)一步增強(qiáng)知識(shí)泛化能力。圖1農(nóng)業(yè)本體概念層次樹(shù)Fig.1Concepthierarchiesofagriculturalontology1.2條件隨機(jī)場(chǎng)CRF是用來(lái)標(biāo)注和劃分序列結(jié)構(gòu)數(shù)據(jù)的概率化的無(wú)向圖模型[4],具有表達(dá)元素長(zhǎng)距離依賴性和交疊性特征的能力,在模型中可包含眾多領(lǐng)域知識(shí)[16]。1.2.1CRF模型對(duì)于給定的輸出標(biāo)記序列y=(y1,y2,…,yn)和輸入觀察序列x=(x1,x2,…,xn),CRF通過(guò)定義條件概念p(y|x,λ)來(lái)描述模型。圖2表示CRF鏈?zhǔn)浇Y(jié)構(gòu)。圖2CRF鏈?zhǔn)浇Y(jié)構(gòu)Fig.2CRFchainstructureCRF定義的條件概率公式為:p(y|x,λ)=1Z(x)exp(∑ni=1∑jλj·fj(yi-1,yi,x,i))(1)其中:x為觀察序列;y為標(biāo)記序列;λ=(λ1,λ2,…,λn)為權(quán)重向量;λj為特征函數(shù)的權(quán)重;fj(yi-1,yi,x,i)為對(duì)應(yīng)整個(gè)觀察序列x,標(biāo)記位于i和i-1的特征函數(shù);分母Z(x)為歸一化因子(保證所有可能的狀態(tài)序列概率之和為1),公式如下:Z(x)=∑yexp(∑ni=1∑jλj·fj(yi-1,,yi,x,i))(2)1.2.2參數(shù)訓(xùn)練CRF的參數(shù)訓(xùn)練過(guò)程是在訓(xùn)練數(shù)據(jù)集上基于對(duì)數(shù)似然函數(shù)的最大化進(jìn)行[17-18],設(shè)一個(gè)標(biāo)注過(guò)的數(shù)據(jù)序列集D={(x1,y1),(x2,y2),…,(xn,yn)},ps

本文編號(hào):2524736

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2524736.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶97e94***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
亚洲色图欧美另类人妻| 国产一区二区三区丝袜不卡| 国产精品流白浆无遮挡| 欧美自拍偷自拍亚洲精品| 色综合久久超碰色婷婷| 久久热九九这里只有精品| 91亚洲人人在字幕国产| 国产三级不卡在线观看视频| 午夜福利精品视频视频| 91亚洲精品国产一区| 亚洲天堂一区在线播放| 欧美日韩国产午夜福利| 亚洲国产av国产av| 亚洲欧美中文字幕精品| 香港国产三级久久精品三级| 国产精品白丝久久av| 中文字幕佐山爱一区二区免费| 国产在线小视频你懂的| 成人综合网视频在线观看| 国产熟女一区二区精品视频| 亚洲中文字幕在线观看四区| 亚洲熟妇av一区二区三区色堂| 九九热精品视频免费在线播放| 91播色在线免费播放| 国产又猛又黄又粗又爽无遮挡| 黑色丝袜脚足国产一区二区| 色婷婷视频国产一区视频| 亚洲最大的中文字幕在线视频| 伊人久久青草地婷婷综合| 激情五月激情婷婷丁香| 东北老熟妇全程露脸被内射| 国产精品美女午夜福利| 欧美一级不卡视频在线观看| 在线观看视频国产你懂的| 国产精品免费精品一区二区| 国产白丝粉嫩av在线免费观看| 午夜小视频成人免费看| 日韩人妻av中文字幕| 日本加勒比系列在线播放| 久久国产精品亚州精品毛片| 国产成人午夜福利片片|