天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于電商領(lǐng)域的中文產(chǎn)品兼類詞的切分與識別研究

發(fā)布時(shí)間:2019-07-23 19:50
【摘要】:隨著互聯(lián)網(wǎng)應(yīng)用的蓬勃發(fā)展和相關(guān)技術(shù)日新月異的提升,線上線下支付場景的一體化融合,整個(gè)網(wǎng)絡(luò)支付行業(yè)在短短幾年間,交易規(guī)模呈現(xiàn)奔涌式的增長。電商購物涉及到的是電商門戶網(wǎng)站和電商移動應(yīng)用,因此不管使用哪種媒介購物都會涉及到產(chǎn)品搜索。而在電商領(lǐng)域的產(chǎn)品搜索中往往更多表現(xiàn)為兼類詞的切分不準(zhǔn)確,常常出現(xiàn)形容詞和名詞的混淆等問題,所以如何準(zhǔn)確的識別和切分成為了非常關(guān)鍵的因素,影響著文字信息處理的結(jié)果,進(jìn)而關(guān)乎用戶線上或線下購物時(shí)的消費(fèi)體驗(yàn),較差的購物體驗(yàn)將會引起用戶粘性降低而導(dǎo)致客戶流失。本文在對傳統(tǒng)中文自動分詞技術(shù)的研究和比較基礎(chǔ)上,采用改進(jìn)后的全局最優(yōu)化模型—條件隨機(jī)場來進(jìn)行電商領(lǐng)域中文產(chǎn)品兼類詞的切分和識別。由于傳統(tǒng)中文詞領(lǐng)域和電子商務(wù)領(lǐng)域所取材的語料特征不同,距離依賴的長短不同,基于條件隨機(jī)場模型的常用特征模板并不適用于電商領(lǐng)域。本文在研究中注重從二個(gè)方面著手,—是考慮了詞與詞之間的相對獨(dú)立性并添加了電子商務(wù)領(lǐng)域獨(dú)有的特征,二是充分利用特征模板的距離依賴近似于正態(tài)分布的基本規(guī)律,發(fā)現(xiàn)在最優(yōu)模板處取得的極值為函數(shù)最優(yōu)解,提出了適合電商領(lǐng)域的特征項(xiàng)及特征模板。綜上,本文主要研究內(nèi)容是利用電商領(lǐng)域中文產(chǎn)品詞的特征,提出一種有效使用改進(jìn)后的條件隨機(jī)場模型以及適用于電商領(lǐng)域的特征項(xiàng)及特征模板的方法來切分和識別中文產(chǎn)品兼類詞。實(shí)驗(yàn)結(jié)果顯示我們所提出的方法顯著地提高了電商領(lǐng)域中文產(chǎn)品詞識別的精確率,尤其是中文產(chǎn)品兼類詞的形容詞形式,因而減少了因分詞不準(zhǔn)確而引起的誤解以及提升了用戶在購物時(shí)的搜索體驗(yàn)。
【圖文】:

圖2.邋2最大楠馬爾科夫模型逡逑


邐\0.:逡逑狀態(tài)邋5邐0邐No邐\0邐\0逡逑圖2.邋3標(biāo)注偏置問題逡逑如圖2.邋3所顯示的概率,狀態(tài)1更可能轉(zhuǎn)移到狀態(tài)2,,而狀態(tài)2則更可能停滯于狀逡逑態(tài)2,但是經(jīng)計(jì)算得出:逡逑P(1^2->1邋一邋2)邋=邋0.6*0.2*0.5=邋0.06邐P(1邋一1邋一邋1-?1)邋=邋0.4*0.45*0.5=邋0.09逡逑?口一2一2^2)邋=邋0'2*0'3*0'3=0'018?9->1^2^2)邋=邋0.4*0'巧*0'3=0'066逡逑很明顯1^1邋一邋1^1的這條路徑是最佳選擇,會造成這種原因是因?yàn)闋顟B(tài)1可選擇逡逑的轉(zhuǎn)移狀態(tài)比狀態(tài)2少,狀態(tài)I就更可能轉(zhuǎn)移到狀態(tài)2,而狀態(tài)2則更可能停滯于狀態(tài)逡逑2,所W標(biāo)注偏置問題就是最大賄馬爾科夫模型在概率轉(zhuǎn)移的時(shí)候,會更多偏向于選擇逡逑面較少的狀態(tài)。邐?逡逑2.邋5本章小結(jié)逡逑本章首先對五種中文分詞算法進(jìn)行了初步描述和對各自的利弊做了分析,然后針對逡逑中文分詞中的難點(diǎn)分別對歧義問題和未登錄詞問題進(jìn)行分析,最后分別對隱馬爾科夫模逡逑12逡逑

圖4.邋3對比實(shí)驗(yàn)A結(jié)果圖逡逑對比實(shí)驗(yàn)B;逡逑


圖4.邋3對比實(shí)驗(yàn)A結(jié)果圖逡逑對比實(shí)驗(yàn)B;逡逑之前的對比實(shí)驗(yàn)A證明了條件隨機(jī)場模型得到的識別結(jié)果更優(yōu)于另外兩個(gè)統(tǒng):隱馬爾科夫模型和最大[ 馬爾科夫模型。如表4.4和圈4.4所示:①當(dāng)改進(jìn)特
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前7條

1 王鴻善;;“憑空造出“一劑良策””——關(guān)于詞語搭配和兼類詞[J];機(jī)電兵船檔案;1999年01期

2 李華棟;賈真;尹紅風(fēng);楊燕;;基于規(guī)則的漢語兼類詞標(biāo)注方法[J];計(jì)算機(jī)應(yīng)用;2014年08期

3 蔣凱;劉欣亮;王平;韓飛;;一種基于粗糙集的兼類詞詞性自動校對方法[J];軟件導(dǎo)刊;2014年09期

4 馮志偉;英日機(jī)器翻譯系統(tǒng)E-to-J原語分析中的兼類詞消歧策略[J];中文信息學(xué)報(bào);1999年05期

5 黃德根,張麗靜,張艷麗,楊元生;規(guī)則與統(tǒng)計(jì)相結(jié)合的兼類詞處理機(jī)制[J];小型微型計(jì)算機(jī)系統(tǒng);2003年07期

6 趙鐵軍,毛成江,張民,李生;CEMT—Ⅲ系統(tǒng)中漢語兼類問題的處理[J];中文信息學(xué)報(bào);1993年04期

7 ;[J];;年期

相關(guān)會議論文 前7條

1 王潔;荀恩東;宋柔;;兼類詞排歧的一種方法[A];第二屆全國學(xué)生計(jì)算語言學(xué)研討會論文集[C];2004年

2 俞士汶;段慧明;朱學(xué)鋒;;語言工程中同形及兼類詞語的處理策略[A];自然語言理解與機(jī)器翻譯——全國第六屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2001年

3 張亞旭;劉友誼;舒華;王黎;;漢語句子中雙音節(jié)兼類詞句法分析歷程初探[A];第九屆全國心理學(xué)學(xué)術(shù)會議文摘選集[C];2001年

4 范瀟瀟;;甲級詞中的兼類詞在對外漢語教材中的分布情況分析——以《漢語教程》為例[A];北京地區(qū)對外漢語教學(xué)研究生論壇論文集[C];2013年

5 陳桂成;;說“像”及“似的、一樣、一般”[A];福建省辭書學(xué)會2003年會論文集[C];2003年

6 劉濤;楊亦鳴;趙侖;;現(xiàn)代漢語動名兼類詞認(rèn)知的ERP研究[A];2005年中國神經(jīng)心理學(xué)學(xué)術(shù)會議論文集[C];2005年

7 姜自霞;陳曉;李玉梅;靳光瑾;黃昌寧;;試論區(qū)別詞的詞性鑒別能力[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會議論文集[C];2007年

相關(guān)重要報(bào)紙文章 前1條

1 駐馬店高級中學(xué) 李繼新;文言文斷句技巧解析[N];駐馬店日報(bào);2011年

相關(guān)博士學(xué)位論文 前3條

1 李允善;基于中韓平行語料庫的《紅樓夢》動介兼類詞研究[D];山東大學(xué);2014年

2 屈剛;英漢雙語短語對齊[D];上海交通大學(xué);2007年

3 夏全勝;漢語名詞、動詞和動名兼類詞語義加工的ERP研究[D];南開大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 張紀(jì)紅;對外漢語教學(xué)中副區(qū)兼類詞研究[D];安徽大學(xué);2014年

2 李潔;從《現(xiàn)代漢語詞典》版本的更新看名形兼類詞的發(fā)展[D];浙江師范大學(xué);2015年

3 徐漢英;《現(xiàn)代漢語詞典》(第6版)雙音節(jié)動名兼類詞研究[D];南昌大學(xué);2015年

4 劉東美;動名兼類的語義句法考察[D];廣西師范大學(xué);2015年

5 康嬋媛;人造工具兼類詞語義的生命度定位與擺度研究[D];暨南大學(xué);2015年

6 張鶴;《發(fā)展?jié)h語》中兼類詞的考察與偏誤分析研究[D];哈爾濱師范大學(xué);2016年

7 于躍;漢英兼類現(xiàn)象對比研究[D];黑龍江大學(xué);2014年

8 劉戀;《漢語教程》兼類詞的調(diào)查分析[D];安徽大學(xué);2016年

9 龍輝;基于HSK動態(tài)作文語料庫的動名兼類詞偏誤研究[D];中央民族大學(xué);2016年

10 孫菲麗;“高度_2”作為區(qū)副兼類詞的多角度研究[D];遼寧大學(xué);2016年



本文編號:2518364

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/2518364.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a2ddc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com