中國(guó)英語(yǔ)新詞語(yǔ)料庫(kù)構(gòu)建技術(shù)研究
發(fā)布時(shí)間:2021-08-25 10:59
隨著中國(guó)英語(yǔ)新詞大量出現(xiàn),缺少中國(guó)英語(yǔ)新詞語(yǔ)料庫(kù)成為研究中國(guó)英語(yǔ)的主要障礙,新詞識(shí)別是建設(shè)語(yǔ)料庫(kù)主要的技術(shù)問(wèn)題。針對(duì)現(xiàn)有的點(diǎn)互信息和鄰接熵新詞識(shí)別算法中的詞內(nèi)部凝聚度低,及點(diǎn)互信息單閾值設(shè)置存在較多高閾值無(wú)效詞組,且低閾值新詞組無(wú)法識(shí)別的問(wèn)題,提出了改進(jìn)多字點(diǎn)互信息和鄰接熵中國(guó)英語(yǔ)新詞識(shí)別算法。利用多字點(diǎn)互信息以及點(diǎn)互信息雙閾值的設(shè)定來(lái)識(shí)別新詞。實(shí)驗(yàn)結(jié)果表明,相同數(shù)據(jù)和實(shí)驗(yàn)環(huán)境下,該方法提高了準(zhǔn)確率、召回率和F值,對(duì)語(yǔ)料庫(kù)建設(shè)是有效可行的。
【文章來(lái)源】:計(jì)算機(jī)工程與應(yīng)用. 2020,56(16)北大核心CSCD
【文章頁(yè)數(shù)】:4 頁(yè)
【參考文獻(xiàn)】:
期刊論文
[1]近十五年國(guó)內(nèi)英語(yǔ)詞匯學(xué)習(xí)策略的文獻(xiàn)計(jì)量分析[J]. 鄭已東,郭艷珍. 兵團(tuán)教育學(xué)院學(xué)報(bào). 2018(03)
[2]基于改進(jìn)互信息和鄰接熵的微博新詞發(fā)現(xiàn)方法[J]. 夭榮朋,許國(guó)艷,宋健. 計(jì)算機(jī)應(yīng)用. 2016(10)
[3]A novel unsupervised method for new word extraction[J]. Lili MEI,Heyan HUANG,Xiaochi WEI,Xianling MAO. Science China(Information Sciences). 2016(09)
[4]中文植物物種多樣性描述文本的信息抽取研究[J]. 段宇鋒,黃思思. 現(xiàn)代圖書情報(bào)技術(shù). 2016(01)
[5]基于詞內(nèi)部結(jié)合度和邊界自由度的新詞發(fā)現(xiàn)[J]. 李文坤,張仰森,陳若愚. 計(jì)算機(jī)應(yīng)用研究. 2015(08)
[6]順應(yīng)論視角下的“中國(guó)英語(yǔ)詞匯”[J]. 李瑞棉,承紅. 海外英語(yǔ). 2015(02)
[7]Geliable Lexical Borrowings in China English on the Internet[J]. 付雪芬,程金花. 海外英語(yǔ). 2012(21)
[8]面向術(shù)語(yǔ)抽取的雙閾值互信息過(guò)濾方法[J]. 陳士超,郁濱. 計(jì)算機(jī)應(yīng)用. 2011(04)
[9]英語(yǔ)全球化、本土化視野中的中國(guó)英語(yǔ)[J]. 李少華. 寧夏大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2005(04)
碩士論文
[1]中文新詞檢測(cè)與分析[D]. 崔世起.中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006
本文編號(hào):3361989
【文章來(lái)源】:計(jì)算機(jī)工程與應(yīng)用. 2020,56(16)北大核心CSCD
【文章頁(yè)數(shù)】:4 頁(yè)
【參考文獻(xiàn)】:
期刊論文
[1]近十五年國(guó)內(nèi)英語(yǔ)詞匯學(xué)習(xí)策略的文獻(xiàn)計(jì)量分析[J]. 鄭已東,郭艷珍. 兵團(tuán)教育學(xué)院學(xué)報(bào). 2018(03)
[2]基于改進(jìn)互信息和鄰接熵的微博新詞發(fā)現(xiàn)方法[J]. 夭榮朋,許國(guó)艷,宋健. 計(jì)算機(jī)應(yīng)用. 2016(10)
[3]A novel unsupervised method for new word extraction[J]. Lili MEI,Heyan HUANG,Xiaochi WEI,Xianling MAO. Science China(Information Sciences). 2016(09)
[4]中文植物物種多樣性描述文本的信息抽取研究[J]. 段宇鋒,黃思思. 現(xiàn)代圖書情報(bào)技術(shù). 2016(01)
[5]基于詞內(nèi)部結(jié)合度和邊界自由度的新詞發(fā)現(xiàn)[J]. 李文坤,張仰森,陳若愚. 計(jì)算機(jī)應(yīng)用研究. 2015(08)
[6]順應(yīng)論視角下的“中國(guó)英語(yǔ)詞匯”[J]. 李瑞棉,承紅. 海外英語(yǔ). 2015(02)
[7]Geliable Lexical Borrowings in China English on the Internet[J]. 付雪芬,程金花. 海外英語(yǔ). 2012(21)
[8]面向術(shù)語(yǔ)抽取的雙閾值互信息過(guò)濾方法[J]. 陳士超,郁濱. 計(jì)算機(jī)應(yīng)用. 2011(04)
[9]英語(yǔ)全球化、本土化視野中的中國(guó)英語(yǔ)[J]. 李少華. 寧夏大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2005(04)
碩士論文
[1]中文新詞檢測(cè)與分析[D]. 崔世起.中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006
本文編號(hào):3361989
本文鏈接:http://sikaile.net/waiyulunwen/waiguoyuyanwenhua/3361989.html
最近更新
教材專著