天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于詞或詞組長(zhǎng)度和頻數(shù)的短中文文本關(guān)鍵詞提取算法

發(fā)布時(shí)間:2017-06-23 02:06

  本文關(guān)鍵詞:基于詞或詞組長(zhǎng)度和頻數(shù)的短中文文本關(guān)鍵詞提取算法,,由筆耕文化傳播整理發(fā)布。


【摘要】:中文文本的關(guān)鍵詞提取是自然語(yǔ)言處理研究中的難點(diǎn)。國(guó)內(nèi)外大部分關(guān)鍵詞提取的研究都是基于英文文本的,但其并不適用于中文文本的關(guān)鍵詞提取。已有的針對(duì)中文文本的關(guān)鍵詞提取算法大多適用于長(zhǎng)文本,如何從一段短中文文本中準(zhǔn)確地提取出具有實(shí)際意義且與此段中文文本的主題密切相關(guān)的詞或詞組是研究的重點(diǎn)。提出了面向中文文本的基于詞或詞組長(zhǎng)度和頻數(shù)的關(guān)鍵詞提取算法,此算法首先提取文本中出現(xiàn)頻數(shù)較高的詞或詞組,再根據(jù)這些詞或詞組的長(zhǎng)度以及在文本中出現(xiàn)的頻數(shù)計(jì)算權(quán)重,從而篩選出關(guān)鍵詞或詞組。該算法可以準(zhǔn)確地從中文文本中提取出相對(duì)重要的詞或詞組,從而快速、準(zhǔn)確地提取此段中文文本的主題。實(shí)驗(yàn)結(jié)果表明,基于詞或詞組長(zhǎng)度和頻數(shù)的中文文本關(guān)鍵詞提取算法與已有的其他算法相比,可用于處理中文文本,且具有更高的準(zhǔn)確性。
【作者單位】: 江蘇大學(xué)計(jì)算機(jī)科學(xué)與通信工程學(xué)院;
【關(guān)鍵詞】提取 中文文本處理 音譯詞 網(wǎng)絡(luò)新詞
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61300228) 江蘇省教育廳自然科學(xué)基金(09KJB520003)資助
【分類(lèi)號(hào)】:TP391.1
【正文快照】: 到稿日期:2015-11-04返修日期:2016-03-13本文受?chē)?guó)家自然科學(xué)基金項(xiàng)目(61300228),江蘇省教育廳自然科學(xué)基金(09KJB520003)資助。Keywords Keyword extraction,Chinese text processing,Transliterated words,Internet new words1引言面對(duì)現(xiàn)今世界海量的文本信息,人們迫切需要

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 蘭杰;在西文狀態(tài)下閱讀中文文本文件[J];電腦知識(shí);1997年02期

2 駱衛(wèi)華,羅振聲,宮小瑾;中文文本自動(dòng)校對(duì)技術(shù)的研究[J];計(jì)算機(jī)研究與發(fā)展;2004年01期

3 顧益軍,樊孝忠,于江德,李良富;受限領(lǐng)域中文文本主題標(biāo)引系統(tǒng)研究[J];計(jì)算機(jī)應(yīng)用;2004年01期

4 李長(zhǎng)榮,闞戈;中文文本2-分類(lèi)模型在上證指數(shù)趨勢(shì)分析中的應(yīng)用研究[J];齊齊哈爾大學(xué)學(xué)報(bào);2005年02期

5 許細(xì)清;林世平;;面向中文文本的觀點(diǎn)檢索技術(shù)研究[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年05期

6 薛麗敏;李殿偉;肖斌;;中文文本情感傾向性五元模型研究[J];通信技術(shù);2011年07期

7 韓清月;;淺談對(duì)外傳播中文文本的寫(xiě)作[J];對(duì)外傳播;2012年10期

8 劉開(kāi)瑛,薛翠芳,鄭家恒,周曉強(qiáng);中文文本中抽取特征信息的區(qū)域與技術(shù)[J];中文信息學(xué)報(bào);1998年02期

9 劉晶茹,王開(kāi)鑄;中文文本自動(dòng)校對(duì)技術(shù)研究及系統(tǒng)組成[J];電腦學(xué)習(xí);1999年06期

10 游榮彥;中文文本簡(jiǎn)易壓縮與即時(shí)加密研究[J];計(jì)算機(jī)工程與設(shè)計(jì);1999年06期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 鄭天宏;許杭杰;董黎剛;;中文文本抄襲檢查技術(shù)的研究[A];浙江省電子學(xué)會(huì)2010學(xué)術(shù)年會(huì)論文集[C];2010年

2 高楚舒;丁于思;;因特網(wǎng)中文文本信息分析[A];計(jì)算機(jī)模擬與信息技術(shù)會(huì)議論文集[C];2001年

3 宋蘭;孫茂松;;中文文本全文查重的實(shí)驗(yàn)研究[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

4 李思;張浩;徐蔚然;郭軍;;基于合并模型的中文文本情感分析[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

5 徐幸;王厚峰;;中文文本蘊(yùn)含的推理模型[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

6 徐艷華;;中文文本中時(shí)間日期表達(dá)形式的自動(dòng)檢索[A];2004年辭書(shū)與數(shù)字化研討會(huì)論文集[C];2004年

7 張?jiān)茲?龔玲;王永成;;識(shí)別中文文本中的未登錄專(zhuān)有名詞的類(lèi)別[A];2007年中國(guó)智能自動(dòng)化會(huì)議論文集[C];2007年

8 甘燦;孫星明;劉玉玲;向凌云;;一種改進(jìn)的基于同義詞替換的中文文本信息隱藏方法[A];第七屆全國(guó)信息隱藏暨多媒體信息安全學(xué)術(shù)大會(huì)論文集[C];2007年

9 蒙應(yīng)杰;司蕾;是W

本文編號(hào):473656


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/473656.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)f1465***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com