天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于遺傳算法優(yōu)化綜合啟發(fā)式的中文網(wǎng)頁(yè)特征提取

發(fā)布時(shí)間:2017-10-26 17:02

  本文關(guān)鍵詞:基于遺傳算法優(yōu)化綜合啟發(fā)式的中文網(wǎng)頁(yè)特征提取


  更多相關(guān)文章: 特征提取 遺傳算法 文本分類 文本聚類 詞頻 關(guān)聯(lián)度


【摘要】:特征提取是信息檢索、文本分類、文本聚類以及自動(dòng)文摘生成等技術(shù)的基礎(chǔ)。針對(duì)傳統(tǒng)的特征提取方法不能全面有效地考查待選特征詞的缺點(diǎn),提出了一種基于遺傳算法優(yōu)化綜合啟發(fā)式的中文網(wǎng)頁(yè)特征提取方法。該方法通過(guò)詞頻、關(guān)聯(lián)度、詞性以及位置等多種啟發(fā)式來(lái)綜合考查待選特征,并利用遺傳算法來(lái)優(yōu)化各啟發(fā)式的權(quán)重參數(shù)。通過(guò)在不同測(cè)試集上進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)方法相比,該方法能夠有效避免傳統(tǒng)特征提取方法產(chǎn)生的偏差,獲得具有代表性的特征集,從而使得該方法具有一定的實(shí)用價(jià)值。
【作者單位】: 鄭州輕工業(yè)學(xué)院計(jì)算機(jī)與通信工程學(xué)院;中原工學(xué)院信息商務(wù)學(xué)院基礎(chǔ)學(xué)科部;
【關(guān)鍵詞】特征提取 遺傳算法 文本分類 文本聚類 詞頻 關(guān)聯(lián)度
【基金】:河南省基礎(chǔ)與前沿技術(shù)研究計(jì)劃項(xiàng)目(102300410266) 鄭州輕工業(yè)學(xué)院博士科研基金資助項(xiàng)目
【分類號(hào)】:TP393.092;TP391.1
【正文快照】: 特征提取在自然語(yǔ)言處理領(lǐng)域有著非常廣泛的應(yīng)用,是信息檢索、文本分類、文本聚類以及自動(dòng)文摘生成等技術(shù)的關(guān)鍵。由于互聯(lián)網(wǎng)資源時(shí)刻都在不斷更新,中文文本呈現(xiàn)出“爆炸式”增長(zhǎng)。然而,采用傳統(tǒng)人工方式進(jìn)行特征提取的方法耗時(shí)較長(zhǎng),且 具有一定的主觀性,因此快速準(zhǔn)確地實(shí)現(xiàn)

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 李平,蔣振剛;神經(jīng)網(wǎng)絡(luò)對(duì)手寫(xiě)字符識(shí)別特征的提取[J];長(zhǎng)春光學(xué)精密機(jī)械學(xué)院學(xué)報(bào);2000年02期

2 孟國(guó)強(qiáng);基于車輛牌照識(shí)別系統(tǒng)字符的特征提取方法研究[J];河南科學(xué);2003年06期

3 崔晨e,

本文編號(hào):1099585


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1099585.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5782e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com