天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

結(jié)構(gòu)化預(yù)測中N元特征選擇算法的研究

發(fā)布時間:2020-04-14 20:34
【摘要】:結(jié)構(gòu)化預(yù)測也叫做結(jié)構(gòu)化學(xué)習,目標是從數(shù)據(jù)中學(xué)習一個復(fù)雜的結(jié)構(gòu),它是自然語言處理、數(shù)據(jù)挖掘、機器學(xué)習領(lǐng)域的一個研究熱點。N元特征在很大程度上反映了結(jié)構(gòu)化預(yù)測中“結(jié)構(gòu)”的信息,是結(jié)構(gòu)化預(yù)測中一類特殊且極為重要的特征。然而,絕大多數(shù)關(guān)于N元特征選擇的工作,僅僅將它當作一種普通的特征來處理,而沒有考慮N元特征的性質(zhì),其實質(zhì)仍然是普通特征選擇。少數(shù)幾個研究考慮了N元特征的性質(zhì),但很不充分,而且僅僅關(guān)注具體任務(wù)中的一種或幾種特征,其方法不具普遍性。因此,對結(jié)構(gòu)化預(yù)測中N元特征選擇的研究非常少,可以說幾乎是一片空白。本文將結(jié)構(gòu)化預(yù)測中N元特征選擇作為一個全新的研究課題,旨在提出一種適用于結(jié)構(gòu)化預(yù)測的N元特征選擇的通用框架;趯υ撃繕说姆治,論文在緒論部分就確定了該框架的大致雛形,包括特征選擇的方式(封裝式)、特征選擇的對象(N元特征模板而非特征函數(shù))、特征搜索策略(啟發(fā)式),以及特征搜索的順序(自下而上),并對該雛形框架可能存在的問題,包括特征選擇效率、魯棒性和過擬合,逐一給出解決方案。本文的主要工作包括以下幾個方面:1)論文定義了結(jié)構(gòu)化預(yù)測中的N元特征模板,系統(tǒng)地研究了它的性質(zhì),給出了結(jié)構(gòu)化預(yù)測中N元特征重要性的大致分布,并通過實驗予以驗證。2)論文提出一種高效的N元單特征選擇算法(SNFS)。該算法包括三個子算法:階數(shù)重要性排序算法、水平搜索算法、特征模板對組合算法。其中,最關(guān)鍵的是特征模板對組合算法,它的核心思想是:根據(jù)N元特征的重要性大致分布,我們能定位最有可能的兩個候選者,通過比較這兩個候選者和它們的并集,我們能進一步準確地判斷N元特征重要性的具體走向,從而高效地裁剪搜索空間。3)論文提出一種N元多特征選擇算法(MNFS)。SNFS算法每次只能處理一種N元特征,如果任務(wù)中需要同時選擇多種類型的N元特征,那么該算法必須運行多次,每次處理一種特征,最后求并集。但這種做法沒有考慮多種N元特征之間的相關(guān)性,所以得到的特征集可能存在冗余。MNFS算法有效地解決了特征冗余的問題。論文通過實驗全面地分析了算法的特征選擇性能、效率、魯棒性以及抗過擬合的能力,并與經(jīng)典的封裝式特征選擇方法進行了對比。實驗表明,MNFS算法的特征選擇性能與經(jīng)典的封裝式方法大致相當,但MNFS算法極其高效、魯棒,抗過擬合能力也優(yōu)于經(jīng)典的封裝式方法。4)論文提出一種通用的封裝式特征選擇的加速方法。該方法的基本思想是:“放松”模型中跟訓(xùn)練時間相關(guān)的變量以加速訓(xùn)練過程,同時定義了一個相似度度量值TopMatches用于平橫模型的預(yù)測性能和特征選擇性能,并利用坐標下降法搜索相關(guān)的變量值。5)論文提出一種路徑約束的維特比算法來替代結(jié)構(gòu)化預(yù)測中耗時嚴重的轉(zhuǎn)移特征,進一步提高了特征選擇效率。
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TP393.1

【相似文獻】

相關(guān)期刊論文 前10條

1 張紅濤,胡玉霞,邱道尹;遺傳算法在儲糧害蟲特征選擇中的應(yīng)用[J];華北水利水電學(xué)院學(xué)報;2004年03期

2 徐雷;閻平凡;常迥;;用于特征選擇的BF算法及其與B&B算法的比較[J];自動化學(xué)報;1988年05期

3 楊錦英;王碧泉;;K—W檢驗和熵法在單個特征選擇中的應(yīng)用[J];華北地震科學(xué);1989年02期

4 陳晉蘇;特征選擇在電信行業(yè)客戶流失分析中的應(yīng)用[J];科技資訊;2005年22期

5 范勁松,方廷健;特征選擇和提取要素的分析及其評價[J];計算機工程與應(yīng)用;2001年13期

6 江乃雄;蔡民;;綜合距離特征選擇問題解的存在性與唯一性[J];計算機應(yīng)用與軟件;1992年01期

7 錢學(xué)雙;多重篩選逐步回歸特征選擇法及其應(yīng)用[J];信息與控制;1986年05期

8 余勝龍;趙紅;;基于樣本鄰域保持的代價敏感特征選擇[J];數(shù)據(jù)采集與處理;2018年02期

9 杜政霖;李云;;基于特征聚類集成技術(shù)的在線特征選擇[J];計算機應(yīng)用;2017年03期

10 崔亞芬;解男男;;一種基于特征選擇的入侵檢測方法[J];吉林大學(xué)學(xué)報(理學(xué)版);2015年01期

相關(guān)會議論文 前10條

1 史彩娟;沙宇陽;劉健;閆曉東;劉利平;;基于自適應(yīng)半監(jiān)督稀疏特征選擇的圖像標注[A];第十屆全國信號和智能信息處理與應(yīng)用學(xué)術(shù)會議?痆C];2016年

2 劉培磊;李滿生;王挺;;蛋白質(zhì)相互作用有向關(guān)系抽取的特征選擇[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

3 袁帥;楊宏暉;申f;;基于云模型的特征評價準則[A];第三屆上海——西安聲學(xué)學(xué)會學(xué)術(shù)會議論文集[C];2013年

4 申f;楊宏暉;袁帥;;用于水聲目標識別的互信息無監(jiān)督特征選擇[A];第三屆上!靼猜晫W(xué)學(xué)會學(xué)術(shù)會議論文集[C];2013年

5 李澤輝;聶生東;陳兆學(xué);;應(yīng)用多類SVM分割MR腦圖像特征選擇與優(yōu)化的實驗研究[A];中國儀器儀表學(xué)會第九屆青年學(xué)術(shù)會議論文集[C];2007年

6 李娜;曾向陽;;目標識別中的樣本選擇和特征選擇聯(lián)合算法研究[A];2009年西安-上海聲學(xué)學(xué)術(shù)會議論文集[C];2009年

7 宋鵬;鄭文明;趙力;;基于子空間學(xué)習和特征選擇融合的語音情感識別[A];第十四屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC’2017)論文集[C];2017年

8 臧淼;徐惠民;張永梅;;基于局部約束和稀疏編碼的自動圖像標注[A];國防光電子論壇第二屆激光雷達成像探測技術(shù)及應(yīng)用研討會論文集[C];2015年

9 俞士汶;王治敏;朱學(xué)鋒;;文學(xué)語言與自然語言理解研究[A];中文信息處理前沿進展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年

10 薛富強;葛臨東;陳麗;;新的改進遺傳算法用于調(diào)制信號特征選擇[A];無線傳感器網(wǎng)及網(wǎng)絡(luò)信息處理技術(shù)——2006年通信理論與信號處理年會論文集[C];2006年

相關(guān)重要報紙文章 前7條

1 本報記者 李振輝;根據(jù)自身特征選擇健身方式[N];廣東科技報;2008年

2 海通證券 婁靜邋吳先興;把握風險收益特征選擇最適合自己的基金[N];上海證券報;2007年

3 鐵嶺市第二高中 高軍;讓學(xué)生“動”起來[N];鐵嶺日報;2005年

4 鄭衛(wèi)東;高產(chǎn)鵝選種方法和標準[N];中國畜牧獸醫(yī)報;2007年

5 《網(wǎng)絡(luò)世界》記者 周源;云平臺,只選對的[N];網(wǎng)絡(luò)世界;2012年

6 鄭軍;高產(chǎn)鵝選種方法和標準[N];河南科技報;2016年

7 記者 丁寧;2012年,我們一起“追”的創(chuàng)新產(chǎn)品[N];上海證券報;2012年

相關(guān)博士學(xué)位論文 前10條

1 任宇林;結(jié)構(gòu)化預(yù)測中N元特征選擇算法的研究[D];華中科技大學(xué);2018年

2 袁明冬;基于圖的特征提取和特征選擇及其應(yīng)用研究[D];西安電子科技大學(xué);2017年

3 胡小娟;基于特征選擇的文本分類方法研究[D];吉林大學(xué);2018年

4 滕旭陽;面向特征選擇問題的優(yōu)化方法研究[D];哈爾濱工程大學(xué);2017年

5 張麗新;高維數(shù)據(jù)的特征選擇及基于特征選擇的集成學(xué)習研究[D];清華大學(xué);2004年

6 高青斌;蛋白質(zhì)亞細胞定位預(yù)測相關(guān)問題研究[D];國防科學(xué)技術(shù)大學(xué);2006年

7 劉風;基于磁共振成像的多變量模式分析方法學(xué)與應(yīng)用研究[D];電子科技大學(xué);2014年

8 馮國忠;文本分類中的貝葉斯特征選擇[D];東北師范大學(xué);2011年

9 梁建寧;特征選擇與圖像匹配[D];復(fù)旦大學(xué);2011年

10 曹杰;基于SVM的網(wǎng)絡(luò)流量特征降維與分類方法研究[D];吉林大學(xué);2017年

相關(guān)碩士學(xué)位論文 前10條

1 黃靜遠;兩種高維小樣本數(shù)據(jù)的分類方法對比研究[D];華中科技大學(xué);2019年

2 張哲;基于改進引力搜索算法的SVM參數(shù)優(yōu)化和特征選擇[D];云南大學(xué);2017年

3 任秀偉;基于嵌入式稀疏特征選擇策略的降維算法研究[D];湖北工業(yè)大學(xué);2018年

4 胡世賽;多樣性增量特征選擇技術(shù)的應(yīng)用[D];內(nèi)蒙古工業(yè)大學(xué);2018年

5 黃曉娟;面向特征選擇的Relief算法研究[D];蘇州大學(xué);2018年

6 楊鈞;高維不完整數(shù)據(jù)的特征選擇研究[D];遼寧大學(xué);2018年

7 余勝龍;基于數(shù)據(jù)相關(guān)性的代價敏感特征選擇[D];閩南師范大學(xué);2018年

8 黃天意;基于稀疏回歸的特征選擇研究[D];閩南師范大學(xué);2018年

9 朱鑫萍;論文影響力的預(yù)測方法研究[D];內(nèi)蒙古大學(xué);2018年

10 藍恭e,

本文編號:2627681


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2627681.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶85322***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com