《第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集》2007年
本文關(guān)鍵詞:基于人工智能技術(shù)的建筑工程造價(jià)估算研究,由筆耕文化傳播整理發(fā)布。
《第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集》2007年
基于樣本差異性的關(guān)聯(lián)文本分類
林堃 白清源 謝麗聰 謝伙生 張瑩
【摘要】:在關(guān)聯(lián)文本分類算法 ARC-BC 中,往往采用人工收集訓(xùn)練樣本的方法,由于人工方法的主觀不確定性使得收集到的訓(xùn)練樣本的質(zhì)量有差異,使得分類器的分類效果受到影響。本文提出了一種根據(jù)訓(xùn)練樣本偏離“真實(shí)類中心”的程度——離心度,給訓(xùn)練樣本賦予權(quán)值的算法 WS-ARC-BC(Weighted Sample ARC-BC),提高分類器的穩(wěn)定性,從而提高分類器的分類效果。實(shí)驗(yàn)表明,該算法能夠有效提高分類效果。
【作者單位】:
【關(guān)鍵詞】:
【基金】:福州大學(xué)科技發(fā)展基金(2005-XQ-13、2006-XQ-22、XRC-0511)
福建省教育廳(JB06023)
【分類號(hào)】:TP18;TP391.1
【正文快照】:
1引言 文本分類是根據(jù)一個(gè)文本的內(nèi)容將它分到一個(gè)或者多個(gè)預(yù)定義好的類,應(yīng)用于郵件分類、垃圾郵件 的過(guò)濾,以及網(wǎng)頁(yè)的分類和搜索。最早的關(guān)聯(lián)規(guī)則la]文本分類是由Liu,Hsu和Ma在1998年提出的關(guān)聯(lián) 第三局全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議 分類方法CBA川。cBAI’!將關(guān)聯(lián)規(guī)則
下載全文更多同類文獻(xiàn)
PDF全文下載
CAJ全文下載
(如何獲取全文? 歡迎:購(gòu)買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式,AdobeReader僅支持PDF格式
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王年;莊振華;范益政;李學(xué)俊;王繼;;癌癥基因分類的Laplace譜方法[J];電子學(xué)報(bào);2011年07期
2 曹樹金;陳憶金;;美國(guó)圖書館學(xué)博士學(xué)位論文的研究主題及研究方法分析[J];圖書情報(bào)知識(shí);2011年05期
3 戴強(qiáng);吳恩華;;基于樣本的微平面合成在輕薄透明材質(zhì)表觀建模中的應(yīng)用[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2011年07期
4 劉子倩;王淏童;;一起交通意外死亡的樣本[J];中國(guó)新聞周刊;2011年24期
5 鐘將;劉龍海;梁傳偉;;基于成對(duì)約束的主動(dòng)半監(jiān)督文本聚類[J];計(jì)算機(jī)工程;2011年13期
6 趙月愛;陳俊杰;;重抽樣方法FHNN及其在入侵檢測(cè)中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2011年22期
7 沈穎;;目標(biāo)人群收視率:電視廣告精準(zhǔn)投放的利器[J];電視研究;2011年09期
8 陳曉;周宏;祖媛媛;;磁共振成像的3D頭面部模型的標(biāo)準(zhǔn)化處理[J];工程圖學(xué)學(xué)報(bào);2011年03期
9 丁玲;;專訪全國(guó)人大代表、同煤集團(tuán)董事長(zhǎng)吳永平 “后煤改”山西樣本[J];中國(guó)經(jīng)濟(jì)和信息化;2011年12期
10 劉智利;;涂抹繪本的繁榮[J];出版參考;2011年22期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 林堃;白清源;謝麗聰;謝伙生;張瑩;;基于樣本差異性的關(guān)聯(lián)文本分類[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 張明亮;金星;洪延姬;崔村燕;;有限樣本可靠性試驗(yàn)數(shù)據(jù)的樣本仿真再生技術(shù)[A];全國(guó)生產(chǎn)工程第九屆年會(huì)暨第四屆青年科技工作者學(xué)術(shù)會(huì)議論文集(二)[C];2004年
3 馬湘玲;陳鐵生;馮密羅;;簡(jiǎn)單隨機(jī)抽樣總體均值的置信區(qū)間[A];數(shù)學(xué)·物理·力學(xué)·高新技術(shù)研究進(jìn)展——2000(8)卷——中國(guó)數(shù)學(xué)力學(xué)物理學(xué)高新技術(shù)交叉研究會(huì)第8屆學(xué)術(shù)研討會(huì)論文集[C];2000年
4 李瑞蘭;李忠平;樊忠杰;趙樂瑩;趙莉;;抗-HCV檢測(cè)臨界值附近樣本的分片段測(cè)定結(jié)果初步分析[A];中國(guó)輸血協(xié)會(huì)第三屆輸血大會(huì)論文專輯[C];2004年
5 代正坤;武鵬飛;王宇;王福勛;;越南中蹄蝠回聲定位信號(hào)的分析[A];2009年度全國(guó)物理聲學(xué)會(huì)議論文集[C];2009年
6 張紹培;;淺議常態(tài)化營(yíng)銷稽查在規(guī)范營(yíng)銷管理中的作用[A];2009年云南電力技術(shù)論壇論文集(優(yōu)秀論文部分)[C];2009年
7 陳延嘉;莊志軍;王美清;;一種改進(jìn)的基于樣本的圖像修補(bǔ)方法[A];全國(guó)第19屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2008年
8 張紹培;;淺議常態(tài)化營(yíng)銷稽查在規(guī)范營(yíng)銷管理中的作用[A];2009年云南電力技術(shù)論壇論文集(文摘部分)[C];2009年
9 徐瑞龍;應(yīng)華永;付冠華;沙川;盧俊;李曄森;;實(shí)驗(yàn)室信息管理系統(tǒng)無(wú)紙化平臺(tái)的解決方案[A];2004年浙江省檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)會(huì)議論文匯編[C];2004年
10 高亞麗;毛東興;;車內(nèi)聲品質(zhì)成對(duì)比較法改進(jìn)性實(shí)驗(yàn)設(shè)計(jì)[A];中國(guó)聲學(xué)學(xué)會(huì)2003年青年學(xué)術(shù)會(huì)議[CYCA'03]論文集[C];2003年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 本報(bào)記者 王薇;[N];中國(guó)保險(xiǎn)報(bào);2005年
2 記者 呂勇;[N];中國(guó)消費(fèi)者報(bào);2005年
3 記者 何應(yīng)松;[N];中華建筑報(bào);2005年
4 孫瑞灼;[N];湖北日?qǐng)?bào);2010年
5 本報(bào)記者 周季鋼;[N];重慶日?qǐng)?bào);2011年
6 尚曉;[N];中國(guó)經(jīng)營(yíng)報(bào);2005年
7 本報(bào)記者 周馨怡;[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2010年
8 高福生;[N];寧波日?qǐng)?bào);2011年
9 本報(bào)記者 趙暉 通訊員 郭尚維;[N];天津日?qǐng)?bào);2011年
10 本報(bào)記者 孔凡濤;[N];中國(guó)化工報(bào);2011年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李伍舉;基于基因表達(dá)譜的樣本分型與分類研究[D];中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院;2003年
2 周水生;競(jìng)爭(zhēng)學(xué)習(xí)向量量化和支持向量機(jī)的關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2005年
3 于雪蓮;基于核方法和流形學(xué)習(xí)的雷達(dá)目標(biāo)距離像識(shí)別研究[D];電子科技大學(xué);2008年
4 王岳宇;AFM恒力模式下傾角和摩擦力對(duì)測(cè)量結(jié)果影響的研究[D];哈爾濱工業(yè)大學(xué);2008年
5 Annia García Pereira;應(yīng)用近紅外光譜技術(shù)快速檢測(cè)分析土壤中的N、P、K、OM、pH的研究[D];浙江大學(xué);2005年
6 趙慶偉;中國(guó)涼山彝族自治州彝漢兩民族血脂水平及其影響因素(環(huán)境與遺傳)的研究[D];中國(guó)協(xié)和醫(yī)科大學(xué);1998年
7 蔣漢梁;人乳頭瘤病毒的懸浮芯片分型及其臨床意義[D];浙江大學(xué);2008年
8 彭理;應(yīng)用SELDI-TOF-MS技術(shù)建立乳腺癌血清蛋白質(zhì)篩選模型[D];中國(guó)協(xié)和醫(yī)科大學(xué);2008年
9 劉安興;森林資源年度監(jiān)測(cè)理論與方法研究[D];南京林業(yè)大學(xué);2006年
10 陳碧華;斑皮桉及其近緣樹種CCR基因分子克隆及變異分析[D];福建農(nóng)林大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 于力超;隨機(jī)變量線性組合及次序統(tǒng)計(jì)量的隨機(jī)比較[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
2 陸丹;中國(guó)上市公司資本結(jié)構(gòu)研究[D];蘭州商學(xué)院;2007年
3 朱方;基于PDE和樣本的圖像修復(fù)[D];河南大學(xué);2008年
4 孫玉紅;線條畫風(fēng)格轉(zhuǎn)換與定制方法的研究[D];山東大學(xué);2005年
5 熊燕;基于人工智能技術(shù)的建筑工程造價(jià)估算研究[D];華東交通大學(xué);2009年
6 張引;計(jì)算機(jī)病毒庫(kù)及其管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江工業(yè)大學(xué);2005年
7 任石;線條畫風(fēng)格轉(zhuǎn)換方法及其版權(quán)保護(hù)的研究[D];山東師范大學(xué);2007年
8 謝成軍;數(shù)字圖像修補(bǔ)模型、算法及其應(yīng)用研究[D];合肥工業(yè)大學(xué);2007年
9 孫瑞雪;企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的比較研究[D];北京交通大學(xué);2007年
10 賈建忠;脫機(jī)印刷體維吾爾文字識(shí)別特征選擇和分類器設(shè)計(jì)方法的研究[D];蘇州大學(xué);2008年
本文關(guān)鍵詞:基于人工智能技術(shù)的建筑工程造價(jià)估算研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):157509
本文鏈接:http://sikaile.net/jianzhugongchenglunwen/157509.html