天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

一種基于改進(jìn)的權(quán)值調(diào)整技術(shù)數(shù)據(jù)源分類(lèi)算法研究

發(fā)布時(shí)間:2018-04-13 02:02

  本文選題:Web數(shù)據(jù)庫(kù) + 特征提取。 參考:《計(jì)算機(jī)應(yīng)用研究》2012年03期


【摘要】:針對(duì)傳統(tǒng)的搜索引擎無(wú)法正確搜索到Deep Web中隱藏的海量信息,對(duì)Web數(shù)據(jù)庫(kù)的分類(lèi)是通向Web數(shù)據(jù)庫(kù)分類(lèi)集成和檢索的關(guān)鍵步驟。提出了一種基于權(quán)值調(diào)整技術(shù)的Deep Web數(shù)據(jù)庫(kù)分類(lèi)方法,首先從網(wǎng)頁(yè)表單中提取特征;然后對(duì)這些特征使用一種新的權(quán)重計(jì)算方法進(jìn)行估值;最后利用樸素貝葉斯分類(lèi)器對(duì)Web數(shù)據(jù)庫(kù)進(jìn)行分類(lèi)。實(shí)驗(yàn)表明,這種分類(lèi)方法經(jīng)過(guò)少量樣本訓(xùn)練后,就能達(dá)到很好的分類(lèi)效果,并且隨著訓(xùn)練樣本的增加,該分類(lèi)器的性能保持穩(wěn)定,準(zhǔn)確率、召回率都在很小的范圍內(nèi)波動(dòng)。
[Abstract]:Because the traditional search engine can not search the huge amount of information hidden in Deep Web correctly, the classification of Web database is the key step to the classification integration and retrieval of Web database.This paper presents a classification method of Deep Web database based on weight adjustment technique, which firstly extracts features from web pages, and then uses a new weight calculation method to estimate these features.Finally, the naive Bayes classifier is used to classify the Web database.Experiments show that the classification method can achieve a good classification effect after a small number of samples training, and with the increase of training samples, the performance of the classifier remains stable, the accuracy and recall rate fluctuate in a very small range.
【作者單位】: 西華師范大學(xué)計(jì)算中心;
【基金】:四川省教育廳自然科學(xué)科研基金資助項(xiàng)目(10ZC016) 西華師范大學(xué)科研項(xiàng)目(JGXM0950)
【分類(lèi)號(hào)】:TP311.13

【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 李榮陸,王建會(huì),陳曉云,陶曉鵬,胡運(yùn)發(fā);使用最大熵模型進(jìn)行中文文本分類(lèi)[J];計(jì)算機(jī)研究與發(fā)展;2005年01期

2 唐煥玲,孫建濤,陸玉昌;文本分類(lèi)中結(jié)合評(píng)估函數(shù)的TEF-WA權(quán)值調(diào)整技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;2005年01期

3 魯明羽,李凡,龐淑英,陸玉昌,周立柱;基于權(quán)值調(diào)整的文本分類(lèi)改進(jìn)方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年04期

【共引文獻(xiàn)】

相關(guān)期刊論文 前9條

1 魯明羽,張紅,付克明,陸玉昌;Web ME——一個(gè)大型網(wǎng)絡(luò)挖掘環(huán)境系統(tǒng)[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2004年09期

2 許增福,梁靜國(guó),田曉宇;基于FVSM和自組織映射網(wǎng)絡(luò)的Web文本自動(dòng)分類(lèi)方法[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2004年09期

3 尚文倩;黃厚寬;劉玉玲;林永民;瞿有利;董紅斌;;文本分類(lèi)中基于基尼指數(shù)的特征選擇算法研究[J];計(jì)算機(jī)研究與發(fā)展;2006年10期

4 賈寧;;使用概念基元特征進(jìn)行自動(dòng)文本分類(lèi)[J];計(jì)算機(jī)工程與應(yīng)用;2007年01期

5 魯明羽;;Bayes文本分類(lèi)器的改進(jìn)方法研究[J];計(jì)算機(jī)工程;2006年17期

6 崔彩霞;王素格;;基于粗集的支持向量機(jī)文本分類(lèi)方法研究[J];科技廣場(chǎng);2006年08期

7 孫景廣;蔡?hào)|風(fēng);呂德新;董燕舉;;基于知網(wǎng)的中文問(wèn)題自動(dòng)分類(lèi)[J];中文信息學(xué)報(bào);2007年01期

8 蘇金樹(shù);張博鋒;徐昕;;基于機(jī)器學(xué)習(xí)的文本分類(lèi)技術(shù)研究進(jìn)展[J];軟件學(xué)報(bào);2006年09期

9 錢(qián)晶;張杰;張濤;;基于最大熵的漢語(yǔ)人名地名識(shí)別方法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2006年09期

相關(guān)會(huì)議論文 前1條

1 魯明羽;孫建濤;陸玉昌;;一種基于聯(lián)想的網(wǎng)頁(yè)推薦方法[A];第五屆全球智能控制與自動(dòng)化大會(huì)會(huì)議論文集(4)[C];2004年

相關(guān)博士學(xué)位論文 前5條

1 孟靜;光學(xué)層析圖像的重建技術(shù)研究[D];蘇州大學(xué);2006年

2 古平;基于貝葉斯模型的文檔分類(lèi)及相關(guān)技術(shù)研究[D];重慶大學(xué);2006年

3 王樹(shù)梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學(xué);2007年

4 周順先;文本信息抽取模型及算法研究[D];湖南大學(xué);2007年

5 尚文倩;文本分類(lèi)及其相關(guān)技術(shù)研究[D];北京交通大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 吳志峰;基于概念特征的中文文本分類(lèi)研究[D];河北大學(xué);2005年

2 崔彩霞;基于支持向量機(jī)的文本分類(lèi)方法研究[D];山西大學(xué);2005年

3 楊文忠;基于近似網(wǎng)頁(yè)聚類(lèi)算法的Web文本數(shù)據(jù)挖掘技術(shù)的研究與應(yīng)用[D];湖南大學(xué);2005年

4 王金寶;基于增量學(xué)習(xí)和閥值優(yōu)化的自適應(yīng)信息過(guò)濾[D];大連理工大學(xué);2006年

5 馬忠寶;基于支持向量機(jī)的中文文本分類(lèi)系統(tǒng)研究[D];武漢理工大學(xué);2006年

6 孫國(guó)欣;基于主動(dòng)學(xué)習(xí)的中文文本分類(lèi)[D];蘭州大學(xué);2006年

7 楊軍玲;漢語(yǔ)動(dòng)詞詞語(yǔ)搭配自動(dòng)獲取方法研究[D];山西大學(xué);2006年

8 曲曉;受限條件下學(xué)生作業(yè)文本相似度的研究[D];內(nèi)蒙古師范大學(xué);2006年

9 毛偉;基于統(tǒng)計(jì)語(yǔ)言模型的中文自動(dòng)文本分類(lèi)系統(tǒng)[D];北京郵電大學(xué);2006年

10 葉浩;基于類(lèi)信息的潛在語(yǔ)義多類(lèi)文本分類(lèi)模型研究[D];江西師范大學(xué);2006年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 陸玉昌,魯明羽,李凡,周立柱;向量空間法中單詞權(quán)重函數(shù)的分析和構(gòu)造[J];計(jì)算機(jī)研究與發(fā)展;2002年10期

2 唐煥玲,孫建濤,陸玉昌;文本分類(lèi)中結(jié)合評(píng)估函數(shù)的TEF-WA權(quán)值調(diào)整技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;2005年01期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 吳春輝;陳洪生;;基于內(nèi)容的音頻檢索技術(shù)研究[J];咸寧學(xué)院學(xué)報(bào);2011年06期

2 余光華;;基于WEB的數(shù)據(jù)庫(kù)訪(fǎng)問(wèn)技術(shù)的研究[J];湛江師范學(xué)院學(xué)報(bào);2011年03期

3 劉勁;陳瑛琦;扶曉;;虹膜特性提取階段的小波多尺度特征量化算法[J];電腦編程技巧與維護(hù);2011年14期

4 陳克坦;;基于屬性相關(guān)度的WEB數(shù)據(jù)庫(kù)估算方法[J];硅谷;2011年12期

5 林雅靜;;Jsp訪(fǎng)問(wèn)Web數(shù)據(jù)庫(kù)[J];青春歲月;2011年12期

6 賈志先;;基于支持向量機(jī)的空白試卷識(shí)別方法[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期

7 劉勁;趙蕾;扶曉;;基于小波模極值的虹膜特征提取算法[J];電腦編程技巧與維護(hù);2011年16期

8 蔣強(qiáng)榮;高遠(yuǎn);張鴻賓;;基于直方圖交核的人臉識(shí)別[J];北京工業(yè)大學(xué)學(xué)報(bào);2011年08期

9 黑光月;;基于方向平面特征的脫機(jī)女書(shū)識(shí)別方法研究[J];電腦知識(shí)與技術(shù);2011年25期

10 楊穎嫻;;改進(jìn)ICA的人臉特征提取方法[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年05期

相關(guān)會(huì)議論文 前10條

1 林土勝;賴(lài)聲禮;;視網(wǎng)膜血管特征提取的拆支跟蹤法[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年

2 陳毓玲;方志祥;李必軍;;一種激光掃描測(cè)量用于三維重建的方法研究[A];廣東省測(cè)繪學(xué)會(huì)第八次會(huì)員代表大會(huì)學(xué)術(shù)交流論文集[C];2005年

3 饒俊;;基于金字塔配準(zhǔn)和特征提取插值的超分辨率重建[A];第十四屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年

4 陳興峰;顧行發(fā);李紫薇;余濤;鄭進(jìn)軍;郭丁;;基于“凈化邊界的傅立葉描述子”圖像形狀特征提取[A];第十四屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年

5 張浩;劉志鏡;;基于動(dòng)態(tài)時(shí)間規(guī)整的步態(tài)自動(dòng)識(shí)別[A];圖像圖形技術(shù)研究與應(yīng)用2009——第四屆圖像圖形技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2009年

6 王艷豐;李鋼虎;林關(guān)成;;水下目標(biāo)特征的分形維提取算法改進(jìn)[A];2009年中國(guó)東西部聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2009年

7 蔡蕾;朱永生;;基于稀疏性非負(fù)矩陣分解和支持向量機(jī)的軸心軌跡圖識(shí)別[A];2008年全國(guó)振動(dòng)工程及應(yīng)用學(xué)術(shù)會(huì)議暨第十一屆全國(guó)設(shè)備故障診斷學(xué)術(shù)會(huì)議論文集[C];2008年

8 索芳;魏世澤;;農(nóng)田雜草圖像特征提取與識(shí)別方法的探討[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年

9 周書(shū)仁;梁昔明;朱燦;;一種優(yōu)化的ICA表情特征提取方法[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年

10 李勇智;楊靜宇;毛洪賁;;基于局部和非局部散度理論的一種新的特征提取方法[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 仝仁;數(shù)據(jù)庫(kù)網(wǎng)聯(lián)服務(wù)[N];中國(guó)計(jì)算機(jī)報(bào);2001年

2 北京數(shù)碼空間信息技術(shù)有限公司技術(shù)總監(jiān) 劉斌;Web Mining:第二代網(wǎng)絡(luò)信息處理技術(shù)[N];計(jì)算機(jī)世界;2000年

3 孫哲南 譚鐵牛;生物識(shí)別的十大關(guān)鍵技術(shù)[N];計(jì)算機(jī)世界;2007年

4 上海 高博;讓電腦“聽(tīng)懂”人話(huà)[N];電腦報(bào);2008年

5 方忠誠(chéng);OCR技術(shù)及其應(yīng)用[N];北京電子報(bào);2000年

6 中科院自動(dòng)化所 何鵬 陶建華 譚鐵牛;看懂人的“臉色”[N];計(jì)算機(jī)世界;2005年

7 陳麗梅;一指“走”天下[N];光明日?qǐng)?bào);2000年

8 成成;指紋識(shí)別 正走入我們的生活[N];山西科技報(bào);2000年

9 黃培;企業(yè)的生產(chǎn)經(jīng)營(yíng)與信息系統(tǒng)[N];中國(guó)機(jī)電日?qǐng)?bào);2000年

10 ;視頻數(shù)據(jù)中挖“寶”[N];計(jì)算機(jī)世界;2002年

相關(guān)博士學(xué)位論文 前10條

1 張旗;基于屬性的圖像分類(lèi)研究[D];大連海事大學(xué);2005年

2 宋余慶;醫(yī)學(xué)圖像數(shù)據(jù)挖掘若干技術(shù)研究[D];東南大學(xué);2005年

3 吳婷;自發(fā)腦電腦機(jī)接口模式識(shí)別關(guān)鍵技術(shù)與實(shí)驗(yàn)研究[D];上海交通大學(xué);2008年

4 孫蕾;醫(yī)學(xué)圖像智能挖掘關(guān)鍵技術(shù)研究[D];西北大學(xué);2005年

5 權(quán)勝赫;基于形狀特征三維模型檢索的一些關(guān)鍵技術(shù)實(shí)現(xiàn)研究[D];吉林大學(xué);2007年

6 李勇明;尿沉渣圖像自動(dòng)識(shí)別算法的研究[D];重慶大學(xué);2007年

7 趙武鋒;人臉識(shí)別中特征提取方法的研究[D];浙江大學(xué);2009年

8 李寧;基于視覺(jué)認(rèn)知的人體行為特征提取模型研究[D];北京交通大學(xué);2010年

9 林玉娥;特征提取方法研究及其在人臉識(shí)別中的應(yīng)用[D];哈爾濱工程大學(xué);2009年

10 張志偉;面向產(chǎn)品文件的特征提取與建模研究[D];天津大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 鐘春芳;基于多Web數(shù)據(jù)庫(kù)數(shù)據(jù)集成的自動(dòng)瀏覽技術(shù)研究[D];福州大學(xué);2001年

2 吳云周;Linux下Web數(shù)據(jù)庫(kù)技術(shù)的應(yīng)用研究[D];華僑大學(xué);2002年

3 向仕建;基于電子商務(wù)環(huán)境下的Web數(shù)據(jù)庫(kù)存取技術(shù)的研究[D];北方工業(yè)大學(xué);2003年

4 文興斌;基于Internet的網(wǎng)絡(luò)財(cái)務(wù)系統(tǒng)開(kāi)發(fā)[D];四川大學(xué);2005年

5 趙曉輝;基于B/S結(jié)構(gòu)的科技管理信息系統(tǒng)的研究[D];北京工業(yè)大學(xué);2000年

6 鄧大偉;數(shù)據(jù)庫(kù)系統(tǒng)開(kāi)發(fā)與數(shù)據(jù)挖掘技術(shù)[D];西南石油學(xué)院;2002年

7 何曉桃;Web數(shù)據(jù)庫(kù)系統(tǒng)的研究和實(shí)踐[D];廣東工業(yè)大學(xué);2002年

8 鄭秀芬;WEB數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的研究與應(yīng)用[D];浙江大學(xué);2004年

9 趙冬;Web數(shù)據(jù)庫(kù)在電力推進(jìn)船舶中的應(yīng)用[D];大連海事大學(xué);2006年

10 李曉輝;CD-400CG型ICT系統(tǒng)配套數(shù)據(jù)庫(kù)設(shè)計(jì)與開(kāi)發(fā)[D];重慶大學(xué);2003年



本文編號(hào):1742414

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1742414.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)c92b1***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com