基于查詢意圖的中文信息類網(wǎng)頁分類研究
本文關(guān)鍵詞:基于查詢意圖的中文信息類網(wǎng)頁分類研究
更多相關(guān)文章: 查詢意圖 網(wǎng)頁分類 特征提取 分類模型 搜索導(dǎo)航
【摘要】:[目的/意義]通過網(wǎng)頁分類提高搜索引擎及內(nèi)容網(wǎng)站的檢索性能,根據(jù)查詢意圖分類更精確地滿足用戶需求。[方法/過程]以信息類中文網(wǎng)頁為研究對(duì)象,采用人工歸納的方法構(gòu)建信息類查詢意圖類目體系,提出根據(jù)該類目體系對(duì)信息類網(wǎng)頁進(jìn)行分類的方法,并通過實(shí)驗(yàn)進(jìn)行驗(yàn)證。[結(jié)果/結(jié)論]實(shí)驗(yàn)結(jié)果表明,所提出的方法具有較強(qiáng)的可行性,有助于精確地滿足用戶信息需求,提高搜索引擎及內(nèi)容網(wǎng)站的檢索性能。
【作者單位】: 福建師范大學(xué)協(xié)和學(xué)院;
【關(guān)鍵詞】: 查詢意圖 網(wǎng)頁分類 特征提取 分類模型 搜索導(dǎo)航
【分類號(hào)】:G254
【正文快照】: 1引言網(wǎng)頁信息因其內(nèi)容駁雜、結(jié)構(gòu)多樣、來源廣泛等特點(diǎn),一直是信息組織領(lǐng)域的難點(diǎn)。隨著網(wǎng)頁數(shù)量的激增,關(guān)鍵詞搜索引擎的查詢效果面臨極大挑戰(zhàn)。在此背景下,網(wǎng)頁分類再次成為一個(gè)重要課題。目前網(wǎng)頁分類的方式主要有按主題分類和按體裁分類兩種。上述兩種方式均有其存在的依
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 黃臻臻;吳揚(yáng)揚(yáng);;中文網(wǎng)頁體裁分類特征項(xiàng)的權(quán)值調(diào)整策略[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
2 龐觀松;蔣盛益;;文本自動(dòng)分類技術(shù)研究綜述[J];情報(bào)理論與實(shí)踐;2012年02期
3 王大玲;于戈;鮑玉斌;張沫;沈洲;;基于用戶搜索意圖的Web網(wǎng)頁動(dòng)態(tài)泛化[J];軟件學(xué)報(bào);2010年05期
4 時(shí)雷;虎曉紅;席磊;;基于集成學(xué)習(xí)的網(wǎng)頁分類算法[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2009年03期
5 陸偉;周紅霞;張曉娟;;查詢意圖研究綜述[J];中國圖書館學(xué)報(bào);2013年01期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 胡學(xué)鋼;朱珠;吳共慶;;新聞網(wǎng)頁自動(dòng)識(shí)別的相關(guān)特征研究[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年03期
2 薛永大;;網(wǎng)頁分類技術(shù)研究綜述[J];電腦知識(shí)與技術(shù);2012年25期
3 黃潤鵬;左文明;畢凌燕;;基于微博情緒信息的股票市場預(yù)測[J];管理工程學(xué)報(bào);2015年01期
4 任豪棟;賈年;;基于用戶相似度計(jì)算的導(dǎo)航類意圖分類研究[J];西華大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
5 唐曉波;肖璐;;基于情感分析的評(píng)論挖掘模型研究[J];情報(bào)理論與實(shí)踐;2013年07期
6 趙輝;劉懷亮;;一種基于維基百科的中文短文本分類算法[J];圖書情報(bào)工作;2013年11期
7 王連喜;;微博短文本預(yù)處理及學(xué)習(xí)研究綜述[J];圖書情報(bào)工作;2013年11期
8 齊富民;謝曉堯;吳靜;;網(wǎng)絡(luò)搜索中用戶搜索意圖識(shí)別的研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2014年04期
9 唐靜笑;呂學(xué)強(qiáng);柳成洋;李涵;;搜索日志中領(lǐng)域查詢串識(shí)別研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2014年05期
10 李秀霞;邵作運(yùn);鄭春厚;;一種迭代加權(quán)的元樣本稀疏表示中文文本分類算法[J];情報(bào)理論與實(shí)踐;2014年06期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 張慧峰;梯級(jí)水庫群多目標(biāo)優(yōu)化調(diào)度及多屬性決策研究[D];華中科技大學(xué);2013年
2 張慧峰;梯級(jí)水庫群多目標(biāo)優(yōu)化調(diào)度及多屬性決策研究[D];華中科技大學(xué);2013年
3 黃星;震災(zāi)應(yīng)急物資籌集的優(yōu)化決策模型研究[D];哈爾濱工業(yè)大學(xué);2014年
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 閆瑞;曹先彬;李凱;;面向短文本的動(dòng)態(tài)組合分類算法[J];電子學(xué)報(bào);2009年05期
2 唐懿芳 ,牛力 ,傅賽香 ,嚴(yán)小衛(wèi);文本的自動(dòng)分類[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2001年04期
3 王灝,黃厚寬,田盛豐;文本分類實(shí)現(xiàn)技術(shù)[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期
4 吳曉暉;宋萍萍;張榮欣;;有無查詢意圖的分類與實(shí)現(xiàn)架構(gòu)模型研究[J];情報(bào)科學(xué);2009年12期
5 蘇金樹;張博鋒;徐昕;;基于機(jī)器學(xué)習(xí)的文本分類技術(shù)研究進(jìn)展[J];軟件學(xué)報(bào);2006年09期
6 徐燕;李錦濤;王斌;孫春明;;基于區(qū)分類別能力的高性能特征選擇方法[J];軟件學(xué)報(bào);2008年01期
7 陳莉;數(shù)據(jù)挖掘與虛擬數(shù)據(jù)庫[J];四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版);1998年06期
8 ;Automatic User Goals Identification Based on Anchor Text and Click-Through Data[J];Wuhan University Journal of Natural Sciences;2008年04期
9 倪茂樹;時(shí)達(dá)明;林鴻飛;;基于粗糙集屬性約簡的文本分類[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2007年02期
10 張玉芳;楊柯;熊忠陽;;基于關(guān)聯(lián)規(guī)則的中文文本分類算法的改進(jìn)[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2007年02期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 高波,張忠能,查志琴;基于文字鏈接比的網(wǎng)頁分類的研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年27期
2 魯明羽;沈抖;郭崇慧;陸玉昌;;面向網(wǎng)頁分類的網(wǎng)頁摘要方法[J];電子學(xué)報(bào);2006年08期
3 張茂元;鄒春燕;盧正鼎;;一種基于變調(diào)整學(xué)習(xí)規(guī)則的模糊網(wǎng)頁分類方法研究[J];計(jì)算機(jī)研究與發(fā)展;2007年01期
4 劉蓉;周建中;;一種網(wǎng)頁分類中基于圖的半指導(dǎo)學(xué)習(xí)算法[J];計(jì)算機(jī)應(yīng)用研究;2008年03期
5 肖靖;唐寧九;;網(wǎng)絡(luò)監(jiān)控系統(tǒng)中的實(shí)用網(wǎng)頁分類技術(shù)[J];軟件導(dǎo)刊;2009年01期
6 劉思含;賈美娟;;樹匹配算法在網(wǎng)頁分類中的應(yīng)用[J];電腦學(xué)習(xí);2010年04期
7 薛永大;;網(wǎng)頁分類技術(shù)研究綜述[J];電腦知識(shí)與技術(shù);2012年25期
8 黃科,馬少平;基于統(tǒng)計(jì)分詞的中文網(wǎng)頁分類[J];中文信息學(xué)報(bào);2002年06期
9 孫建濤,沈抖,陸玉昌,石純一;網(wǎng)頁分類技術(shù)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年01期
10 程傳鵬;;中文網(wǎng)頁分類的研究與實(shí)現(xiàn)[J];中原工學(xué)院學(xué)報(bào);2007年01期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前7條
1 李立宇;唐世渭;楊冬青;葉恒強(qiáng);王騰蛟;;COMMIX-Classifier—自動(dòng)網(wǎng)頁分類系統(tǒng)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
2 萬中英;王明文;廖海波;左家莉;;維數(shù)約簡在網(wǎng)頁分類中的應(yīng)用[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
3 彭濤;左萬利;赫楓齡;張長利;;基于粒子群優(yōu)化算法的網(wǎng)頁分類技術(shù)[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年
4 劉艷民;;中文網(wǎng)頁分類方法的研究[A];2009年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2009年
5 張迪;鄭德權(quán);趙鐵軍;于浩;;Blog網(wǎng)頁分類與識(shí)別技術(shù)研究[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(上冊(cè))[C];2007年
6 張東娜;彭宏;吳鐵峰;;一種基于粗集與貝葉斯分類器的中文網(wǎng)頁分類方法[A];第一屆全國Web信息系統(tǒng)及其應(yīng)用會(huì)議(WISA2004)論文集[C];2004年
7 米曉芳;秦洋;王立宏;宋宜斌;;基于潛在語義差異的醫(yī)學(xué)網(wǎng)頁分類[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王晶;面向通信管理的電子政務(wù)系統(tǒng)及其網(wǎng)頁分類的研究與實(shí)現(xiàn)[D];上海交通大學(xué);2009年
2 韓培培;網(wǎng)頁分類及存儲(chǔ)查詢系統(tǒng)的設(shè)計(jì)及實(shí)現(xiàn)[D];燕山大學(xué);2010年
3 張祥;一個(gè)網(wǎng)頁分類系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年
4 伍菲;面向主題型的網(wǎng)頁分類技術(shù)的研究與實(shí)現(xiàn)[D];華中科技大學(xué);2011年
5 段昕;基于視覺特征中文網(wǎng)頁分類方法的研究[D];山東大學(xué);2007年
6 汪雷;基于文本挖掘的網(wǎng)頁分類系統(tǒng)研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2013年
7 許世明;中文網(wǎng)頁分類技術(shù)研究及預(yù)分類算法實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
8 劉康煒;基于支持向量機(jī)的網(wǎng)頁分類技術(shù)研究[D];中國石油大學(xué);2009年
9 吳成剛;基于半監(jiān)督的支持向量機(jī)網(wǎng)頁分類方法[D];中國石油大學(xué);2010年
10 于成龍;中文網(wǎng)頁分類及存儲(chǔ)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2007年
,本文編號(hào):1098524
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1098524.html