基于SVM的旅游網(wǎng)站頁(yè)面判別模型探討
本文選題:旅游網(wǎng)站 + 搜索引擎; 參考:《地理空間信息》2015年01期
【摘要】:新疆旅游網(wǎng)站中存在大量頁(yè)面本身為空或頁(yè)面為導(dǎo)航頁(yè)面、新聞動(dòng)態(tài)及政策法規(guī)等用戶關(guān)注度相對(duì)較低的頁(yè)面。而用戶在使用搜索引擎進(jìn)行旅游信息查詢時(shí),這些頁(yè)面卻經(jīng)常顯示在搜索結(jié)果的前面,從而帶來(lái)用戶獲取信息不暢、用戶體驗(yàn)差等問(wèn)題。為解決上述問(wèn)題,提出基于支持向量機(jī)(SVM)原理構(gòu)建旅游網(wǎng)站自動(dòng)判別模型的方法,并結(jié)合9000張訓(xùn)練樣本語(yǔ)料和3 000張測(cè)試樣本語(yǔ)料,對(duì)該模型進(jìn)行測(cè)試研究。結(jié)果表明,基于該模型構(gòu)建的分類器,具有良好的判別效果。當(dāng)特征詞超過(guò)120個(gè),該模型的準(zhǔn)確率、召回率及F1值均趨于收斂,達(dá)到98%。
[Abstract]:There are a large number of pages in Xinjiang tourism website which are empty or navigation pages, news dynamic, policies and regulations and so on users pay relatively low attention to the pages. However, when users use search engines to query travel information, these pages are often displayed in front of search results, resulting in problems such as poor access to information and poor user experience. In order to solve the above problems, an automatic discriminant model based on support vector machine (SVM) is proposed, and 9000 training samples and 3 000 test samples are used to test the model. The results show that the classifier based on this model has good discriminant effect. When the number of feature words exceeds 120, the accuracy, recall rate and F1 value of the model tend to converge to 98.
【作者單位】: 新疆大學(xué)資源與環(huán)境科學(xué)學(xué)院;新疆大學(xué)旅游學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(41130531) 新疆維吾爾自治區(qū)旅游局資助項(xiàng)目(XJLY2012-1) 新疆大學(xué)2012年精品課程建設(shè)資金資助項(xiàng)目
【分類號(hào)】:TP393.092;TP18
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 李蓉;全朝暉;董亞蘋;;旅游業(yè)在線搜索引擎評(píng)價(jià)體系的建立及分析[J];重慶郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2011年02期
2 單松巍,馮是聰,李曉明;幾種典型特征選取方法在中文網(wǎng)頁(yè)分類上的效果比較[J];計(jì)算機(jī)工程與應(yīng)用;2003年22期
3 羅龍艷;竇厚璽;;基于AHP的旅游搜索引擎評(píng)價(jià)分析[J];科技管理研究;2011年09期
4 王專;;旅游網(wǎng)站的搜索引擎優(yōu)化[J];旅游學(xué)刊;2007年06期
5 孫曉琳;郝俊卿;;西安旅游網(wǎng)站建設(shè)的對(duì)比評(píng)價(jià)研究[J];統(tǒng)計(jì)與信息論壇;2008年08期
6 周文霞;;現(xiàn)代文本分類技術(shù)研究[J];武警學(xué)院學(xué)報(bào);2007年12期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王雪;;內(nèi)蒙古4A級(jí)景區(qū)網(wǎng)站運(yùn)營(yíng)狀況研究[J];北方經(jīng)濟(jì);2009年24期
2 高博;朱東華;韓士雄;;一種智能化的信息采集系統(tǒng)的研究與實(shí)現(xiàn)[J];兵工學(xué)報(bào);2009年S1期
3 李玉擰;周蘭珍;操衛(wèi)平;;基于DF和CHI的聯(lián)合特征提取方法及其應(yīng)用[J];北京工業(yè)大學(xué)學(xué)報(bào);2008年09期
4 付雪峰;劉邱云;;不確定性推理在文本分類上的應(yīng)用研究[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年04期
5 郭淼霞;;中文網(wǎng)頁(yè)分類研究綜述[J];赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年12期
6 包金龍;朱劍剛;;基于長(zhǎng)三角地區(qū)的蘇州旅游網(wǎng)站評(píng)價(jià)研究[J];產(chǎn)業(yè)與科技論壇;2010年04期
7 樊興華;王鵬;;基于兩步策略的中文短文本分類研究[J];大連海事大學(xué)學(xué)報(bào);2008年03期
8 江祥奎,原思聰;中文網(wǎng)頁(yè)分類中的網(wǎng)頁(yè)特征提取方法[J];電腦開(kāi)發(fā)與應(yīng)用;2005年10期
9 阮群錕;許燦;呂勁松;;超文本的集成分類算法研究[J];電腦與信息技術(shù);2010年02期
10 張東娜;劉博;;一個(gè)基于加權(quán)和組合降維的web文本分類系統(tǒng)[J];電腦知識(shí)與技術(shù);2008年07期
相關(guān)會(huì)議論文 前4條
1 侯松;周斌;賈焰;;分詞結(jié)果的再搭配對(duì)文本分類效果的增強(qiáng)[A];全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集(第二十四卷)[C];2009年
2 石志偉;吳功宜;;改善樸素貝葉斯在文本分類中的穩(wěn)定性[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
3 徐燕;王斌;李錦濤;孫春明;;知識(shí)增益:文本分類中一種新的特征選擇方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
4 袁志堅(jiān);賈焰;;基于誤差反饋的高速Web文本流快速近似分類[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
相關(guān)博士學(xué)位論文 前10條
1 張翔;文本挖掘技術(shù)研究及其在綜合風(fēng)險(xiǎn)信息網(wǎng)絡(luò)中的應(yīng)用[D];西北大學(xué);2011年
2 祝翠玲;基于類別結(jié)構(gòu)的文本層次分類方法研究[D];山東大學(xué);2011年
3 韓毅;社會(huì)網(wǎng)絡(luò)分析與挖掘的若干關(guān)鍵問(wèn)題研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
4 薛德軍;中文文本自動(dòng)分類中的關(guān)鍵問(wèn)題研究[D];清華大學(xué);2004年
5 孫建濤;Web挖掘中的降維和分類方法研究[D];清華大學(xué);2005年
6 賈自艷;Web信息智能獲取若干關(guān)鍵問(wèn)題研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
7 田永鴻;基于上下文的統(tǒng)計(jì)關(guān)系學(xué)習(xí)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
8 趙鵬;復(fù)雜網(wǎng)絡(luò)與互聯(lián)網(wǎng)個(gè)性化信息服務(wù)的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年
9 劉柏嵩;基于Web的通用本體學(xué)習(xí)研究[D];浙江大學(xué);2007年
10 熊云波;文本信息處理的若干關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 潘正高;基于內(nèi)容的Web新聞文本自動(dòng)分類問(wèn)題研究[D];合肥工業(yè)大學(xué);2010年
2 王林平;基于內(nèi)容的電子郵件過(guò)濾系統(tǒng)的研究[D];電子科技大學(xué);2010年
3 陶小波;電子就業(yè)文本挖掘系統(tǒng)關(guān)鍵技術(shù)研究與應(yīng)用[D];浙江工商大學(xué);2011年
4 曹亞輝;非結(jié)構(gòu)文本最佳近似匹配系統(tǒng)的研究與實(shí)現(xiàn)[D];東華大學(xué);2011年
5 許世明;中文網(wǎng)頁(yè)分類技術(shù)研究及預(yù)分類算法實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
6 石安磊;基于文本相似度評(píng)分的中醫(yī)案例分析系統(tǒng)研究與實(shí)現(xiàn)[D];西北大學(xué);2011年
7 杜俊衛(wèi);基于聚類的文本遷移學(xué)習(xí)算法研究及應(yīng)用[D];山西財(cái)經(jīng)大學(xué);2011年
8 陳曉雨;基于用戶體驗(yàn)的網(wǎng)站優(yōu)化研究[D];云南藝術(shù)學(xué)院;2011年
9 張春燕;基于自然語(yǔ)言處理的文本分類分析與研究[D];江西理工大學(xué);2011年
10 郭力;Web正文信息抽取與面向?qū)哟谓Y(jié)構(gòu)的分類技術(shù)研究[D];華南理工大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 方英;陳京民;;旅游業(yè)搜索引擎營(yíng)銷策略研究[J];商業(yè)研究;2010年01期
2 張俊霞;旅游網(wǎng)站有效性的定量評(píng)價(jià)方法[J];中國(guó)地質(zhì)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2001年04期
3 路紫,郭來(lái)喜,白翠玲;河北省旅游網(wǎng)站使用評(píng)估分析[J];地球信息科學(xué);2004年01期
4 章成敏,章成志;國(guó)外農(nóng)業(yè)搜索引擎評(píng)析[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2004年11期
5 殷煒琳;鄭向敏;;基于使用者滿意度的網(wǎng)站質(zhì)量評(píng)價(jià)方法研究[J];價(jià)值工程;2008年01期
6 常捷;陳德廣;屈冬萌;;河南省旅游網(wǎng)站的現(xiàn)狀調(diào)查與發(fā)展對(duì)策[J];旅游科學(xué);2006年03期
7 朱峰;呂鎮(zhèn);;應(yīng)該在信息技術(shù)發(fā)展背景下進(jìn)行“旅游與網(wǎng)絡(luò)”研究[J];旅游學(xué)刊;2007年06期
8 王鐵;;網(wǎng)絡(luò)對(duì)旅游的影響——從營(yíng)銷到供應(yīng)鏈和貧困人口受益[J];旅游學(xué)刊;2007年06期
9 鐘櫟娜;吳必虎;;中外國(guó)際旅游城市網(wǎng)絡(luò)旅游信息國(guó)際友好度比較研究[J];旅游學(xué)刊;2007年09期
10 馬費(fèi)成,李東e,
本文編號(hào):1911181
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1911181.html