搜索引擎廣告用戶行為預(yù)測與特征分析
[Abstract]:This paper introduces the basic operation mode of search engine advertising system. By extracting features of quaternion and smoothing feature value, the advertisement record is parsed into training data, and the data is divided into training set and test set. By using support vector machine (SVM) algorithm and using the model trained by training set, the test set is classified to predict the user's behavior. Based on the analysis of the features, it is concluded that the most important feature that affects the accuracy of user behavior prediction is the click-through rate. The experimental results show that the classification accuracy can reach 83.17 when all the features in the model are used.
【作者單位】: 北京大學(xué)光華管理學(xué)院;中國民生銀行博士后工作站;北京大學(xué)信息科學(xué)技術(shù)學(xué)院;中國民生銀行科研培訓(xùn)學(xué)院;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61272343) 國家教育部科技發(fā)展中心網(wǎng)絡(luò)時代的科技論文快速共享專項(xiàng)研究資助課題(2011110)
【分類號】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 高潔,吉根林;文本分類技術(shù)研究[J];計(jì)算機(jī)應(yīng)用研究;2004年07期
2 代六玲,黃河燕,陳肇雄;中文文本分類中特征抽取方法的比較研究[J];中文信息學(xué)報;2004年01期
3 牛強(qiáng);王志曉;陳岱;夏士雄;;基于支持向量機(jī)的Web文本分類方法[J];微電子學(xué)與計(jì)算機(jī);2006年09期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳基漓;牛秦洲;;WEB挖掘在農(nóng)業(yè)信息網(wǎng)站個性化服務(wù)中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2008年35期
2 陳鍵;胡學(xué)剛;;詞分布均衡度評價特征詞選取方法的文本分類[J];安徽科技學(xué)院學(xué)報;2009年02期
3 李玉擰;周蘭珍;操衛(wèi)平;;基于DF和CHI的聯(lián)合特征提取方法及其應(yīng)用[J];北京工業(yè)大學(xué)學(xué)報;2008年09期
4 李榮艷;金鑫;王春輝;鄭寧;別榮芳;;一種新的中文文本分類算法[J];北京師范大學(xué)學(xué)報(自然科學(xué)版);2006年05期
5 楊勇濤;;文本自動摘要提取算法[J];成都大學(xué)學(xué)報(自然科學(xué)版);2009年02期
6 袁曉峰;;一種基于主題的Web文本聚類算法[J];成都大學(xué)學(xué)報(自然科學(xué)版);2010年03期
7 冀勝利;李波;;基于SVM的中文文本分類算法[J];重慶工學(xué)院學(xué)報(自然科學(xué)版);2008年07期
8 殷宏威;趙偉;楊志偉;;蟻群算法在KNN文本分類中的應(yīng)用[J];長春理工大學(xué)學(xué)報(自然科學(xué)版);2010年01期
9 呂佳;;基于改進(jìn)分類模型的文本分類系統(tǒng)實(shí)現(xiàn)[J];重慶師范大學(xué)學(xué)報(自然科學(xué)版);2009年02期
10 李家兵;;基于交叉覆蓋算法的文本分類研究[J];滁州學(xué)院學(xué)報;2008年05期
相關(guān)會議論文 前10條
1 韓露;余正濤;鄧錦輝;章程;毛存禮;郭劍毅;;領(lǐng)域知識關(guān)系對領(lǐng)域文本分類的影響[A];第二十七屆中國控制會議論文集[C];2008年
2 張仰森;黃改娟;蘇文杰;;基于隱最大熵原理的漢語詞義消歧方法[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 侯松;周斌;賈焰;;分詞結(jié)果的再搭配對文本分類效果的增強(qiáng)[A];全國計(jì)算機(jī)安全學(xué)術(shù)交流會論文集(第二十四卷)[C];2009年
4 張娟;王慧鋒;;文本分類技術(shù)在海量金融信息處理中的應(yīng)用[A];第二十四屆中國控制會議論文集(下冊)[C];2005年
5 曹玉娟;牛振東;彭學(xué)平;江鵬;;一個基于特征向量的近似網(wǎng)頁去重算法[A];中國索引學(xué)會第三次全國會員代表大會暨學(xué)術(shù)論壇論文集[C];2008年
6 陳慶軒;鄭德權(quán);鄭博文;趙鐵軍;李生;;中文文本分類中基于文檔頻度分布的特征選擇方法[A];黑龍江省計(jì)算機(jī)學(xué)會2009年學(xué)術(shù)交流年會論文集[C];2010年
7 門洪;武玉杰;李小英;高艷春;;基于支持向量機(jī)的分類算法研究[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(3)[C];2008年
8 郎加云;胡學(xué)鋼;;電子郵件內(nèi)容過濾的相關(guān)特征研究[A];全國第21屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2010年
9 張寶榮;薛祿宇;丁立芳;劉鳳輝;付立娟;張沛剛;孫躍強(qiáng);;SVM方法在鄉(xiāng)鎮(zhèn)精細(xì)化溫度預(yù)報中的應(yīng)用[A];第28屆中國氣象學(xué)會年會——S7城市氣象精細(xì)預(yù)報與服務(wù)[C];2011年
10 王秀娟;鄭康鋒;楊星海;;線性鑒別分析在中文文本分類中的應(yīng)用[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國青年通信學(xué)術(shù)會議論文集[C];2005年
相關(guān)博士學(xué)位論文 前10條
1 孟佳娜;遷移學(xué)習(xí)在文本分類中的應(yīng)用研究[D];大連理工大學(xué);2011年
2 田俊華;基于本體知識庫的教學(xué)資源自動采集技術(shù)研究[D];南京師范大學(xué);2011年
3 代勁;云模型在文本挖掘應(yīng)用中的關(guān)鍵問題研究[D];重慶大學(xué);2011年
4 羅芳;意見挖掘中若干關(guān)鍵問題研究[D];武漢理工大學(xué);2011年
5 楊爾弘;突發(fā)事件信息提取研究[D];北京語言大學(xué);2005年
6 詹川;反垃圾郵件技術(shù)的研究[D];電子科技大學(xué);2005年
7 王秀娟;文本檢索中若干問題研究[D];北京郵電大學(xué);2006年
8 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復(fù)研究[D];北京郵電大學(xué);2006年
9 姜韶華;科研項(xiàng)目管理中的文本挖掘方法研究及應(yīng)用[D];大連理工大學(xué);2006年
10 石陸魁;非線性維數(shù)約減算法中若干關(guān)鍵問題的研究[D];天津大學(xué);2005年
相關(guān)碩士學(xué)位論文 前10條
1 汪政;基于支持向量機(jī)的改進(jìn)的密度聚類算法研究[D];遼寧工程技術(shù)大學(xué);2010年
2 劉偉麗;基于粒子群算法和支持向量機(jī)的中文文本分類研究[D];河南工業(yè)大學(xué);2010年
3 姜倫;模糊聚類算法及其在中文文本聚類中的研究與實(shí)現(xiàn)[D];哈爾濱理工大學(xué);2010年
4 韓露;領(lǐng)域知識對領(lǐng)域問答系統(tǒng)答案抽取影響研究[D];昆明理工大學(xué);2008年
5 李瓊瓊;網(wǎng)絡(luò)文本自動分類器的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2010年
6 周杰;網(wǎng)絡(luò)輿情話題情感傾向性分析技術(shù)研究[D];解放軍信息工程大學(xué);2010年
7 吳惠雄;基于支持向量機(jī)與聚類算法的中文文本分類研究[D];中南林業(yè)科技大學(xué);2009年
8 姜國新;支持多語言標(biāo)簽優(yōu)先的元搜索引擎結(jié)果聚類研究[D];浙江工商大學(xué);2011年
9 張寧;基于語義的中文文本預(yù)處理研究[D];西安電子科技大學(xué);2011年
10 趙顯亮;基于小世界理論的P2P文本檢索研究[D];西安電子科技大學(xué);2011年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 蘇偉峰,李紹滋,李堂秋;一個基于概念的中文文本分類模型[J];計(jì)算機(jī)工程與應(yīng)用;2002年06期
2 朱寰,阮彤,于慶喜;文本分割算法對中文信息過濾影響研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年13期
3 朱明,王軍,王俊普;Web網(wǎng)頁識別中的特征選擇問題研究[J];計(jì)算機(jī)工程;2000年08期
4 朱華宇,孫正興,張福炎;一個基于向量空間模型的中文文本自動分類系統(tǒng)[J];計(jì)算機(jī)工程;2001年02期
5 賀海軍,王建芬,周青,曹元大;基于決策支持向量機(jī)的中文網(wǎng)頁分類器[J];計(jì)算機(jī)工程;2003年02期
6 龐劍鋒,卜東波,白碩;基于向量空間模型的文本自動分類系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2001年09期
7 馬笑瀟,黃席樾,柴毅;基于SVM的二叉樹多類分類算法及其在故障診斷中的應(yīng)用[J];控制與決策;2003年03期
8 何新貴,彭甫陽;中文文本的關(guān)鍵詞自動抽取和模糊分類[J];中文信息學(xué)報;1999年01期
9 張學(xué)工;關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J];自動化學(xué)報;2000年01期
10 解沖鋒,李 星;基于序列的文本自動分類算法[J];軟件學(xué)報;2002年04期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 秦玉平;艾青;王秀坤;李祥納;劉衛(wèi)江;;基于支持向量機(jī)的兼類文本分類算法研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年02期
2 宋軍濤;周銅;杜慶靈;;支持向量機(jī)和蟻群算法的網(wǎng)頁分類研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年17期
3 劉江,鄭家恒,張虎;中文文本語料庫分詞一致性檢驗(yàn)技術(shù)的初探[J];計(jì)算機(jī)應(yīng)用研究;2005年09期
4 王陳飛;肖詩斌;;基于SVM的圖像分類研究[J];計(jì)算機(jī)與數(shù)字工程;2006年08期
5 倪麗萍;倪志偉;李鋒剛;潘永剛;;基于蟻群算法的SVM模型選擇研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年09期
6 韋娜;王濤;;結(jié)合ReliefF與支持向量機(jī)的特征選擇方法研究[J];計(jì)算機(jī)應(yīng)用與軟件;2008年01期
7 石元博;;支持向量機(jī)技術(shù)在人臉識別考勤機(jī)上的應(yīng)用[J];現(xiàn)代科學(xué)儀器;2009年02期
8 趙更寅;邱兆文;;一種基于支持向量機(jī)的圖像檢索方法[J];東北林業(yè)大學(xué)學(xué)報;2009年10期
9 封化民,方衛(wèi),劉森,方勇,宋國森;視頻分割和關(guān)鍵幀提取統(tǒng)一框架[J];清華大學(xué)學(xué)報(自然科學(xué)版);2005年S1期
10 劉明宇,王玨,燕楠,魏娜,鄭崇勛;一種新的注意力相關(guān)腦電分類算法設(shè)計(jì)[J];西安交通大學(xué)學(xué)報;2005年10期
相關(guān)會議論文 前10條
1 張敏情;蘇光偉;楊曉元;;保局投影在圖像隱密檢測中的應(yīng)用[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會湖南省計(jì)算機(jī)學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
2 宋金偉;劉廣利;沈翠華;李迪;;基于支持向量機(jī)的織物組織識別方法[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年
3 張瑞民;袁震東;;基于小波變換和支持向量機(jī)的心電圖分類[A];2004中國控制與決策學(xué)術(shù)年會論文集[C];2004年
4 唐超;劉辰;楊正球;;使用多層迭代分析和分類網(wǎng)頁文檔的方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
5 劉怡光;游健;張建偉;;基于支持向量的多類分類器設(shè)計(jì)[A];第十三屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2006年
6 楊凌;劉玉樹;;基于支持向量機(jī)的坦克識別算法[A];第三屆全國數(shù)字成像技術(shù)及相關(guān)材料發(fā)展與應(yīng)用學(xué)術(shù)研討會論文摘要集[C];2004年
7 許建生;盛立東;;基于改進(jìn)的支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)的識別算法[A];第八屆全國漢字識別學(xué)術(shù)會議論文集[C];2002年
8 ?×;魏巍;梁君燕;;基于支持向量機(jī)的SURF改進(jìn)算法[A];中國自動化學(xué)會控制理論專業(yè)委員會C卷[C];2011年
9 宋普云;沈雪勤;吳清;;一種改進(jìn)的SMO算法[A];第六屆全國計(jì)算機(jī)應(yīng)用聯(lián)合學(xué)術(shù)會議論文集[C];2002年
10 喬立巖;彭喜元;彭宇;;基于支持向量機(jī)的鍵盤密碼輸入異常檢測方法研究[A];2004全國測控、計(jì)量與儀器儀表學(xué)術(shù)年會論文集(上冊)[C];2004年
相關(guān)重要報紙文章 前10條
1 記者 王小海邋實(shí)習(xí)生 李華炎;電子月餅雖“香”還得小心病毒[N];南方日報;2007年
2 竇毅;榮豐:客戶逼出來的ERP[N];中國經(jīng)營報;2006年
3 通訊員 裴順強(qiáng);中國天氣網(wǎng)點(diǎn)擊率列國內(nèi)生活服務(wù)類網(wǎng)站第一名[N];中國氣象報;2009年
4 王澤蘊(yùn);eBay撤廣告彰顯谷歌危機(jī)[N];中國計(jì)算機(jī)報;2007年
5 蓋東海;炒股軟件夸大功效借牛市蒙錢[N];消費(fèi)日報;2007年
6 張一君;“點(diǎn)擊欺詐”磨鈍競價排名?[N];中國經(jīng)營報;2006年
7 記者 胡Z,
本文編號:2293431
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2293431.html