天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于分類的term重要性識別方法

發(fā)布時(shí)間:2017-07-02 16:24

  本文關(guān)鍵詞:基于分類的term重要性識別方法,由筆耕文化傳播整理發(fā)布。


【摘要】:在傳統(tǒng)的搜索引擎和信息檢索中,用戶Query中的term-weight通常是以一種上下文無關(guān)的方式得到的,F(xiàn)有的大多數(shù)信息檢索技術(shù)都使用詞袋方法,例如布爾模型、向量空間模型和概率模型等,這些方法均沒有考慮Query中term之間的相關(guān)性。為了能夠充分利用Query中的信息來提高term-weight的準(zhǔn)確度,提出了一種有監(jiān)督的機(jī)器學(xué)習(xí)方法來學(xué)習(xí)用戶Query中的term-weight。該方法基于分類的方法,并引入了句法分析作為分類的一項(xiàng)重要的特征來訓(xùn)練模型?紤]用戶Query中term之間的關(guān)系后,既避免了由Query到單個(gè)term的信息丟失,又增加了短文本的特征,同時(shí)使分類器實(shí)現(xiàn)軟輸出,能夠給term的重要程度一個(gè)更為準(zhǔn)確的量化值。
【作者單位】: 遼寧工程技術(shù)大學(xué)軟件學(xué)院;遼寧工程技術(shù)大學(xué)系統(tǒng)工程研究所;
【關(guān)鍵詞】分類 依存句法分析 查詢詞權(quán)重 查詢分析 term重要性 搜索引擎 信息檢索
【基金】:國家自然科學(xué)基金(70971059) 遼寧省創(chuàng)新團(tuán)隊(duì)項(xiàng)目(2009T045)資助
【分類號】:TP391.3
【正文快照】: 2012年第30次中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[1]指出,截止至2012年6月底,中國網(wǎng)民數(shù)量達(dá)到5.38億,其中搜索引擎用戶規(guī)模達(dá)到4.29億,較2011年底增長2121萬人,在網(wǎng)民中的滲透率攀升為79.7%,依舊是僅次于即時(shí)通訊的第二大網(wǎng)絡(luò)應(yīng)用。搜索引擎作為互聯(lián)網(wǎng)的基礎(chǔ)應(yīng)用,是網(wǎng)民在互聯(lián)網(wǎng)中

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 董立巖;劉光遠(yuǎn);苑森淼;李永麗;孫銘會;;混合式樸素貝葉斯分類模型[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2007年01期

2 劉慧婷;倪志偉;李建洋;劉政怡;;基于交叉覆蓋算法的時(shí)間序列模式匹配[J];計(jì)算機(jī)應(yīng)用;2007年02期

3 張勇;;一種新的多類別多標(biāo)簽關(guān)聯(lián)分類方法的研究[J];福建電腦;2007年08期

4 周屹;;基于Naive Bayes的文本分類器的設(shè)計(jì)與實(shí)現(xiàn)[J];黑龍江工程學(xué)院學(xué)報(bào);2007年02期

5 陳建林;樊興華;王國胤;;基于兩步策略的英文文本分類[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年04期

6 王皓;孫宏斌;張伯明;;PG-HMI:一種基于互信息的特征選擇方法[J];模式識別與人工智能;2007年01期

7 孫岳;毛國君;劉旭;;數(shù)據(jù)流中概念漂移檢測的集成分類器設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用研究;2008年01期

8 朱紅斌;;基于Adaboost算法的交通事件檢測[J];計(jì)算機(jī)時(shí)代;2008年01期

9 吳開興;杜晶;韓范玉;;基于層次型Adaboost的動態(tài)車牌定位方法[J];商場現(xiàn)代化;2008年07期

10 尚春紅;趙明昌;;復(fù)雜背景圖像中軍用靶子識別算法研究[J];計(jì)算機(jī)應(yīng)用;2008年05期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 穆明生;;基于特征集的多種分類器模型的在線筆跡認(rèn)證[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年

2 徐蔚然;于武貴;郭軍;;基于統(tǒng)計(jì)方法的混排文字切分與分類[A];第八屆全國漢字識別學(xué)術(shù)會議論文集[C];2002年

3 雷蕾;吳乃君;劉鵬;劉蘭娟;;靈敏度分析:分類器中的缺失數(shù)據(jù)[A];第11屆海峽兩岸信息管理發(fā)展策略研討會論文集[C];2005年

4 李剛;郭崇慧;林鴻飛;楊志豪;唐煥文;;基于詞典法和機(jī)器學(xué)習(xí)法相結(jié)合的蛋白質(zhì)名識別[A];大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)術(shù)論文集(第2卷)[C];2005年

5 沈錢波;何加銘;;連筆手寫識別搜索算法研究[A];浙江省電子學(xué)會2008年學(xué)術(shù)年會論文集[C];2008年

6 王先梅;林子鈺;;基于HMM的脫機(jī)手寫大寫金額識別中的單分類器性能分析[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年

7 王穎;毋立芳;關(guān)媛;王涓涓;;基于LBP的SVM人臉姿勢估計(jì)方法[A];第十三屆全國信號處理學(xué)術(shù)年會(CCSP-2007)論文集[C];2007年

8 龔妙昆;萬福永;許建強(qiáng);袁震東;;心電圖小波壓縮特征提取及SVM分類分析[A];2005中國控制與決策學(xué)術(shù)年會論文集(下)[C];2005年

9 李玉良;王良松;李晶;;圖像中數(shù)字字符識別技術(shù)概覽[A];節(jié)能環(huán)保 和諧發(fā)展——2007中國科協(xié)年會論文集(一)[C];2007年

10 翟靜;李海宏;唐常杰;陳敏敏;李智;;可驗(yàn)證對象集分類器的再訓(xùn)練演進(jìn)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2002年

中國重要報(bào)紙全文數(shù)據(jù)庫 前10條

1 ;“營銷通”:集CRM與OA于一體[N];計(jì)算機(jī)世界;2003年

2 鄭依華;部署搜索應(yīng)用開發(fā)環(huán)境[N];計(jì)算機(jī)世界;2006年

3 ;電子政務(wù)數(shù)據(jù)交換平臺解決方案[N];計(jì)算機(jī)世界;2006年

4 顧春;金創(chuàng)集團(tuán)實(shí)現(xiàn)會計(jì)電算化[N];中國黃金報(bào);2007年

5 張海軍;輸配網(wǎng)GIS一體化破解“信息孤島”[N];中國電力報(bào);2006年

6 雷陽;BEA借技術(shù)開拓SOA市場[N];電腦商報(bào);2006年

7 本版編輯 中國科學(xué)院計(jì)算技術(shù)研究所數(shù)字媒體研究中心 山世光 陳熙霖 高文 徐昕 劉洪宇;你的臉,你的身份證明[N];中國計(jì)算機(jī)報(bào);2006年

8 劉琳;地理信息系統(tǒng)發(fā)展趨勢[N];中國測繪報(bào);2008年

9 ;Ework助電子政務(wù)邁上新臺階[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2004年

10 武德鋒 李國輝 林洪文 姚作梁;圖像世界任我行[N];計(jì)算機(jī)世界;2002年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 王U,

本文編號:510675


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/510675.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aca43***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com