基于矩陣加權(quán)關(guān)聯(lián)模式的印尼中跨語言信息檢索模型
本文選題:點擊行為 + 關(guān)聯(lián)模式挖掘 ; 參考:《數(shù)據(jù)分析與知識發(fā)現(xiàn)》2017年01期
【摘要】:【目的】針對跨語言信息檢索存在的查詢漂移問題,提出一種融合用戶點擊下載行為與矩陣加權(quán)關(guān)聯(lián)模式挖掘的印尼中跨語言信息檢索模型。【方法】將矩陣加權(quán)關(guān)聯(lián)模式挖掘、查詢擴展以及用戶點擊下載行為集成應用到印尼中跨語言信息檢索模型,給出模型實現(xiàn)的關(guān)鍵技術(shù),即面向跨語言信息檢索的矩陣加權(quán)關(guān)聯(lián)模式挖掘算法、跨語言查詢擴展模型以及印尼中跨語言信息檢索算法。【結(jié)果】在NTCIR-5 CLIR數(shù)據(jù)集上的實驗結(jié)果表明,該檢索模型的R_prec、p@10和p@20值均達到單語言檢索基準的60%以上,比跨語言檢索基準提高37%以上,比現(xiàn)有基于偽相關(guān)反饋的跨語言檢索算法提高28%以上。【局限】該模型實驗在基于向量空間模型的跨語言檢索系統(tǒng)中進行,需要探討和研究在實際搜索引擎中的具體應用!窘Y(jié)論】該模型能有效地減少跨語言檢索中的查詢漂移問題,提高和改善印尼中跨語言檢索性能,對長查詢的檢索效果更好,有較好的實際應用價值。
[Abstract]:[objective] to solve the problem of query drift in cross-language information retrieval, This paper proposes a cross-language information retrieval model in Indonesia, which combines user click-download behavior with matrix weighted association pattern mining. [methods] Matrix weighted association pattern mining is proposed. Query expansion and user click-download behavior integration are applied to the cross-language information retrieval model in Indonesia. The key technologies of the model are given, which is matrix weighted association pattern mining algorithm for cross-language information retrieval. Results the experimental results on the NTCIR-5 CLIR data set show that the RSP @ 10 and PDP 20 values of the retrieval model reach more than 60% of the monolingual retrieval benchmark. It is more than 37% higher than the cross-language retrieval benchmark and more than 28% higher than the existing cross-language retrieval algorithms based on pseudo-correlation feedback. [limitation] this model experiment is carried out in a cross-language retrieval system based on vector space model. This model can effectively reduce the query drift in cross-language retrieval, improve and improve the performance of Indonesian mid-to-medium cross-language retrieval, and improve the retrieval effect of long query, which needs to be explored and studied in practical search engine. [conclusion] this model can effectively reduce the query drift in cross-language retrieval, and improve the performance of mid-to-medium cross-language retrieval in Indonesia. It has good practical application value.
【作者單位】: 廣西跨境電商智能信息處理重點實驗室培育基地(廣西財經(jīng)學院);廣西財經(jīng)學院計算機系;
【基金】:國家自然科學基金項目“面向東盟國家語言的基于完全加權(quán)正負模式挖掘的跨語言查詢擴展研究”(項目編號:61262028) 廣西財經(jīng)學院信息與統(tǒng)計學院開放性課題“基于矩陣加權(quán)關(guān)聯(lián)模式挖掘的越漢英跨語言信息檢索研究”(項目編號:2015XK01) 廣西財經(jīng)學院2016年度應用統(tǒng)計碩士專業(yè)學位點學術(shù)研究項目“基于完全加權(quán)關(guān)聯(lián)模式挖掘的中英跨語言偽相關(guān)反饋擴展研究”(項目編號:2016TJYB05)的研究成果之一
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前8條
1 魏露;李書琴;李偉男;李新樂;;跨語言查詢擴展優(yōu)化[J];計算機工程與設(shè)計;2014年08期
2 羅遠勝;王明文;勒中堅;張華偉;;跨語言信息檢索中的雙語主題相關(guān)模型[J];小型微型計算機系統(tǒng);2013年12期
3 王序文;王小捷;孫月萍;;雙語主題跨語言偽相關(guān)反饋[J];北京郵電大學學報;2013年04期
4 吳丹;何大慶;王惠臨;;一種基于相關(guān)反饋的跨語言信息檢索查詢翻譯優(yōu)化技術(shù)研究[J];情報學報;2012年04期
5 寧健;林鴻飛;;基于改進潛在語義分析的跨語言檢索[J];中文信息學報;2010年03期
6 黃名選;嚴小衛(wèi);張師超;;基于矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘的偽相關(guān)反饋查詢擴展[J];軟件學報;2009年07期
7 閉劍婷;蘇一丹;;基于潛在語義分析的跨語言查詢擴展方法[J];計算機工程;2009年10期
8 吳丹;何大慶;王惠臨;;基于偽相關(guān)反饋的跨語言查詢擴展[J];情報學報;2010年02期
【共引文獻】
相關(guān)期刊論文 前10條
1 黃名選;;基于矩陣加權(quán)關(guān)聯(lián)模式的印尼中跨語言信息檢索模型[J];數(shù)據(jù)分析與知識發(fā)現(xiàn);2017年01期
2 葉雷;高盛祥;余正濤;秦廣順;洪旭東;;基于事件元素無向圖的查詢擴展方法[J];中文信息學報;2017年01期
3 鄒裕;肖倩;吳樹榮;;基于增強關(guān)聯(lián)規(guī)則挖掘的大型網(wǎng)站推薦系統(tǒng)[J];計算機與現(xiàn)代化;2016年10期
4 唐亮;趙曉峰;席耀一;易綿竹;;融合局部共現(xiàn)和上下文相似度的查詢擴展方法[J];山東大學學報(理學版);2017年01期
5 司莉;何依;;2000年以來我國多語言語料庫研究進展[J];現(xiàn)代情報;2016年06期
6 于福超;盧廷鈞;王裴巖;張桂平;;一種面向情報服務的交互式主題擴展方法[J];沈陽航空航天大學學報;2016年02期
7 胡曠達;;基于神經(jīng)網(wǎng)絡的個性化信息檢索模型研究[J];現(xiàn)代計算機(專業(yè)版);2016年11期
8 安建瑞;王海鵬;張龍波;金超;懷浩;;一種基于MapReduce的壓縮矩陣關(guān)聯(lián)規(guī)則挖掘算法[J];重慶理工大學學報(自然科學);2016年02期
9 陳波;段成永;高秀娥;;基于矩陣加權(quán)的VMOApriori算法[J];測控技術(shù);2016年01期
10 鐘敏娟;萬常選;劉德喜;江騰蛟;劉愛紅;;基于偽反饋的有效XML查詢擴展[J];計算機科學與探索;2016年12期
【二級參考文獻】
相關(guān)期刊論文 前10條
1 王旭陽;蕭波;;基于本體和局部上下文分析的查詢擴展方法[J];計算機工程;2012年07期
2 徐戈;王厚峰;;自然語言處理中主題模型的發(fā)展[J];計算機學報;2011年08期
3 李二森;張保明;楊娜;楊靖宇;郭曉剛;;非負矩陣分解在高光譜圖像解混中的應用探討[J];測繪通報;2011年03期
4 田久樂;趙蔚;;基于同義詞詞林的詞語相似度計算方法[J];吉林大學學報(信息科學版);2010年06期
5 陳琴;;跨語言信息檢索中雙語詞典的建立和翻譯方法[J];計算機應用與軟件;2010年07期
6 寧健;林鴻飛;;基于改進潛在語義分析的跨語言檢索[J];中文信息學報;2010年03期
7 鄒小芳;王明文;左家莉;余美華;;新的基于中間語義的多語言信息檢索模型[J];小型微型計算機系統(tǒng);2010年04期
8 閉劍婷;蘇一丹;;基于潛在語義分析的跨語言查詢擴展方法[J];計算機工程;2009年10期
9 郭文;陳毅東;趙欣;;跨語言信息檢索中的查詢擴展[J];心智與計算;2009年01期
10 黃國斌;王明文;葉浩;;一種新的基于中間語義的跨語言信息檢索模型[J];中文信息學報;2009年02期
【相似文獻】
相關(guān)期刊論文 前10條
1 趙琳;;幾種信息檢索模型的比較[J];煤炭技術(shù);2012年08期
2 王娟;;基于中文科技期刊數(shù)據(jù)庫信息檢索模型的研究[J];科教文匯(中旬刊);2012年10期
3 齊繼國,高X},汪東升;基于多用戶協(xié)同反饋的信息檢索模型[J];小型微型計算機系統(tǒng);2003年07期
4 吳晨;張全;繆建明;;基于語言概念空間的跨語種信息檢索模型[J];計算機工程;2006年18期
5 吳麗華;羅云鋒;張宏斌;;信息檢索模型及相關(guān)性算法的研究[J];情報雜志;2006年12期
6 周竹榮;黃果;周亭;;一種混合的文本信息檢索模型研究[J];計算機工程與設(shè)計;2007年11期
7 鐘振鴻;印潤遠;于慶梅;;基于本體驅(qū)動的法律信息檢索模型[J];微計算機信息;2007年30期
8 劉偉成;孫吉紅;;跨語言信息檢索模型應用研究[J];情報雜志;2007年10期
9 張小芳;;幾種常見信息檢索模型的分析與評價[J];情報雜志;2008年03期
10 丁志剛;王小捷;;一種基于類別意圖的信息檢索模型[J];鄭州大學學報(理學版);2009年01期
相關(guān)會議論文 前9條
1 梅偉;劉惟一;;基于可信度的信息檢索模型[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2002年
2 黃名選;嚴小衛(wèi);張師超;;基于完全加權(quán)關(guān)聯(lián)規(guī)則挖掘的信息檢索模型[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
3 黃國斌;王明文;葉浩;;一種新的基于中間語義的跨語言信息檢索模型[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
4 張文雅;宋大為;趙曉朝;張鵬;李競飛;;基于可讀性的信息檢索模型研究[A];第十二屆全國人機語音通訊學術(shù)會議(NCMMSC'2013)論文集[C];2013年
5 李廣原;馮嘉禮;;基于屬性坐標的文本信息檢索模型[A];廣西計算機學會2005年學術(shù)年會論文集[C];2005年
6 普東航;唐常杰;元昌安;廖勇;張?zhí)鞈c;于中華;;一種基于相鄰地址的信息檢索模型AAM[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2004年
7 盛俊;王明文;余俊英;;一種基于潛在語義的Markov網(wǎng)絡信息檢索模型[A];第二屆全國信息檢索與內(nèi)容安全學術(shù)會議(NCIRCS-2005)論文集[C];2005年
8 吳晨;張全;繆建明;韋向峰;;自然語言語義理解下的信息檢索模型[A];第三屆學生計算語言學研討會論文集[C];2006年
9 孫斌;呂學強;蘇祺;;義項矩陣模型SMM簡介[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2004年
相關(guān)博士學位論文 前7條
1 楊為民;基于場論的信息檢索模型的研究[D];安徽大學;2007年
2 徐建民;基于術(shù)語關(guān)系的貝葉斯網(wǎng)絡信息檢索模型擴展研究[D];天津大學;2007年
3 陳圣兵;基于商空間理論的海量信息檢索模型的研究[D];安徽大學;2010年
4 程凡;基于排序?qū)W習的信息檢索模型研究[D];中國科學技術(shù)大學;2012年
5 涂新輝;基于概念的信息檢索模型研究[D];華中師范大學;2012年
6 梁作鵬;面向Web的XML檢索關(guān)鍵技術(shù)研究[D];東南大學;2005年
7 高琰;基于多特征的Web社區(qū)發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];中南大學;2007年
相關(guān)碩士學位論文 前10條
1 任克江;基于地理信息的檢索和用戶數(shù)據(jù)挖掘[D];大連理工大學;2013年
2 丁志剛;基于類別意圖的信息檢索模型[D];北京郵電大學;2009年
3 王慶華;用戶個性化信息檢索模型的設(shè)計與實現(xiàn)[D];大連理工大學;2004年
4 黃果;文本信息檢索模型研究[D];西南大學;2007年
5 張東偉;中英文跨語言信息檢索模型研究[D];黑龍江大學;2006年
6 廖亞男;基于多層Markov網(wǎng)絡的信息檢索模型[D];江西師范大學;2014年
7 左家莉;基于Markov網(wǎng)絡的信息檢索模型[D];江西師范大學;2005年
8 王艷萍;基于XML的移動信息檢索模型研究[D];大連理工大學;2006年
9 甘麗新;基于Markov概念的信息檢索模型[D];江西師范大學;2007年
10 姜鵬;Kullback-Leibler距離檢索框架下文摘在檢索中的應用[D];昆明理工大學;2011年
,本文編號:1903790
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1903790.html