基于矩陣加權(quán)關(guān)聯(lián)模式的印尼中跨語(yǔ)言信息檢索模型
本文選題:點(diǎn)擊行為 + 關(guān)聯(lián)模式挖掘 ; 參考:《數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)》2017年01期
【摘要】:【目的】針對(duì)跨語(yǔ)言信息檢索存在的查詢(xún)漂移問(wèn)題,提出一種融合用戶(hù)點(diǎn)擊下載行為與矩陣加權(quán)關(guān)聯(lián)模式挖掘的印尼中跨語(yǔ)言信息檢索模型!痉椒ā繉⒕仃嚰訖(quán)關(guān)聯(lián)模式挖掘、查詢(xún)擴(kuò)展以及用戶(hù)點(diǎn)擊下載行為集成應(yīng)用到印尼中跨語(yǔ)言信息檢索模型,給出模型實(shí)現(xiàn)的關(guān)鍵技術(shù),即面向跨語(yǔ)言信息檢索的矩陣加權(quán)關(guān)聯(lián)模式挖掘算法、跨語(yǔ)言查詢(xún)擴(kuò)展模型以及印尼中跨語(yǔ)言信息檢索算法。【結(jié)果】在NTCIR-5 CLIR數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該檢索模型的R_prec、p@10和p@20值均達(dá)到單語(yǔ)言檢索基準(zhǔn)的60%以上,比跨語(yǔ)言檢索基準(zhǔn)提高37%以上,比現(xiàn)有基于偽相關(guān)反饋的跨語(yǔ)言檢索算法提高28%以上!揪窒蕖吭撃P蛯(shí)驗(yàn)在基于向量空間模型的跨語(yǔ)言檢索系統(tǒng)中進(jìn)行,需要探討和研究在實(shí)際搜索引擎中的具體應(yīng)用!窘Y(jié)論】該模型能有效地減少跨語(yǔ)言檢索中的查詢(xún)漂移問(wèn)題,提高和改善印尼中跨語(yǔ)言檢索性能,對(duì)長(zhǎng)查詢(xún)的檢索效果更好,有較好的實(shí)際應(yīng)用價(jià)值。
[Abstract]:[objective] to solve the problem of query drift in cross-language information retrieval, This paper proposes a cross-language information retrieval model in Indonesia, which combines user click-download behavior with matrix weighted association pattern mining. [methods] Matrix weighted association pattern mining is proposed. Query expansion and user click-download behavior integration are applied to the cross-language information retrieval model in Indonesia. The key technologies of the model are given, which is matrix weighted association pattern mining algorithm for cross-language information retrieval. Results the experimental results on the NTCIR-5 CLIR data set show that the RSP @ 10 and PDP 20 values of the retrieval model reach more than 60% of the monolingual retrieval benchmark. It is more than 37% higher than the cross-language retrieval benchmark and more than 28% higher than the existing cross-language retrieval algorithms based on pseudo-correlation feedback. [limitation] this model experiment is carried out in a cross-language retrieval system based on vector space model. This model can effectively reduce the query drift in cross-language retrieval, improve and improve the performance of Indonesian mid-to-medium cross-language retrieval, and improve the retrieval effect of long query, which needs to be explored and studied in practical search engine. [conclusion] this model can effectively reduce the query drift in cross-language retrieval, and improve the performance of mid-to-medium cross-language retrieval in Indonesia. It has good practical application value.
【作者單位】: 廣西跨境電商智能信息處理重點(diǎn)實(shí)驗(yàn)室培育基地(廣西財(cái)經(jīng)學(xué)院);廣西財(cái)經(jīng)學(xué)院計(jì)算機(jī)系;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目“面向東盟國(guó)家語(yǔ)言的基于完全加權(quán)正負(fù)模式挖掘的跨語(yǔ)言查詢(xún)擴(kuò)展研究”(項(xiàng)目編號(hào):61262028) 廣西財(cái)經(jīng)學(xué)院信息與統(tǒng)計(jì)學(xué)院開(kāi)放性課題“基于矩陣加權(quán)關(guān)聯(lián)模式挖掘的越漢英跨語(yǔ)言信息檢索研究”(項(xiàng)目編號(hào):2015XK01) 廣西財(cái)經(jīng)學(xué)院2016年度應(yīng)用統(tǒng)計(jì)碩士專(zhuān)業(yè)學(xué)位點(diǎn)學(xué)術(shù)研究項(xiàng)目“基于完全加權(quán)關(guān)聯(lián)模式挖掘的中英跨語(yǔ)言偽相關(guān)反饋擴(kuò)展研究”(項(xiàng)目編號(hào):2016TJYB05)的研究成果之一
【分類(lèi)號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前8條
1 魏露;李書(shū)琴;李偉男;李新樂(lè);;跨語(yǔ)言查詢(xún)擴(kuò)展優(yōu)化[J];計(jì)算機(jī)工程與設(shè)計(jì);2014年08期
2 羅遠(yuǎn)勝;王明文;勒中堅(jiān);張華偉;;跨語(yǔ)言信息檢索中的雙語(yǔ)主題相關(guān)模型[J];小型微型計(jì)算機(jī)系統(tǒng);2013年12期
3 王序文;王小捷;孫月萍;;雙語(yǔ)主題跨語(yǔ)言偽相關(guān)反饋[J];北京郵電大學(xué)學(xué)報(bào);2013年04期
4 吳丹;何大慶;王惠臨;;一種基于相關(guān)反饋的跨語(yǔ)言信息檢索查詢(xún)翻譯優(yōu)化技術(shù)研究[J];情報(bào)學(xué)報(bào);2012年04期
5 寧健;林鴻飛;;基于改進(jìn)潛在語(yǔ)義分析的跨語(yǔ)言檢索[J];中文信息學(xué)報(bào);2010年03期
6 黃名選;嚴(yán)小衛(wèi);張師超;;基于矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘的偽相關(guān)反饋查詢(xún)擴(kuò)展[J];軟件學(xué)報(bào);2009年07期
7 閉劍婷;蘇一丹;;基于潛在語(yǔ)義分析的跨語(yǔ)言查詢(xún)擴(kuò)展方法[J];計(jì)算機(jī)工程;2009年10期
8 吳丹;何大慶;王惠臨;;基于偽相關(guān)反饋的跨語(yǔ)言查詢(xún)擴(kuò)展[J];情報(bào)學(xué)報(bào);2010年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 黃名選;;基于矩陣加權(quán)關(guān)聯(lián)模式的印尼中跨語(yǔ)言信息檢索模型[J];數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn);2017年01期
2 葉雷;高盛祥;余正濤;秦廣順;洪旭東;;基于事件元素?zé)o向圖的查詢(xún)擴(kuò)展方法[J];中文信息學(xué)報(bào);2017年01期
3 鄒裕;肖倩;吳樹(shù)榮;;基于增強(qiáng)關(guān)聯(lián)規(guī)則挖掘的大型網(wǎng)站推薦系統(tǒng)[J];計(jì)算機(jī)與現(xiàn)代化;2016年10期
4 唐亮;趙曉峰;席耀一;易綿竹;;融合局部共現(xiàn)和上下文相似度的查詢(xún)擴(kuò)展方法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2017年01期
5 司莉;何依;;2000年以來(lái)我國(guó)多語(yǔ)言語(yǔ)料庫(kù)研究進(jìn)展[J];現(xiàn)代情報(bào);2016年06期
6 于福超;盧廷鈞;王裴巖;張桂平;;一種面向情報(bào)服務(wù)的交互式主題擴(kuò)展方法[J];沈陽(yáng)航空航天大學(xué)學(xué)報(bào);2016年02期
7 胡曠達(dá);;基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究[J];現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版);2016年11期
8 安建瑞;王海鵬;張龍波;金超;懷浩;;一種基于MapReduce的壓縮矩陣關(guān)聯(lián)規(guī)則挖掘算法[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué));2016年02期
9 陳波;段成永;高秀娥;;基于矩陣加權(quán)的VMOApriori算法[J];測(cè)控技術(shù);2016年01期
10 鐘敏娟;萬(wàn)常選;劉德喜;江騰蛟;劉愛(ài)紅;;基于偽反饋的有效XML查詢(xún)擴(kuò)展[J];計(jì)算機(jī)科學(xué)與探索;2016年12期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王旭陽(yáng);蕭波;;基于本體和局部上下文分析的查詢(xún)擴(kuò)展方法[J];計(jì)算機(jī)工程;2012年07期
2 徐戈;王厚峰;;自然語(yǔ)言處理中主題模型的發(fā)展[J];計(jì)算機(jī)學(xué)報(bào);2011年08期
3 李二森;張保明;楊娜;楊靖宇;郭曉剛;;非負(fù)矩陣分解在高光譜圖像解混中的應(yīng)用探討[J];測(cè)繪通報(bào);2011年03期
4 田久樂(lè);趙蔚;;基于同義詞詞林的詞語(yǔ)相似度計(jì)算方法[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2010年06期
5 陳琴;;跨語(yǔ)言信息檢索中雙語(yǔ)詞典的建立和翻譯方法[J];計(jì)算機(jī)應(yīng)用與軟件;2010年07期
6 寧健;林鴻飛;;基于改進(jìn)潛在語(yǔ)義分析的跨語(yǔ)言檢索[J];中文信息學(xué)報(bào);2010年03期
7 鄒小芳;王明文;左家莉;余美華;;新的基于中間語(yǔ)義的多語(yǔ)言信息檢索模型[J];小型微型計(jì)算機(jī)系統(tǒng);2010年04期
8 閉劍婷;蘇一丹;;基于潛在語(yǔ)義分析的跨語(yǔ)言查詢(xún)擴(kuò)展方法[J];計(jì)算機(jī)工程;2009年10期
9 郭文;陳毅東;趙欣;;跨語(yǔ)言信息檢索中的查詢(xún)擴(kuò)展[J];心智與計(jì)算;2009年01期
10 黃國(guó)斌;王明文;葉浩;;一種新的基于中間語(yǔ)義的跨語(yǔ)言信息檢索模型[J];中文信息學(xué)報(bào);2009年02期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 趙琳;;幾種信息檢索模型的比較[J];煤炭技術(shù);2012年08期
2 王娟;;基于中文科技期刊數(shù)據(jù)庫(kù)信息檢索模型的研究[J];科教文匯(中旬刊);2012年10期
3 齊繼國(guó),高X},汪東升;基于多用戶(hù)協(xié)同反饋的信息檢索模型[J];小型微型計(jì)算機(jī)系統(tǒng);2003年07期
4 吳晨;張全;繆建明;;基于語(yǔ)言概念空間的跨語(yǔ)種信息檢索模型[J];計(jì)算機(jī)工程;2006年18期
5 吳麗華;羅云鋒;張宏斌;;信息檢索模型及相關(guān)性算法的研究[J];情報(bào)雜志;2006年12期
6 周竹榮;黃果;周亭;;一種混合的文本信息檢索模型研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年11期
7 鐘振鴻;印潤(rùn)遠(yuǎn);于慶梅;;基于本體驅(qū)動(dòng)的法律信息檢索模型[J];微計(jì)算機(jī)信息;2007年30期
8 劉偉成;孫吉紅;;跨語(yǔ)言信息檢索模型應(yīng)用研究[J];情報(bào)雜志;2007年10期
9 張小芳;;幾種常見(jiàn)信息檢索模型的分析與評(píng)價(jià)[J];情報(bào)雜志;2008年03期
10 丁志剛;王小捷;;一種基于類(lèi)別意圖的信息檢索模型[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2009年01期
相關(guān)會(huì)議論文 前9條
1 梅偉;劉惟一;;基于可信度的信息檢索模型[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年
2 黃名選;嚴(yán)小衛(wèi);張師超;;基于完全加權(quán)關(guān)聯(lián)規(guī)則挖掘的信息檢索模型[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
3 黃國(guó)斌;王明文;葉浩;;一種新的基于中間語(yǔ)義的跨語(yǔ)言信息檢索模型[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
4 張文雅;宋大為;趙曉朝;張鵬;李競(jìng)飛;;基于可讀性的信息檢索模型研究[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
5 李廣原;馮嘉禮;;基于屬性坐標(biāo)的文本信息檢索模型[A];廣西計(jì)算機(jī)學(xué)會(huì)2005年學(xué)術(shù)年會(huì)論文集[C];2005年
6 普東航;唐常杰;元昌安;廖勇;張?zhí)鞈c;于中華;;一種基于相鄰地址的信息檢索模型AAM[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
7 盛俊;王明文;余俊英;;一種基于潛在語(yǔ)義的Markov網(wǎng)絡(luò)信息檢索模型[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
8 吳晨;張全;繆建明;韋向峰;;自然語(yǔ)言語(yǔ)義理解下的信息檢索模型[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
9 孫斌;呂學(xué)強(qiáng);蘇祺;;義項(xiàng)矩陣模型SMM簡(jiǎn)介[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
相關(guān)博士學(xué)位論文 前7條
1 楊為民;基于場(chǎng)論的信息檢索模型的研究[D];安徽大學(xué);2007年
2 徐建民;基于術(shù)語(yǔ)關(guān)系的貝葉斯網(wǎng)絡(luò)信息檢索模型擴(kuò)展研究[D];天津大學(xué);2007年
3 陳圣兵;基于商空間理論的海量信息檢索模型的研究[D];安徽大學(xué);2010年
4 程凡;基于排序?qū)W習(xí)的信息檢索模型研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
5 涂新輝;基于概念的信息檢索模型研究[D];華中師范大學(xué);2012年
6 梁作鵬;面向Web的XML檢索關(guān)鍵技術(shù)研究[D];東南大學(xué);2005年
7 高琰;基于多特征的Web社區(qū)發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];中南大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 任克江;基于地理信息的檢索和用戶(hù)數(shù)據(jù)挖掘[D];大連理工大學(xué);2013年
2 丁志剛;基于類(lèi)別意圖的信息檢索模型[D];北京郵電大學(xué);2009年
3 王慶華;用戶(hù)個(gè)性化信息檢索模型的設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2004年
4 黃果;文本信息檢索模型研究[D];西南大學(xué);2007年
5 張東偉;中英文跨語(yǔ)言信息檢索模型研究[D];黑龍江大學(xué);2006年
6 廖亞男;基于多層Markov網(wǎng)絡(luò)的信息檢索模型[D];江西師范大學(xué);2014年
7 左家莉;基于Markov網(wǎng)絡(luò)的信息檢索模型[D];江西師范大學(xué);2005年
8 王艷萍;基于XML的移動(dòng)信息檢索模型研究[D];大連理工大學(xué);2006年
9 甘麗新;基于Markov概念的信息檢索模型[D];江西師范大學(xué);2007年
10 姜鵬;Kullback-Leibler距離檢索框架下文摘在檢索中的應(yīng)用[D];昆明理工大學(xué);2011年
,本文編號(hào):1903790
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1903790.html