維吾爾文網(wǎng)絡(luò)查詢擴(kuò)展詞的構(gòu)建研究
本文關(guān)鍵詞:維吾爾文網(wǎng)絡(luò)查詢擴(kuò)展詞的構(gòu)建研究 出處:《計(jì)算機(jī)工程》2015年04期 論文類型:期刊論文
更多相關(guān)文章: 查詢擴(kuò)展 局部共現(xiàn)分析 點(diǎn)互信息算法 擴(kuò)展詞 大規(guī)模語(yǔ)料庫(kù)
【摘要】:為提高維吾爾文網(wǎng)絡(luò)內(nèi)容查詢的擴(kuò)展性能,提出一種將維語(yǔ)同義詞和互聯(lián)網(wǎng)資源相結(jié)合的擴(kuò)展詞構(gòu)建算法。利用維吾爾語(yǔ)同義詞詞典、近義詞詞典和反義詞詞典等建立基本候選詞庫(kù),將互聯(lián)網(wǎng)作為超大規(guī)模語(yǔ)料庫(kù),以搜索引擎為工具,使用改進(jìn)的點(diǎn)互信息對(duì)基本擴(kuò)展詞進(jìn)行相似度評(píng)價(jià),選取前N個(gè)詞形成候選擴(kuò)展詞庫(kù)1,對(duì)包含關(guān)鍵詞的互聯(lián)網(wǎng)語(yǔ)料,基于局部共現(xiàn)和點(diǎn)互信息分析,構(gòu)建候選擴(kuò)展詞庫(kù)2,對(duì)上述2種候選擴(kuò)展詞庫(kù)加權(quán)求和,按順序選擇部分詞為擴(kuò)展詞。通過(guò)搜索引擎實(shí)現(xiàn)擴(kuò)展查詢驗(yàn)證,結(jié)果表明,與常規(guī)查詢和同義詞查詢擴(kuò)展算法相比,該算法能明顯提高查詢的準(zhǔn)確率。
[Abstract]:To improve the performance of network expansion for Uighur content query, a Uighur synonym expansion words and Internet resources of the combination algorithm. Using Uyghur Dictionary of synonyms, antonyms and Synonyms Dictionary dictionary establishment candidate thesaurus, the Internet as a super large scale corpus, using the search engine as the tool, using the improved point mutual information similarity evaluation of extended words, select the first N words form the candidate expansion thesaurus 1, to contain the keywords of the internet corpus, and co-occurrence mutual information based on local analysis, construct the candidate expansion thesaurus 2, extension of the above 2 kinds of candidate thesaurus weighted sum, in order to select some words for expansion words. Through the search engine to achieve the expansion of query verification, the results show that the conventional query and synonym query expansion algorithm, the algorithm can significantly improve the accuracy of the query.
【作者單位】: 新疆大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)博士后流動(dòng)站;新疆師范大學(xué)網(wǎng)絡(luò)信息安全與輿情分析實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61163064) 新疆師范大學(xué)網(wǎng)絡(luò)信息安全與輿情分析實(shí)驗(yàn)室公開(kāi)招標(biāo)課題基金資助項(xiàng)目(WLYQ2012110) 新疆師范大學(xué)研究生科技創(chuàng)新基金資助項(xiàng)目(20131204)
【分類號(hào)】:TP391.1
【正文快照】: 關(guān)鍵詞:查詢擴(kuò)展;局部共現(xiàn)分析;點(diǎn)互信息算法;擴(kuò)展詞;大規(guī)模語(yǔ)料庫(kù)中文引用格式:年梅,張?zhí)m芳.維吾爾文網(wǎng)絡(luò)查詢擴(kuò)展詞的構(gòu)建研究[J].計(jì)算機(jī)工程,2015,41(4):187-189,194.英文引用格式:Nian Mei,Zhang Lanfang.Research on Construction of Uyghur Network Query Expansion Wor
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 任永功;范丹;武佳林;;基于語(yǔ)義關(guān)聯(lián)樹(shù)的分類查詢擴(kuò)展算法[J];計(jì)算機(jī)科學(xué);2009年09期
2 王力;李培峰;朱巧明;;一種面向主題的關(guān)鍵詞查詢擴(kuò)展方法[J];計(jì)算機(jī)應(yīng)用與軟件;2011年12期
3 崔航,文繼榮,李敏強(qiáng);基于用戶日志的查詢擴(kuò)展統(tǒng)計(jì)模型[J];軟件學(xué)報(bào);2003年09期
4 王棟;吳軍華;;自動(dòng)更新的本體概念語(yǔ)義相似度計(jì)算[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年19期
5 劉婧婧;張向民;;文獻(xiàn)推薦系統(tǒng):提高信息檢索效率之途(英文)[J];圖書情報(bào)工作;2007年12期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 余正濤,樊孝忠,宋麗榮;基于特定問(wèn)題類別的漢語(yǔ)問(wèn)答系統(tǒng)查詢擴(kuò)展[J];北京理工大學(xué)學(xué)報(bào);2005年10期
2 尚福華;韓開(kāi)旭;;基于相關(guān)術(shù)語(yǔ)群和同義詞的查詢擴(kuò)展研究[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2010年03期
3 肖海鵬;鄧曉衡;;基于Web挖掘的關(guān)鍵詞建議模型研究[J];電腦知識(shí)與技術(shù);2012年13期
4 翟海軍;張剛;張瑾;;基于線性回歸的相關(guān)查詢推薦[J];高技術(shù)通訊;2010年06期
5 霍林;王力;黃俊文;潘英花;;一種結(jié)合同義詞典和詞對(duì)共現(xiàn)距離的查詢擴(kuò)展方法[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期
6 何攀;劉露;陳犖;王祖文;;基于用戶偏好的地理計(jì)算應(yīng)用檢索[J];兵工自動(dòng)化;2012年10期
7 付博;趙世奇;劉挺;;Web查詢?nèi)罩狙芯烤C述[J];電子學(xué)報(bào);2013年09期
8 林菊英;;基于關(guān)系數(shù)據(jù)庫(kù)表的雙親結(jié)構(gòu)樹(shù)實(shí)現(xiàn)及基本運(yùn)算研究[J];福建電腦;2013年12期
9 鄒瓊;;信息檢索中的查詢擴(kuò)展技術(shù)綜述[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2014年08期
10 武強(qiáng);邊巴旺堆;;信息檢索系統(tǒng)中藏文自動(dòng)提示的研究與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2014年19期
相關(guān)會(huì)議論文 前10條
1 張威;張博剛;廖飛雄;陳月寧;;基于軟件運(yùn)行記錄的交互測(cè)試研究[A];第六屆中國(guó)測(cè)試學(xué)術(shù)會(huì)議論文集[C];2010年
2 王洪俊;賴志國(guó);施水才;肖詩(shī)斌;;基于查詢?nèi)罩镜牟樵兘ㄗh挖掘[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
3 盛俊;王明文;余俊英;;一種基于潛在語(yǔ)義的Markov網(wǎng)絡(luò)信息檢索模型[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
4 徐小琴;章成志;;Web信息檢索中相關(guān)詞提示技術(shù)與評(píng)測(cè)[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
5 章成志;蘇蘭芳;;基于多語(yǔ)境的相關(guān)詞自動(dòng)提取[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
6 陳志瑋;肖詩(shī)斌;施水才;王昕;;一種基于HTML位置信息的查詢擴(kuò)展技術(shù)[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
7 劉悅;許洪波;程學(xué)旗;;互聯(lián)網(wǎng)挖掘和搜索的研究進(jìn)展[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
8 吳京慧;余珊珊;王明文;;基于用戶日志聚類的查詢擴(kuò)展模型[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
9 李東園;白宇;蔡?hào)|風(fēng);;基于用戶日志分析的查詢擴(kuò)展研究[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
10 張志強(qiáng);孟慶海;謝曉芹;;個(gè)性化的社會(huì)標(biāo)簽查詢擴(kuò)展技術(shù)研究[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 陳冬玲;基于潛在語(yǔ)義的個(gè)性化搜索關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年
2 李智;機(jī)器學(xué)習(xí)方法及其在基金項(xiàng)目評(píng)審中的應(yīng)用研究[D];天津大學(xué);2004年
3 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
4 蔡柯柯;基于查詢特征上下文的檢索模型研究[D];浙江大學(xué);2007年
5 康宇航;一種基于共現(xiàn)分析的科技跟蹤方法研究[D];大連理工大學(xué);2008年
6 田萱;基于上下文的信息檢索關(guān)鍵技術(shù)研究[D];中國(guó)人民大學(xué);2007年
7 吳陳;粒和粗集研究及與證據(jù)理論相結(jié)合在不完備數(shù)據(jù)處理中的應(yīng)用[D];南京理工大學(xué);2007年
8 李粵;引文網(wǎng)絡(luò)的可調(diào)優(yōu)先粘貼模型及其應(yīng)用[D];清華大學(xué);2007年
9 羅娜;基于本體的主題爬行技術(shù)研究[D];吉林大學(xué);2009年
10 林建方;詞搭配抽取及在信息檢索中的應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 呂晨;搜索競(jìng)價(jià)廣告關(guān)鍵詞優(yōu)化問(wèn)題研究[D];山東科技大學(xué);2010年
2 楊海南;基于語(yǔ)義詞典和局部分析的查詢擴(kuò)展研究[D];武漢理工大學(xué);2010年
3 趙春輝;基于關(guān)聯(lián)規(guī)則挖掘的查詢擴(kuò)展[D];河南大學(xué);2011年
4 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
5 劉亞妮;搜索競(jìng)價(jià)廣告關(guān)鍵詞優(yōu)化算法與實(shí)驗(yàn)[D];電子科技大學(xué);2011年
6 王晶;基于領(lǐng)域本體擴(kuò)展查詢的文本信息檢索研究[D];東北石油大學(xué);2011年
7 韓開(kāi)旭;基于查詢擴(kuò)展的油田網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)[D];東北石油大學(xué);2011年
8 崔琰;基于用戶興趣及術(shù)語(yǔ)關(guān)系的查詢擴(kuò)展方法[D];河北大學(xué);2011年
9 余強(qiáng);基于語(yǔ)義的設(shè)計(jì)知識(shí)個(gè)性化檢索技術(shù)研究及應(yīng)用[D];南京航空航天大學(xué);2010年
10 程鵬;基于本體的文本信息檢索研究[D];重慶大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 李衛(wèi)疆;趙鐵軍;王憲剛;;基于上下文的查詢擴(kuò)展[J];計(jì)算機(jī)研究與發(fā)展;2010年02期
2 張敏,宋睿華,馬少平;基于語(yǔ)義關(guān)系查詢擴(kuò)展的文檔重構(gòu)方法[J];計(jì)算機(jī)學(xué)報(bào);2004年10期
3 趙軍;金千里;徐波;;面向文本檢索的語(yǔ)義計(jì)算[J];計(jì)算機(jī)學(xué)報(bào);2005年12期
4 丁國(guó)棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴(kuò)展方法[J];中文信息學(xué)報(bào);2006年03期
5 ;Query Expansion Based on Semantics and Statistics in Chinese Question Answering System[J];Wuhan University Journal of Natural Sciences;2008年04期
6 張曉孿;王西鋒;;FCA中的概念語(yǔ)義相似度計(jì)算[J];現(xiàn)代圖書情報(bào)技術(shù);2007年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 林國(guó)俊;葉飛躍;耿冬;鄭國(guó)良;;基于語(yǔ)義的概念查詢擴(kuò)展[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年06期
2 鞏玉璽;王大玲;;一種改進(jìn)的基于偽相關(guān)反饋的查詢擴(kuò)展[J];微計(jì)算機(jī)信息;2009年15期
3 黃名選;張師超;嚴(yán)小衛(wèi);;基于查詢行為和關(guān)聯(lián)規(guī)則的相關(guān)反饋查詢擴(kuò)展[J];計(jì)算機(jī)工程;2009年10期
4 張超盟;李戰(zhàn)懷;溫宗臣;;局部上下文分析剪枝概念樹(shù)的查詢擴(kuò)展[J];計(jì)算機(jī)工程;2009年14期
5 羅小聰;;基于專用雙語(yǔ)詞典的查詢擴(kuò)展[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2009年10期
6 李衛(wèi)疆;趙鐵軍;王憲剛;;基于上下文的查詢擴(kuò)展[J];計(jì)算機(jī)研究與發(fā)展;2010年02期
7 黃明初;鐘威;何擁軍;蒙斌;;數(shù)字檔案檢索的查詢擴(kuò)展方法[J];廣西科學(xué)院學(xué)報(bào);2010年04期
8 王旭陽(yáng);蕭波;;基于本體和局部上下文分析的查詢擴(kuò)展方法[J];計(jì)算機(jī)工程;2012年07期
9 朱鯤鵬;魏芳;;基于用戶日志挖掘的查詢擴(kuò)展方法[J];計(jì)算機(jī)應(yīng)用與軟件;2012年06期
10 曹均闊;吳麗華;;一種基于依賴關(guān)系的綜合查詢擴(kuò)展方法[J];計(jì)算機(jī)與數(shù)字工程;2012年11期
相關(guān)會(huì)議論文 前10條
1 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴(kuò)展的數(shù)字檔案檢索策略[A];廣西計(jì)算機(jī)學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
2 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴(kuò)展[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
3 林建方;李生;鄭德權(quán);;基于詞語(yǔ)搭配關(guān)系的查詢擴(kuò)展方法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
4 丁國(guó)棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴(kuò)展方法[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
5 李東園;白宇;蔡?hào)|風(fēng);;基于用戶日志分析的查詢擴(kuò)展研究[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
6 張志強(qiáng);孟慶海;謝曉芹;;個(gè)性化的社會(huì)標(biāo)簽查詢擴(kuò)展技術(shù)研究[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年
7 王秉卿;張奇;吳立德;黃萱菁;;機(jī)器學(xué)習(xí)的查詢擴(kuò)展在博客檢索中的應(yīng)用[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
8 王秉卿;黃萱菁;;基于線性模型的查詢擴(kuò)展方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
9 晉松;林鴻飛;蘇綏;;基于標(biāo)簽共現(xiàn)的查詢擴(kuò)展研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
10 郭文;史曉東;陳毅東;;跨語(yǔ)言信息檢索中的查詢擴(kuò)展[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
相關(guān)重要報(bào)紙文章 前2條
1 鐘威 何擁軍;數(shù)字檔案信息擴(kuò)展查詢功能需求分析及實(shí)現(xiàn)方式[N];中國(guó)檔案報(bào);2011年
2 瀟然;擴(kuò)展名信息全攻略[N];中國(guó)電腦教育報(bào);2005年
相關(guān)博士學(xué)位論文 前2條
1 仲兆滿;事件本體及其在查詢擴(kuò)展中的應(yīng)用[D];上海大學(xué);2011年
2 王俊義;正負(fù)相關(guān)反饋與查詢擴(kuò)展技術(shù)的研究[D];內(nèi)蒙古大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 姚小同;查詢擴(kuò)展技術(shù)研究[D];北京郵電大學(xué);2009年
2 許威;基于概念格的查詢擴(kuò)展系統(tǒng)及建格算法研究[D];北京郵電大學(xué);2008年
3 胡保祥;基于查詢?nèi)罩镜牟樵償U(kuò)展研究[D];北京郵電大學(xué);2013年
4 董靜;基于信任網(wǎng)絡(luò)的查詢擴(kuò)展技術(shù)研究[D];哈爾濱工程大學(xué);2013年
5 瞿國(guó)忠;查詢擴(kuò)展技術(shù)研究[D];華中師范大學(xué);2007年
6 林智超;基于查詢擴(kuò)展的網(wǎng)絡(luò)信息語(yǔ)義檢索服務(wù)的研究與實(shí)現(xiàn)[D];華東師范大學(xué);2012年
7 陳U,
本文編號(hào):1414582
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1414582.html