基于代碼模式的軟件問答文檔檢索優(yōu)化方法
[Abstract]:Developers usually search software Q&A documents through the search engines of Q&A websites. Q&A documents containing high-quality code fragments (using examples) are often preferred in search results, but how to measure the quality of code fragments in these documents is still a great challenge. To solve this problem, a new Q&A document based on Q&A is proposed. This method can extract code fragments from documents based on current retrieval results, analyze common code patterns in code fragments, and measure the quality of code fragments in documents based on code patterns. Based on the real problems encountered by software developers in the process of practice, the proposed method is compared with the Stack Overflow search results, and the accuracy index NDCG@5 is improved by 40%.
【作者單位】: 北京大學信息科學技術學院;高可信軟件技術教育部重點實驗室;北京大學(天津濱海)新一代信息技術研究院;
【基金】:國家重點研發(fā)計劃No.2016YFB1000804 國家杰出青年科學基金No.61525201~~
【分類號】:TP391.3
【相似文獻】
相關期刊論文 前10條
1 賈西平;彭宏;鄭啟倫;石時需;江焯林;;基于主題的文檔檢索模型[J];華南理工大學學報(自然科學版);2008年09期
2 毓鈞;多層次文檔檢索軟件的實施方法[J];鐵路計算機應用;1994年01期
3 王洪俊;施水才;俞士汶;肖詩斌;;跨語言相似文檔檢索[J];中文信息學報;2007年01期
4 孫成立;;混淆網(wǎng)絡在音頻文檔檢索系統(tǒng)中的應用研究[J];計算機工程與應用;2010年28期
5 韓海清;陳頡;;基于用戶興趣偏好的網(wǎng)絡文檔檢索[J];計算機光盤軟件與應用;2012年08期
6 賈西平;劉海珠;;面向服務的文檔智能檢索平臺[J];廣東技術師范學院學報;2010年03期
7 李勝;胡和平;;語義桌面環(huán)境下一種基于概念圖的文檔檢索方法[J];計算機工程與科學;2009年08期
8 羊帥;王鋒;林蘭芬;朱曉偉;謝非;;基于自動查詢擴展的專利文檔檢索方法[J];中國科技論文;2013年10期
9 楊毅;;一種Word文檔關鍵詞自動整理方法[J];信息與電腦(理論版);2014年01期
10 李培國;葉嫣;;多類型文檔檢索和轉換技術研究[J];微型機與應用;2014年10期
相關會議論文 前2條
1 王洪俊;施水才;俞士汶;肖詩斌;;跨語言文檔對齊[A];NCIRCS2004第一屆全國信息檢索與內容安全學術會議論文集[C];2004年
2 何莉;林鴻飛;;基于主題劃分的分布式檢索混合結果合并技術研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
相關重要報紙文章 前1條
1 實習記者 史紫薇;布局“點”與“面”,,大數(shù)據(jù)落地醫(yī)療行業(yè)[N];中國計算機報;2013年
相關博士學位論文 前2條
1 鄭鐵然;基于音節(jié)網(wǎng)格的漢語語音文檔檢索方法研究[D];哈爾濱工業(yè)大學;2008年
2 黃亮;脫機中文手寫文檔檢索關鍵技術研究[D];武漢大學;2013年
相關碩士學位論文 前10條
1 金鑫;多媒體文檔檢索研究[D];西安電子科技大學;2012年
2 張國良;基于改進詞袋的多媒體文檔檢索研究[D];西安電子科技大學;2013年
3 付興剛;基于筆畫距離的手寫文檔檢索算法研究[D];哈爾濱工業(yè)大學;2009年
4 羊帥;基于自動查詢擴展的專利文檔檢索方法[D];浙江大學;2013年
5 廖興偉;文檔復制檢測方法研究與系統(tǒng)實現(xiàn)[D];哈爾濱工業(yè)大學;2012年
6 武文博;基于能量彈性網(wǎng)格的手寫文檔檢索方法[D];哈爾濱工業(yè)大學;2008年
7 李化;基于圖像內容的文檔檢索方法研究[D];延邊大學;2010年
8 郭永明;XML文檔檢索技術研究[D];太原理工大學;2003年
9 李興隆;基于Ontology的文檔檢索[D];東北大學;2005年
10 江騰蛟;XML文本文檔檢索技術研究[D];江西財經大學;2006年
本文編號:2201803
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2201803.html