天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于代碼模式的軟件問答文檔檢索優(yōu)化方法

發(fā)布時間:2018-08-24 19:29
【摘要】:開發(fā)人員通常通過問答網(wǎng)站的搜索引擎進行相關軟件問答文檔的搜索。在檢索結果中,包含優(yōu)質代碼片段(使用示例)的問答文檔往往更受青睞,但如何度量這些文檔中代碼片段的質量仍是個巨大的挑戰(zhàn)。針對這個問題,提出了一種基于代碼模式的軟件問答文檔檢索優(yōu)化方法。該方法能夠基于當前檢索結果,抽取文檔中的代碼片段,分析代碼片段中的公共代碼模式,并基于代碼模式度量文檔中代碼片段的質量,從原有檢索結果中向用戶推薦高質量的軟件問答文檔。以軟件開發(fā)人員在實踐過程中遇到的真實問題為基礎進行了實驗,對比Stack Overflow的搜索結果,所提方法在準確率指標NDCG@5上提升了40%。
[Abstract]:Developers usually search software Q&A documents through the search engines of Q&A websites. Q&A documents containing high-quality code fragments (using examples) are often preferred in search results, but how to measure the quality of code fragments in these documents is still a great challenge. To solve this problem, a new Q&A document based on Q&A is proposed. This method can extract code fragments from documents based on current retrieval results, analyze common code patterns in code fragments, and measure the quality of code fragments in documents based on code patterns. Based on the real problems encountered by software developers in the process of practice, the proposed method is compared with the Stack Overflow search results, and the accuracy index NDCG@5 is improved by 40%.
【作者單位】: 北京大學信息科學技術學院;高可信軟件技術教育部重點實驗室;北京大學(天津濱海)新一代信息技術研究院;
【基金】:國家重點研發(fā)計劃No.2016YFB1000804 國家杰出青年科學基金No.61525201~~
【分類號】:TP391.3

【相似文獻】

相關期刊論文 前10條

1 賈西平;彭宏;鄭啟倫;石時需;江焯林;;基于主題的文檔檢索模型[J];華南理工大學學報(自然科學版);2008年09期

2 毓鈞;多層次文檔檢索軟件的實施方法[J];鐵路計算機應用;1994年01期

3 王洪俊;施水才;俞士汶;肖詩斌;;跨語言相似文檔檢索[J];中文信息學報;2007年01期

4 孫成立;;混淆網(wǎng)絡在音頻文檔檢索系統(tǒng)中的應用研究[J];計算機工程與應用;2010年28期

5 韓海清;陳頡;;基于用戶興趣偏好的網(wǎng)絡文檔檢索[J];計算機光盤軟件與應用;2012年08期

6 賈西平;劉海珠;;面向服務的文檔智能檢索平臺[J];廣東技術師范學院學報;2010年03期

7 李勝;胡和平;;語義桌面環(huán)境下一種基于概念圖的文檔檢索方法[J];計算機工程與科學;2009年08期

8 羊帥;王鋒;林蘭芬;朱曉偉;謝非;;基于自動查詢擴展的專利文檔檢索方法[J];中國科技論文;2013年10期

9 楊毅;;一種Word文檔關鍵詞自動整理方法[J];信息與電腦(理論版);2014年01期

10 李培國;葉嫣;;多類型文檔檢索和轉換技術研究[J];微型機與應用;2014年10期

相關會議論文 前2條

1 王洪俊;施水才;俞士汶;肖詩斌;;跨語言文檔對齊[A];NCIRCS2004第一屆全國信息檢索與內容安全學術會議論文集[C];2004年

2 何莉;林鴻飛;;基于主題劃分的分布式檢索混合結果合并技術研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年

相關重要報紙文章 前1條

1 實習記者 史紫薇;布局“點”與“面”,,大數(shù)據(jù)落地醫(yī)療行業(yè)[N];中國計算機報;2013年

相關博士學位論文 前2條

1 鄭鐵然;基于音節(jié)網(wǎng)格的漢語語音文檔檢索方法研究[D];哈爾濱工業(yè)大學;2008年

2 黃亮;脫機中文手寫文檔檢索關鍵技術研究[D];武漢大學;2013年

相關碩士學位論文 前10條

1 金鑫;多媒體文檔檢索研究[D];西安電子科技大學;2012年

2 張國良;基于改進詞袋的多媒體文檔檢索研究[D];西安電子科技大學;2013年

3 付興剛;基于筆畫距離的手寫文檔檢索算法研究[D];哈爾濱工業(yè)大學;2009年

4 羊帥;基于自動查詢擴展的專利文檔檢索方法[D];浙江大學;2013年

5 廖興偉;文檔復制檢測方法研究與系統(tǒng)實現(xiàn)[D];哈爾濱工業(yè)大學;2012年

6 武文博;基于能量彈性網(wǎng)格的手寫文檔檢索方法[D];哈爾濱工業(yè)大學;2008年

7 李化;基于圖像內容的文檔檢索方法研究[D];延邊大學;2010年

8 郭永明;XML文檔檢索技術研究[D];太原理工大學;2003年

9 李興隆;基于Ontology的文檔檢索[D];東北大學;2005年

10 江騰蛟;XML文本文檔檢索技術研究[D];江西財經大學;2006年



本文編號:2201803

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2201803.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶cf42e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com