基于文本挖掘的軟件眾包平臺(tái)的項(xiàng)目個(gè)性化搜索
發(fā)布時(shí)間:2023-03-19 08:42
近些年來,軟件眾包因?yàn)槠鋵㈨?xiàng)目發(fā)布到互聯(lián)網(wǎng)上,開放式利用大眾的群體智慧進(jìn)行軟件開發(fā)的特點(diǎn),在工業(yè)界和學(xué)術(shù)界受到了廣泛關(guān)注。如何幫助用戶挑選合適自己的項(xiàng)目,是眾包的關(guān)鍵問題之一。但目前眾包平臺(tái)的項(xiàng)目搜索服務(wù)存在以下幾個(gè)問題:(1)現(xiàn)有的大部分搜索方法是基于詞匯匹配的方法,沒有對(duì)搜索請(qǐng)求和項(xiàng)目文本內(nèi)容進(jìn)行深入挖掘;(2)用戶搜索輸入的詞匯無法表達(dá)用戶的完整意圖,導(dǎo)致搜索的結(jié)果和用戶的期望有一定的差異性;(3)搜索的相關(guān)特征忽略了用戶的個(gè)性化需求,即所有用戶得到的搜索結(jié)果是相同的。這些問題導(dǎo)致用戶無法快速找到最合適的項(xiàng)目。在此背景下,本文面向軟件眾包平臺(tái),研究提出一種基于文本挖掘的項(xiàng)目個(gè)性化搜索方法,利用文本挖掘技術(shù)建立軟件眾包平臺(tái)的項(xiàng)目模型和用戶模型,并對(duì)搜索請(qǐng)求進(jìn)行語義拓展,最后使用一種學(xué)習(xí)排序算法對(duì)于篩選后的項(xiàng)目候選集進(jìn)行排序。本文主要的創(chuàng)新點(diǎn)包括:(1)提出了基于文本挖掘的項(xiàng)目建模方法,利用項(xiàng)目的標(biāo)題和需求從詞匯層面、主題層面和神經(jīng)網(wǎng)絡(luò)語義層面進(jìn)行分析與挖掘,將軟件眾包平臺(tái)的標(biāo)簽數(shù)據(jù)作為監(jiān)督信息用于項(xiàng)目主題建模的采樣訓(xùn)練中,并基于時(shí)間衰減函數(shù)計(jì)算項(xiàng)目熱度。(2)提出了基于時(shí)間窗口的用...
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景
1.2 研究目標(biāo)和挑戰(zhàn)
1.2.1 研究目標(biāo)
1.2.2 研究挑戰(zhàn)
1.3 論文結(jié)構(gòu)
2 相關(guān)技術(shù)
2.1 文本挖掘技術(shù)
2.1.1 詞袋模型
2.1.2 主題概率模型
2.1.3 神經(jīng)概率語言模型
2.2 搜索技術(shù)
2.2.1 學(xué)習(xí)排序模型
2.2.2 個(gè)性化搜索
2.2.3 搜索的語義拓展
2.3 本章小結(jié)
3 基于文本挖掘的軟件眾包資源建模
3.1 項(xiàng)目建模
3.1.1 項(xiàng)目建模的三個(gè)維度
3.1.2 項(xiàng)目結(jié)構(gòu)數(shù)據(jù)建模
3.1.3 項(xiàng)目非結(jié)構(gòu)數(shù)據(jù)建模
3.1.4 項(xiàng)目熱度計(jì)算
3.2 用戶建模
3.2.1 用戶建模的兩個(gè)維度
3.2.2 用戶能力建模
3.2.3 用戶興趣建模
3.3 本章小結(jié)
4 基于文本挖掘的項(xiàng)目智能搜索
4.1 方案設(shè)計(jì)
4.2 搜索請(qǐng)求語義拓展
4.2.1 研究思路
4.2.2 基于語義主題PRF的通用詞匯語義拓展
4.2.3 基于StackOverflow的領(lǐng)域詞匯語義拓展
4.2.4 搜索建模
4.3 項(xiàng)目預(yù)過濾
4.3.1 基于索引的預(yù)過濾
4.3.2 基于規(guī)則模板的預(yù)過濾
4.4 特征構(gòu)建
4.4.1 連續(xù)特征構(gòu)建
4.4.2 離散特征構(gòu)建
4.5 基于LambdaMART的搜索排序
4.6 本章小結(jié)
5 實(shí)驗(yàn)與結(jié)果分析
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.2 評(píng)估方法
5.3 不同主題建模方法的對(duì)比實(shí)驗(yàn)
5.4 用戶興趣模型對(duì)于搜索的影響分析實(shí)驗(yàn)
5.5 搜索的語義拓展對(duì)于搜索的影響分析實(shí)驗(yàn)
5.6 不同學(xué)習(xí)排序算法的結(jié)果對(duì)比實(shí)驗(yàn)
5.7 特征貢獻(xiàn)度分析實(shí)驗(yàn)
5.8 本章小結(jié)
6 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 下階段工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
攻讀學(xué)位期間申請(qǐng)的專利
本文編號(hào):3764942
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景
1.2 研究目標(biāo)和挑戰(zhàn)
1.2.1 研究目標(biāo)
1.2.2 研究挑戰(zhàn)
1.3 論文結(jié)構(gòu)
2 相關(guān)技術(shù)
2.1 文本挖掘技術(shù)
2.1.1 詞袋模型
2.1.2 主題概率模型
2.1.3 神經(jīng)概率語言模型
2.2 搜索技術(shù)
2.2.1 學(xué)習(xí)排序模型
2.2.2 個(gè)性化搜索
2.2.3 搜索的語義拓展
2.3 本章小結(jié)
3 基于文本挖掘的軟件眾包資源建模
3.1 項(xiàng)目建模
3.1.1 項(xiàng)目建模的三個(gè)維度
3.1.2 項(xiàng)目結(jié)構(gòu)數(shù)據(jù)建模
3.1.3 項(xiàng)目非結(jié)構(gòu)數(shù)據(jù)建模
3.1.4 項(xiàng)目熱度計(jì)算
3.2 用戶建模
3.2.1 用戶建模的兩個(gè)維度
3.2.2 用戶能力建模
3.2.3 用戶興趣建模
3.3 本章小結(jié)
4 基于文本挖掘的項(xiàng)目智能搜索
4.1 方案設(shè)計(jì)
4.2 搜索請(qǐng)求語義拓展
4.2.1 研究思路
4.2.2 基于語義主題PRF的通用詞匯語義拓展
4.2.3 基于StackOverflow的領(lǐng)域詞匯語義拓展
4.2.4 搜索建模
4.3 項(xiàng)目預(yù)過濾
4.3.1 基于索引的預(yù)過濾
4.3.2 基于規(guī)則模板的預(yù)過濾
4.4 特征構(gòu)建
4.4.1 連續(xù)特征構(gòu)建
4.4.2 離散特征構(gòu)建
4.5 基于LambdaMART的搜索排序
4.6 本章小結(jié)
5 實(shí)驗(yàn)與結(jié)果分析
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.2 評(píng)估方法
5.3 不同主題建模方法的對(duì)比實(shí)驗(yàn)
5.4 用戶興趣模型對(duì)于搜索的影響分析實(shí)驗(yàn)
5.5 搜索的語義拓展對(duì)于搜索的影響分析實(shí)驗(yàn)
5.6 不同學(xué)習(xí)排序算法的結(jié)果對(duì)比實(shí)驗(yàn)
5.7 特征貢獻(xiàn)度分析實(shí)驗(yàn)
5.8 本章小結(jié)
6 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 下階段工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
攻讀學(xué)位期間申請(qǐng)的專利
本文編號(hào):3764942
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3764942.html
最近更新
教材專著