專業(yè)人才跨域搜索研究與應(yīng)用
發(fā)布時(shí)間:2017-11-18 22:27
本文關(guān)鍵詞:專業(yè)人才跨域搜索研究與應(yīng)用
更多相關(guān)文章: 人才搜索 跨域關(guān)聯(lián) 模糊搜索 KM算法
【摘要】:隨著互聯(lián)網(wǎng)的快速發(fā)展和普及,網(wǎng)絡(luò)招聘越來(lái)越成為主流,對(duì)關(guān)于各專業(yè)技能人才搜索的垂直搜索引擎的研究十分有必要。但是隨著各大招聘網(wǎng)站和技術(shù)論壇用戶的快速增長(zhǎng),不用來(lái)源的簡(jiǎn)歷數(shù)據(jù)或論壇用戶的重復(fù)率越來(lái)越高,對(duì)這些不同領(lǐng)域用戶的相互關(guān)聯(lián)很有意義,因?yàn)樗粌H可以簡(jiǎn)化招聘工作,還能對(duì)用戶的個(gè)人信息進(jìn)行完善。對(duì)于簡(jiǎn)歷之間的相互關(guān)聯(lián),本文首先對(duì)簡(jiǎn)歷集進(jìn)行了分類,然后對(duì)簡(jiǎn)歷之間各字段的相似度進(jìn)行比較;而對(duì)于不同論壇用戶之間的關(guān)聯(lián),可轉(zhuǎn)化為多重網(wǎng)絡(luò)之間的節(jié)點(diǎn)匹配問題,目前,該問題主要是根據(jù)網(wǎng)絡(luò)的結(jié)構(gòu)信息,利用不同網(wǎng)絡(luò)節(jié)點(diǎn)連接的相同的已知匹配節(jié)點(diǎn)對(duì)的個(gè)數(shù)來(lái)求得不同網(wǎng)絡(luò)節(jié)點(diǎn)對(duì)之間的初始相似度,然后就可以將該問題轉(zhuǎn)化為圖論中的帶權(quán)二分圖匹配的問題,最后利用KM算法即可對(duì)其最優(yōu)匹配進(jìn)行求解。本文根據(jù)現(xiàn)有數(shù)據(jù)的特點(diǎn),在該匹配算法的基礎(chǔ)上,對(duì)其節(jié)點(diǎn)對(duì)之間的初始相似度計(jì)算方法進(jìn)行改進(jìn)。主要是因?yàn)楝F(xiàn)有的數(shù)據(jù)不止有雙層網(wǎng)絡(luò)之間的結(jié)構(gòu)關(guān)系,而且各網(wǎng)絡(luò)節(jié)點(diǎn)(即用戶)還有很多屬性信息,例如發(fā)帖記錄和標(biāo)簽等,利用這些屬性信息可以對(duì)用戶對(duì)之間的相似度計(jì)算進(jìn)行優(yōu)化。同時(shí)本文還通過緩存措施對(duì)搜索引擎過程中的索引建立速度進(jìn)行了優(yōu)化、通過技能同義詞庫(kù)對(duì)搜索進(jìn)行了模糊搜索的優(yōu)化并結(jié)合實(shí)際情況對(duì)搜索出的結(jié)果進(jìn)行了排序,使得結(jié)果更符合人們的直觀需要。最后通過對(duì)搜索結(jié)果進(jìn)行分析,說(shuō)明了改進(jìn)后的搜索方式更能豐富用戶搜索結(jié)果;改進(jìn)后排序方式能使得更符合用戶預(yù)期的人物排在前面;通過對(duì)選取的知乎和微博網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)進(jìn)行匹配并和原算法比較結(jié)果,體現(xiàn)了節(jié)點(diǎn)對(duì)間初始相似度計(jì)算的改進(jìn)對(duì)匹配結(jié)果的優(yōu)化。
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 鄭冬冬,趙朋朋,崔志明;Deep Web爬蟲研究與設(shè)計(jì)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
,本文編號(hào):1201413
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1201413.html
最近更新
教材專著