基于社區(qū)問(wèn)答系統(tǒng)的探索式搜索查詢擴(kuò)展方法研究
發(fā)布時(shí)間:2017-11-28 09:21
本文關(guān)鍵詞:基于社區(qū)問(wèn)答系統(tǒng)的探索式搜索查詢擴(kuò)展方法研究
更多相關(guān)文章: 探索式搜索 查詢擴(kuò)展 社區(qū)問(wèn)答系統(tǒng) 子主題挖掘
【摘要】:雖然Web搜索引擎已經(jīng)可以很好地幫助用戶找到所需要的結(jié)果,但是仍然存在一些用戶的信息需求不能得到滿足。這類信息需求通常很難通過(guò)一次簡(jiǎn)單的Web搜索實(shí)現(xiàn),而需要用戶進(jìn)行更加復(fù)雜的查詢過(guò)程,這正是探索式搜索研究所關(guān)注的問(wèn)題。此外,大量的研究表明,很多信息需求得不到滿足的用戶可以通過(guò)在社區(qū)問(wèn)答系統(tǒng)(CQA)上提問(wèn)問(wèn)題,并最終等待問(wèn)題的答案來(lái)達(dá)到自己的信息需求。CQA的這一特性使其成為了幫助用戶更好的完成探索式搜索過(guò)程的有效的信息來(lái)源;谏鲜鲇^察,本文研究基于社區(qū)問(wèn)答系統(tǒng)的探索式搜索查詢擴(kuò)展方法,研究如何從CQA中選取與用戶探索式查詢相關(guān)的問(wèn)題和答案,并從這些問(wèn)答信息中提取關(guān)鍵的概念,進(jìn)而利用這些關(guān)鍵概念作為查詢擴(kuò)展,發(fā)現(xiàn)對(duì)用戶搜索可能有價(jià)值的信息,以此更好的幫助用戶完成探索式搜索過(guò)程。具體的,首先,本文利用CQA中問(wèn)答之間的語(yǔ)義關(guān)系選取與用戶探索式查詢相關(guān)的問(wèn)答信息。本文注意到CQA上用戶提問(wèn)或者回答問(wèn)題時(shí)存在問(wèn)題與答案的意圖相同,不同長(zhǎng)度的問(wèn)題之間存在子主題覆蓋這兩種現(xiàn)象。基于這一觀察,本文對(duì)問(wèn)答信息進(jìn)行子主題挖掘,并進(jìn)而對(duì)問(wèn)答信息中的詞匯進(jìn)行聚類,生成子主題標(biāo)簽集合以及詞匯集合,從而實(shí)現(xiàn)問(wèn)答信息子主題的發(fā)現(xiàn)和挖掘。隨后,建立在問(wèn)答信息子主題中包含的隱含關(guān)系基礎(chǔ)上,計(jì)算子主題中詞匯與用戶查詢的相似度,從而生成候選擴(kuò)展概念。最后,基于問(wèn)答信息子主題中標(biāo)簽集合以及詞匯集合之間的關(guān)系以及候選擴(kuò)展概念之間的相似性,構(gòu)建概念層次模型,實(shí)現(xiàn)候選擴(kuò)展概念的排序與選取,并基于概念層次模型對(duì)用戶查詢擴(kuò)展多組概念序列,幫助用戶完成探索式搜索過(guò)程。本文對(duì)上述所用方法進(jìn)行了實(shí)驗(yàn)性驗(yàn)證,主要對(duì)候選擴(kuò)展概念生成、擴(kuò)展概念排序與選取的效果進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,基于挖掘的問(wèn)答信息子主題,本文提出的候選擴(kuò)展概念生成方法以及擴(kuò)展概念排序與選取方法可以有效的幫助用戶發(fā)現(xiàn)對(duì)其探索式搜索有價(jià)值的信息。
【學(xué)位授予單位】:東北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 張中峰;李秋丹;;社區(qū)問(wèn)答系統(tǒng)研究綜述[J];計(jì)算機(jī)科學(xué);2010年11期
2 李亞楠;王斌;李錦濤;;搜索引擎查詢推薦技術(shù)綜述[J];中文信息學(xué)報(bào);2010年06期
,本文編號(hào):1233482
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1233482.html
最近更新
教材專著