基于Crowdsourcing的不完整數(shù)據(jù)Skyline-Join查詢處理研究
發(fā)布時間:2021-04-03 01:51
Skyline查詢能夠返回用戶更感興趣的數(shù)據(jù),是數(shù)據(jù)庫研究領(lǐng)域的研究熱點之一,在航班查詢、商品推薦、住宿選擇等諸多領(lǐng)域得到了廣泛的應(yīng)用。作為skyline查詢的一種變體,skyline-join查詢能夠解決多個數(shù)據(jù)集上的skyline查詢問題。Skyline-join查詢一般基于完整數(shù)據(jù)庫進(jìn)行,然而由于自動信息提取和聚合的廣泛使用,不完整的數(shù)據(jù)集已成為一種常見現(xiàn)象。當(dāng)獲取的信息的屬性存在缺失時,現(xiàn)有的不完整數(shù)據(jù)集上skyline-join查詢算法一般基于概率或基于打分的方式進(jìn)行處理。為了更能真實反映現(xiàn)實情況和更以用戶為中心,本文提出一種基于眾包的方法來解決不完整數(shù)據(jù)的skyline-join查詢。主要思想是當(dāng)元組中某些屬性的值未知時,利用眾包來推斷元組之間的成對偏好。具體而言,提出的解決方案考慮了現(xiàn)有的啟用眾包的算法中使用的2個關(guān)鍵因素,即通過使用元組在已知屬性上的偏好關(guān)系來最小化眾包成本和通過并行處理向人群提出的問題來減少等待時間的輪數(shù)。根據(jù)skyline-join查詢在不完整數(shù)據(jù)庫中是否包括已知屬性值的屬性維度將基于眾包的skyline-join查詢分為兩類,即基于眾包的部分sky...
【文章來源】:遼寧大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
Hotel的skyline示例
第1章引言3通常,skyline-join查詢由兩個階段組成,即將包含所需屬性的關(guān)系進(jìn)行連接,以及在連接后在關(guān)系中進(jìn)行skyline查詢。圖1-2展示了計算兩個數(shù)據(jù)集上的Skyline-join查詢處理。假設(shè)數(shù)據(jù)庫包含存儲特定城市有關(guān)酒店和餐廳關(guān)系的信息。通過最小化酒店“H-Price”和“Rating”的屬性值,以及最小化餐廳“Quality”及其“H-Price”的屬性值,游客應(yīng)該有興趣在同一“Loc”中發(fā)現(xiàn)酒店和餐廳的最佳組合。Skyline-join查詢的結(jié)果數(shù)據(jù)集如圖1-2所示。使用skyline-join查詢可以根據(jù)指定的屬性檢索最“重要”的連接元組。圖1-2Skyline-join示例在圖1-2的skyline-join查詢中,兩個數(shù)據(jù)集首先通過唯一的連接屬性“Loc”連接,然后在連接后在數(shù)據(jù)集中執(zhí)行skyline查詢。連接后的數(shù)據(jù)元組{h4,R1}被{h1,R1}支配,除數(shù)據(jù)元組h4∞R1外,其他連接后數(shù)據(jù)元組之間不能相互支配,因此它們都是skyline-join查詢的結(jié)果。由此可以看出,“skyline-join”可以從多個數(shù)據(jù)集中返回skyline查詢結(jié)果,這些結(jié)果涉及多個屬性維度,并且用戶難以從中找到符合自己要求的結(jié)果。然而,在上述例子中,為了能夠提供給用戶更有參考價值的結(jié)果,往往僅僅根據(jù)質(zhì)量、平均消費等確定的屬性不夠的,如果能夠知道曾經(jīng)去過某個餐廳的用戶對餐廳的整體評價,即性價比,那么它可以更準(zhǔn)確地反映實際情況,并且更加以用戶為中心。如前所述,一家餐廳的性價比通常是未知的。此外,由于自動信息提取和聚合的廣泛使用,不完整的數(shù)據(jù)集是一種常見現(xiàn)象。現(xiàn)有的skyline-join查詢首先連接所有的完整數(shù)據(jù)集,然后基于完整數(shù)據(jù)集應(yīng)用現(xiàn)有skyline算法。但是這
第2章相關(guān)工作12圖2-1眾包流程的示意圖2.5本章小結(jié)第2章相關(guān)工作對本文所涉及到的研究內(nèi)容的研究現(xiàn)狀進(jìn)行介紹,首先介紹了skyline-join查詢方法的相關(guān)研究內(nèi)容,skyline-join查詢涉及到多表查詢并且應(yīng)用范圍十分廣泛,相關(guān)技術(shù)涉及多個方向。其次又不完整數(shù)據(jù)集上skyline查詢做出介紹,基于不完整數(shù)據(jù)集上的skyline查詢方法眾多,本文針對主要的查詢方法類型進(jìn)行分類對比研究。接下來,介紹了眾包在查詢中的應(yīng)用的相關(guān)研究。最后,通過基本的流程圖的方式對眾包的過程做出簡單的介紹。
本文編號:3116378
【文章來源】:遼寧大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
Hotel的skyline示例
第1章引言3通常,skyline-join查詢由兩個階段組成,即將包含所需屬性的關(guān)系進(jìn)行連接,以及在連接后在關(guān)系中進(jìn)行skyline查詢。圖1-2展示了計算兩個數(shù)據(jù)集上的Skyline-join查詢處理。假設(shè)數(shù)據(jù)庫包含存儲特定城市有關(guān)酒店和餐廳關(guān)系的信息。通過最小化酒店“H-Price”和“Rating”的屬性值,以及最小化餐廳“Quality”及其“H-Price”的屬性值,游客應(yīng)該有興趣在同一“Loc”中發(fā)現(xiàn)酒店和餐廳的最佳組合。Skyline-join查詢的結(jié)果數(shù)據(jù)集如圖1-2所示。使用skyline-join查詢可以根據(jù)指定的屬性檢索最“重要”的連接元組。圖1-2Skyline-join示例在圖1-2的skyline-join查詢中,兩個數(shù)據(jù)集首先通過唯一的連接屬性“Loc”連接,然后在連接后在數(shù)據(jù)集中執(zhí)行skyline查詢。連接后的數(shù)據(jù)元組{h4,R1}被{h1,R1}支配,除數(shù)據(jù)元組h4∞R1外,其他連接后數(shù)據(jù)元組之間不能相互支配,因此它們都是skyline-join查詢的結(jié)果。由此可以看出,“skyline-join”可以從多個數(shù)據(jù)集中返回skyline查詢結(jié)果,這些結(jié)果涉及多個屬性維度,并且用戶難以從中找到符合自己要求的結(jié)果。然而,在上述例子中,為了能夠提供給用戶更有參考價值的結(jié)果,往往僅僅根據(jù)質(zhì)量、平均消費等確定的屬性不夠的,如果能夠知道曾經(jīng)去過某個餐廳的用戶對餐廳的整體評價,即性價比,那么它可以更準(zhǔn)確地反映實際情況,并且更加以用戶為中心。如前所述,一家餐廳的性價比通常是未知的。此外,由于自動信息提取和聚合的廣泛使用,不完整的數(shù)據(jù)集是一種常見現(xiàn)象。現(xiàn)有的skyline-join查詢首先連接所有的完整數(shù)據(jù)集,然后基于完整數(shù)據(jù)集應(yīng)用現(xiàn)有skyline算法。但是這
第2章相關(guān)工作12圖2-1眾包流程的示意圖2.5本章小結(jié)第2章相關(guān)工作對本文所涉及到的研究內(nèi)容的研究現(xiàn)狀進(jìn)行介紹,首先介紹了skyline-join查詢方法的相關(guān)研究內(nèi)容,skyline-join查詢涉及到多表查詢并且應(yīng)用范圍十分廣泛,相關(guān)技術(shù)涉及多個方向。其次又不完整數(shù)據(jù)集上skyline查詢做出介紹,基于不完整數(shù)據(jù)集上的skyline查詢方法眾多,本文針對主要的查詢方法類型進(jìn)行分類對比研究。接下來,介紹了眾包在查詢中的應(yīng)用的相關(guān)研究。最后,通過基本的流程圖的方式對眾包的過程做出簡單的介紹。
本文編號:3116378
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3116378.html
最近更新
教材專著