一種改進(jìn)的Lucene算法及在空間數(shù)據(jù)融合中的應(yīng)用
發(fā)布時(shí)間:2017-11-08 15:32
本文關(guān)鍵詞:一種改進(jìn)的Lucene算法及在空間數(shù)據(jù)融合中的應(yīng)用
更多相關(guān)文章: 同名點(diǎn)匹配 字符串匹配 Lucene索引 語義相似度
【摘要】:在"互聯(lián)網(wǎng)+"時(shí)代,眾源地理空間數(shù)據(jù)已成為重要的數(shù)據(jù)來源,但由于眾源數(shù)據(jù)存在冗余和精度不高等問題,如何有效利用眾源數(shù)據(jù)已成為地理信息技術(shù)研究的熱點(diǎn)。眾源POI數(shù)據(jù)一般通過與標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行同名點(diǎn)匹配解決上述等問題。而同名點(diǎn)匹配常用的方法有編輯距離算法、最長公共子串算法、貪心字符串匹配算法,這些方法存在匹配效率低、缺少語義判斷等問題。為此本文基于Lucene提出了一種基于語義相似度的快速匹配算法,試驗(yàn)結(jié)果表明,與傳統(tǒng)的字符匹配方法相比,本文提出的方法在運(yùn)算效率上有顯著的提升,同時(shí)還能通過判斷語義相似度提高匹配率。
【作者單位】: 中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院;廣州市城市規(guī)劃勘測設(shè)計(jì)研究院;
【基金】:國家自然科學(xué)基金重點(diǎn)項(xiàng)目(41431178)
【分類號】:P208
【正文快照】: 隨著“互聯(lián)網(wǎng)+”時(shí)代的來臨,眾源地理空間數(shù)據(jù)已成為當(dāng)前空間信息應(yīng)用的重要數(shù)據(jù)來源。與傳統(tǒng)地理信息采集和更新方式相比,來自非專業(yè)大眾的眾源空間數(shù)據(jù)具有數(shù)據(jù)量大、現(xiàn)勢性好、信息豐富、成本低等特點(diǎn)和優(yōu)勢[1],成為近年來國際地理信息科學(xué)領(lǐng)域的研究熱點(diǎn)。在移動(dòng)及Web環(huán)境,
本文編號:1157742
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/1157742.html
最近更新
教材專著