基于同義實(shí)體識(shí)別的Web信息集成
發(fā)布時(shí)間:2024-01-29 11:08
準(zhǔn)確有效地集成海量Web信息,是Web信息動(dòng)態(tài)聚合、市場情報(bào)分析、輿情分析、商業(yè)智能等分析型應(yīng)用的重要基礎(chǔ).針對數(shù)據(jù)集成過程中不同實(shí)體指代同一實(shí)體的問題,利用搜索引擎返回的頁面摘要信息,設(shè)計(jì)并實(shí)現(xiàn)了一種基于搜索引擎的同義實(shí)體識(shí)別算法FSE,并提出了一種基于同義實(shí)體識(shí)別的Web信息集成框架.在醫(yī)院信息集成測試數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,FSE算法效果優(yōu)于基于Varient Dice、Varient Cosine、Varient Jaccard、Varient Overlap相似度計(jì)算的同義實(shí)體識(shí)別算法.
【文章頁數(shù)】:8 頁
【文章目錄】:
1 引言
2 基于搜索引擎的同義實(shí)體識(shí)別
2.1 基于搜索引擎的相似度計(jì)算
2.2 基于搜索引擎的同義實(shí)體發(fā)現(xiàn)
3 基于同義實(shí)體識(shí)別的Web信息集成系統(tǒng)
3.1 設(shè)計(jì)架構(gòu)
3.2 資源層:
3.3 融合層
3.4 服務(wù)層
4 實(shí)驗(yàn)與評估
4.1 實(shí)驗(yàn)數(shù)據(jù)集
4.2 評價(jià)標(biāo)準(zhǔn)
4.3 實(shí)驗(yàn)結(jié)果
4.4 討論
5 總結(jié)與展望
本文編號:3888070
【文章頁數(shù)】:8 頁
【文章目錄】:
1 引言
2 基于搜索引擎的同義實(shí)體識(shí)別
2.1 基于搜索引擎的相似度計(jì)算
2.2 基于搜索引擎的同義實(shí)體發(fā)現(xiàn)
3 基于同義實(shí)體識(shí)別的Web信息集成系統(tǒng)
3.1 設(shè)計(jì)架構(gòu)
3.2 資源層:
3.3 融合層
3.4 服務(wù)層
4 實(shí)驗(yàn)與評估
4.1 實(shí)驗(yàn)數(shù)據(jù)集
4.2 評價(jià)標(biāo)準(zhǔn)
4.3 實(shí)驗(yàn)結(jié)果
4.4 討論
5 總結(jié)與展望
本文編號:3888070
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3888070.html
最近更新
教材專著