搜索日志中命名實(shí)體識(shí)別
發(fā)布時(shí)間:2023-04-12 01:23
【目的】搜索日志中命名實(shí)體識(shí)別對(duì)于優(yōu)化搜索意圖,提高搜索引擎服務(wù)質(zhì)量存在重要意義!痉椒ā坷梅N子命名實(shí)體和模板匹配原則抽取候選命名實(shí)體并聚類(lèi),聚類(lèi)后進(jìn)行候選命名實(shí)體識(shí)別特征抽取,包括頻次、不同模板數(shù)、模板權(quán)重特征。融合這些特征構(gòu)造命名實(shí)體識(shí)別權(quán)重計(jì)算公式,并合理調(diào)整特征影響參數(shù)。【結(jié)果】對(duì)根據(jù)權(quán)重提取的命名實(shí)體進(jìn)行標(biāo)注和統(tǒng)計(jì),發(fā)現(xiàn)P@500值平均達(dá)到75%左右,比Pa@ca方法高出7%。【局限】對(duì)模板敏感性弱的命名實(shí)體不能精確抽取。【結(jié)論】通過(guò)計(jì)算該方法抽取結(jié)果指標(biāo)P@N值,并和其他方法抽取結(jié)果指標(biāo)進(jìn)行比較,證明該方法的有效性。
【文章頁(yè)數(shù)】:8 頁(yè)
【文章目錄】:
1引言
2相關(guān)工作
3命名實(shí)體抽取框架
3.1類(lèi)別框架
3.2抽取過(guò)程
(1) 種子命名實(shí)體搜集
(2) 命名實(shí)體模板抽取和模板過(guò)濾
(3) 特征和命名實(shí)體抽取
4候選命名實(shí)體識(shí)別和特征抽取
4.1特征提取
(1) 命名實(shí)體識(shí)別模板權(quán)重計(jì)算
(2) 候選命名實(shí)體聚類(lèi)及特征提取
4.2權(quán)重計(jì)算
(1) 命名實(shí)體權(quán)重計(jì)算與抽取
5實(shí)驗(yàn)結(jié)果評(píng)價(jià)與分析
5.1P@N結(jié)果統(tǒng)計(jì)和對(duì)比
5結(jié)語(yǔ)
本文編號(hào):3790140
【文章頁(yè)數(shù)】:8 頁(yè)
【文章目錄】:
1引言
2相關(guān)工作
3命名實(shí)體抽取框架
3.1類(lèi)別框架
3.2抽取過(guò)程
(1) 種子命名實(shí)體搜集
(2) 命名實(shí)體模板抽取和模板過(guò)濾
(3) 特征和命名實(shí)體抽取
4候選命名實(shí)體識(shí)別和特征抽取
4.1特征提取
(1) 命名實(shí)體識(shí)別模板權(quán)重計(jì)算
(2) 候選命名實(shí)體聚類(lèi)及特征提取
4.2權(quán)重計(jì)算
(1) 命名實(shí)體權(quán)重計(jì)算與抽取
5實(shí)驗(yàn)結(jié)果評(píng)價(jià)與分析
5.1P@N結(jié)果統(tǒng)計(jì)和對(duì)比
5結(jié)語(yǔ)
本文編號(hào):3790140
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3790140.html
最近更新
教材專(zhuān)著