TTP:一個(gè)面向中文新聞網(wǎng)頁的主題時(shí)間解析器
發(fā)布時(shí)間:2019-09-04 16:53
【摘要】:新聞中與主題相關(guān)的時(shí)態(tài)信息體現(xiàn)了新聞在時(shí)間維度的主題特征,在面向新聞信息處理的任務(wù)中,主題時(shí)間常常被用來構(gòu)建和分析新聞話題模型,同時(shí)還可作為事件線索追蹤話題演化.針對(duì)目前新聞信息處理研究中新聞主題與主題時(shí)間相關(guān)性差的問題,通過深入分析新聞報(bào)道類別與網(wǎng)頁結(jié)構(gòu)特征,挖掘新聞主題-時(shí)間關(guān)系模型,并在此模型基礎(chǔ)上提出基于主題權(quán)重和無監(jiān)督學(xué)習(xí)的主題時(shí)間抽取算法,實(shí)現(xiàn)了一個(gè)面向中文新聞網(wǎng)頁的主題時(shí)間解析器,自動(dòng)抽取主題時(shí)間并進(jìn)行時(shí)態(tài)表達(dá)規(guī)范化處理.實(shí)驗(yàn)表明,該算法較同類方法具有更高的準(zhǔn)確率,大大提高了新聞主題與主題時(shí)間的相關(guān)度,整個(gè)系統(tǒng)也取得了比較理想的性能評(píng)價(jià).
【圖文】:
延泄ぷ韉鬧饕,
本文編號(hào):2531874
【圖文】:
延泄ぷ韉鬧饕,
本文編號(hào):2531874
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2531874.html
最近更新
教材專著