天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于統(tǒng)計特征的Quality Phrase挖掘方法

發(fā)布時間:2024-11-07 20:39
   Quality Phrase挖掘是從文本語料庫中提取有意義短語的過程,是文檔摘要、信息檢索等任務的基礎。然而現(xiàn)有的無監(jiān)督短語挖掘方法存在候選短語質量不高、Quality Phrase的特征權重平均分配的問題。本文提出基于統(tǒng)計特征的Quality Phrase挖掘方法,將頻繁N-Gram挖掘、多詞短語組合性約束及單詞短語拼寫檢查相結合,保證了候選短語的質量;引入公共知識庫對候選短語添加類別標簽,實現(xiàn)了Quality Phrase特征權重的分配,并考慮特征之間相互影響設置懲罰因子調整權重比例;按照候選短語的特征加權函數(shù)得分排序,提取Quality Phrase。實驗結果表明,基于統(tǒng)計特征的Quality Phrase挖掘方法明顯提高了短語挖掘的精度,與最優(yōu)的無監(jiān)督短語挖掘方法相比,精確率、召回率及F1-Score分別提升了5.97%,1.77%和4.02%。

【文章頁數(shù)】:16 頁

【文章目錄】:
引言
1相關定義
2 Quality Phrase評價準則
3基于統(tǒng)計特征的候選短語挖掘方法
    3.1頻繁N?Gram短語挖掘
    3.2多詞短語組合性約束
    3.3單詞短語拼寫檢查
4基于統(tǒng)計特征的Quality Phrase選擇方法
    4.1特征對Quality Phrase的貢獻程度
    4.2特征之間相互影響
5實驗驗證
    5.1數(shù)據集
    5.2對比算法
    5.3評價指標
    5.4實驗結果
        5.4.1組合性統(tǒng)計意義度量選擇
        5.4.2候選短語挖掘階段實驗結果對比
        5.4.3本文算法與其他算法的對比
6結束語



本文編號:4011740

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4011740.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶07d80***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产高清一区二区白浆| 免费人妻精品一区二区三区久久久| 欧美国产日本免费不卡| 日本人妻中出在线观看| 国产精品蜜桃久久一区二区| 精品欧美日韩一二三区| 日韩一区二区三区四区乱码视频| 日本高清一区免费不卡| 国产日产欧美精品大秀| 亚洲男人的天堂久久a| 国产精品亚洲一级av第二区| 日韩精品一区二区三区射精| 日本一区二区三区久久娇喘| 日本淫片一区二区三区| 国产又粗又长又爽又猛的视频| 欧美人妻免费一区二区三区| 国产不卡在线免费观看视频| 国产精品超碰在线观看| 丁香六月婷婷基地伊人| 国产日韩欧美在线播放| 亚洲一区二区福利在线| 69老司机精品视频在线观看| 欧美黑人精品一区二区在线| 美国女大兵激情豪放视频播放| 亚洲欧美日韩在线看片| 久久女同精品一区二区| 国产级别精品一区二区视频| 乱女午夜精品一区二区三区| 粉嫩一区二区三区粉嫩视频| 日韩av欧美中文字幕| 操白丝女孩在线观看免费高清| 国产三级欧美三级日韩三级| 亚洲另类女同一二三区| 亚洲女同一区二区另类| 最好看的人妻中文字幕| 三级理论午夜福利在线看| 欧美精品在线播放一区二区| 亚洲精品伦理熟女国产一区二区| 国产国产精品精品在线| 丁香六月啪啪激情综合区| 国产麻豆视频一二三区|