天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

跨語言商品知識圖譜的構建與對齊研究

發(fā)布時間:2021-05-20 09:57
  隨著電子商務在全球市場不斷進行開拓,其中商品知識圖譜承擔了重要的角色,被廣泛應用于平臺治理、品牌運營、前端導購等核心業(yè)務。由于電商領域存在商品類型繁多、屬性體系龐大等特性,商品知識圖譜與通用知識圖譜存在一定的差異。因此,本文主要研究基于商品屬性的商品圖譜構建,以及不同語言的商品圖譜進行對齊與融合;趯傩缘纳唐穲D譜主要描述了商品的屬性及屬性值信息。早期的研究工作采用基于規(guī)則的方法,由專家設計領域相關的詞匯表來提取商品的屬性信息,或者將屬性值提取任務視為一種特殊的命名實體識別,但都無法應用于屬性體系龐大的真實電商環(huán)境。因此,本文的第一個研究工作提出基于屬性增強的屬性值抽取模型,不僅將屬性視作標簽類型,同時建模其語義信息,從而能夠處理上萬級別的屬性,甚至是模型從未見過的新屬性。同時,本文構建了真實的大規(guī)模英文商品數(shù)據(jù)集,并基于此構建了英文商品知識圖譜。電商全球化的版圖中包含了很多小語種,這些小語種由于使用人數(shù)少、商品數(shù)量有限等原因,缺乏相應的標注數(shù)據(jù)來訓練有效的屬性值抽取模型,難以構建低資源語言商品圖譜。因此,本文的第二個研究工作提出對抗多任務學習模型,利用高資源語言豐富的標注數(shù)據(jù)來幫助低... 

【文章來源】:華東師范大學上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:80 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景與意義
    1.2 相關研究工作
        1.2.1 商品圖譜的構建
        1.2.2 多任務學習
        1.2.3 實體對齊
    1.3 本文研究內容
    1.4 本文組織結構
第二章 相關概念
    2.1 多語言商品數(shù)據(jù)集
    2.2 深度學習知識
        2.2.1 詞向量
        2.2.2 最新的語言模型BERT
        2.2.3 跨語言詞向量
        2.2.4 循環(huán)神經(jīng)網(wǎng)絡
        2.2.5 圖神經(jīng)網(wǎng)絡
    2.3 系統(tǒng)評估指標
    2.4 本章小結
第三章 基于屬性抽取的商品圖譜構建
    3.1 研究動機
    3.2 基于屬性增強的屬性值抽取模型
    3.3 數(shù)據(jù)集及實驗設置
        3.3.1 數(shù)據(jù)集
        3.3.2 評估標準
        3.3.3 基準系統(tǒng)
        3.3.4 參數(shù)設置
    3.4 實驗結果及分析
        3.4.1 在高頻屬性上的結果
        3.4.2 在所有屬性上的結果
        3.4.3 針對新屬性的結果
        3.4.4 可視化分析
    3.5 在真實電商領域中的應用
        3.5.1 屬性分類模型
        3.5.2 數(shù)據(jù)集與實驗設置
        3.5.3 實驗結果及分析
    3.6 本章小結
第四章 低資源語言商品圖譜構建
    4.1 研究動機
    4.2 對抗多任務模型
    4.3 數(shù)據(jù)集及實驗設置
        4.3.1 數(shù)據(jù)集
        4.3.2 實驗設置
        4.3.3 基準系統(tǒng)
    4.4 實驗結果和分析
        4.4.1 和基準系統(tǒng)的比較
        4.4.2 超參數(shù)的影響
    4.5 本章小結
第五章 跨語言商品圖譜對齊
    5.1 研究動機
    5.2 屬性信息強化的實體對齊模型
    5.3 數(shù)據(jù)集及實驗設置
        5.3.1 數(shù)據(jù)集
        5.3.2 實驗設置
        5.3.3 基準系統(tǒng)
    5.4 實驗結果及分析
        5.4.1 與基準系統(tǒng)的性能比較
        5.4.2 不同模塊的性能比較
    5.5 本章小結
第六章 總結與展望
    6.1 本文總結
    6.2 未來的工作
攻讀學位期間發(fā)表的學術論文以及學術成果
參考文獻
致謝


【參考文獻】:
期刊論文
[1]基于電商數(shù)據(jù)的產(chǎn)品知識圖譜構建研究[J]. 丁晟春,侯琳琳,王穎.  數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(03)
[2]基于Choquet積分的HMM商品信息抽取方法[J]. 鄧斌,邵培基,夏國恩.  系統(tǒng)工程. 2008(12)

碩士論文
[1]多語言文本語義相似度的計算及其應用研究[D]. 田俊峰.華東師范大學 2018



本文編號:3197559

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3197559.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶3db02***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com