基于文本挖掘技術(shù)的網(wǎng)絡(luò)熱點(diǎn)新聞系統(tǒng)的研建
【文章頁(yè)數(shù)】:79 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3.1?BERT算法模型結(jié)構(gòu)??Figure?3.1?BERT?algorithm?model?structure??
設(shè)計(jì)??3.1.1?BERT算法概述??BERT模型是由谷歌發(fā)布的一種用來(lái)對(duì)語(yǔ)言表征進(jìn)行預(yù)訓(xùn)練的模型,它是基于雙??向Transformer結(jié)構(gòu)來(lái)實(shí)現(xiàn)對(duì)大規(guī)模有監(jiān)督語(yǔ)料進(jìn)行預(yù)訓(xùn)練,然后獲得理解語(yǔ)義的一??種數(shù)學(xué)模型,可以應(yīng)用在NLP自然語(yǔ)言處理中,比如聊天機(jī)器人、智能問(wèn)答、自動(dòng)?....
圖3.3關(guān)鍵詞標(biāo)注數(shù)據(jù)??Figure?3.3?Keyword?annotation?data??(2)數(shù)據(jù)集的處理??首先從本文采用的實(shí)驗(yàn)數(shù)據(jù)源中獲。担埃埃捌侣剶(shù)據(jù),采樣方式以體育,財(cái)經(jīng),??
?3新聞信息提取算法設(shè)計(jì)與優(yōu)化???合本文的算法設(shè)計(jì)的驗(yàn)證方法,中國(guó)科學(xué)文獻(xiàn)數(shù)據(jù)集涉及的領(lǐng)域比較廣泛,含有各個(gè)??領(lǐng)域的文本,對(duì)于本文抽取新聞本文的文本類型和意圖也相吻合,因此確定用此數(shù)據(jù)??集合作為本文的賣(mài)驗(yàn)數(shù)振集合。如圖3.2和3.3分別為數(shù)據(jù)集合的摘要標(biāo)注數(shù)據(jù)和關(guān)??鍵詞標(biāo)....
圖3.5摘要抽取結(jié)果??Figure?3.5?Abstract?extraction?results??
?錄于文本挖掘技術(shù)的.網(wǎng)絡(luò)熱點(diǎn)_新_聞系統(tǒng)的研建???計(jì)算抽取出來(lái)的文章摘要結(jié)果。??圖3.4關(guān)鍵詞權(quán)重計(jì)算結(jié)果??Figure?3.4?Keyword?weight?calculation?results??圖3.5摘要抽取結(jié)果??Figure?3.5?Abstract?ext....
圖3.4關(guān)鍵詞權(quán)重計(jì)算結(jié)果??Figure?3.4?Keyword?weight?calculation?results??
?錄于文本挖掘技術(shù)的.網(wǎng)絡(luò)熱點(diǎn)_新_聞系統(tǒng)的研建???計(jì)算抽取出來(lái)的文章摘要結(jié)果。??圖3.4關(guān)鍵詞權(quán)重計(jì)算結(jié)果??Figure?3.4?Keyword?weight?calculation?results??圖3.5摘要抽取結(jié)果??Figure?3.5?Abstract?ext....
本文編號(hào):3896530
本文鏈接:http://sikaile.net/tushudanganlunwen/3896530.html