融合自注意力機(jī)制的跨模態(tài)食譜檢索方法
發(fā)布時(shí)間:2023-04-27 00:21
飲食記錄是飲食管理的關(guān)鍵環(huán)節(jié)。為了簡(jiǎn)化記錄過(guò)程,研究者提出了基于食物圖片的食譜檢索技術(shù),通過(guò)拍攝的圖片檢索到對(duì)應(yīng)食譜,并據(jù)此生成營(yíng)養(yǎng)信息,從而提高了記錄的便捷性。食譜檢索是典型的跨模態(tài)檢索問(wèn)題,但與一般問(wèn)題相比,其主要難點(diǎn)是食譜描述了從原材料到成品的一系列變化過(guò)程,而非直接可見(jiàn)的特征,因此模型需要深入理解原材料的處理過(guò)程。而當(dāng)前食譜檢索研究工作采用線性方式處理文本,導(dǎo)致其捕捉食譜處理過(guò)程中的遠(yuǎn)距離依賴(lài)現(xiàn)象的能力較差。針對(duì)這個(gè)問(wèn)題,設(shè)計(jì)了一種基于自注意力機(jī)制的跨模態(tài)食譜檢索模型。該模型借助Transformer模型中的自注意力機(jī)制,捕捉食譜中遠(yuǎn)距離的依賴(lài)關(guān)系,同時(shí)改進(jìn)了傳統(tǒng)方法中的注意力機(jī)制,可以更好地挖掘食譜中的語(yǔ)義。實(shí)驗(yàn)結(jié)果表明,該模型在食譜檢索任務(wù)的召回率上比基線方法提高了22%。
【文章頁(yè)數(shù)】:11 頁(yè)
【文章目錄】:
1 引言
2 相關(guān)工作
2.1 跨模態(tài)檢索
2.2 食譜檢索
3 模型設(shè)計(jì)
3.1 模型框架概覽
3.2 文字編碼模塊
3.2.1 Transformer模型
3.2.2 標(biāo)題編碼
3.2.3 原材料編碼
3.2.4 步驟編碼
3.2.5 環(huán)境向量的選擇
3.2.6 文字整體編碼
3.3 圖片編碼模塊
3.4 聯(lián)合嵌入模塊
3.5 損失函數(shù)
3.6 模型訓(xùn)練
4 實(shí)驗(yàn)驗(yàn)證
4.1 數(shù)據(jù)集
4.2 實(shí)驗(yàn)設(shè)置
4.2.1 實(shí)現(xiàn)細(xì)節(jié)
4.2.2 評(píng)價(jià)指標(biāo)
4.3 結(jié)果比較
4.4 對(duì)照實(shí)驗(yàn)
4.4.1 注意力機(jī)制
4.4.2 消融研究
4.4.3 參數(shù)靈敏度實(shí)驗(yàn)
5 總結(jié)與期望
本文編號(hào):3802483
【文章頁(yè)數(shù)】:11 頁(yè)
【文章目錄】:
1 引言
2 相關(guān)工作
2.1 跨模態(tài)檢索
2.2 食譜檢索
3 模型設(shè)計(jì)
3.1 模型框架概覽
3.2 文字編碼模塊
3.2.1 Transformer模型
3.2.2 標(biāo)題編碼
3.2.3 原材料編碼
3.2.4 步驟編碼
3.2.5 環(huán)境向量的選擇
3.2.6 文字整體編碼
3.3 圖片編碼模塊
3.4 聯(lián)合嵌入模塊
3.5 損失函數(shù)
3.6 模型訓(xùn)練
4 實(shí)驗(yàn)驗(yàn)證
4.1 數(shù)據(jù)集
4.2 實(shí)驗(yàn)設(shè)置
4.2.1 實(shí)現(xiàn)細(xì)節(jié)
4.2.2 評(píng)價(jià)指標(biāo)
4.3 結(jié)果比較
4.4 對(duì)照實(shí)驗(yàn)
4.4.1 注意力機(jī)制
4.4.2 消融研究
4.4.3 參數(shù)靈敏度實(shí)驗(yàn)
5 總結(jié)與期望
本文編號(hào):3802483
本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/3802483.html
最近更新
教材專(zhuān)著