基于映射的無(wú)監(jiān)督跨語(yǔ)言詞向量模型研究
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1英語(yǔ)和西班牙語(yǔ)中數(shù)字詞向最與動(dòng)物詞向鋒之間的呈現(xiàn)了相似的幾何關(guān)??系[2】??
?〇???〇?*??}??J???.?.?1?〇do>(two)??"j*???'????U?M?M?t;?"Xi?I??J???13??#?'???4r?IS??〇?horse?〇?cabalo?(horse)???,?,J?ovaca?(cow)??m?‘?〇?cow?(J....
圖2-1?Word2Vec的連續(xù)詞袋模型和跳字模型結(jié)構(gòu)圖[55]??(1)?Skip-gram?模型??
FastText模型。??2.3.1.1?Word2Vec??谷歌(Google)公司在2013年開(kāi)源發(fā)布了一種可以將單詞轉(zhuǎn)換為向量形式??的計(jì)算工具W〇rd2VeC[2],它基于分布假設(shè)的思想,可以根據(jù)詞忙間的距離或相似??度表示出單詞間的關(guān)系,從而發(fā)掘出語(yǔ)言詞?I:結(jié)構(gòu)和關(guān)系....
圖2-2?Word2Vec下的跳寺模型[55]??如圖2-2所示,Skip-gram可以看做是由輸入層、隱藏層(也稱為投射層)、??輸出M構(gòu)成的三雇網(wǎng)絡(luò):輸入層是由中心詞構(gòu)成的V維的獨(dú)熱編碼的向量s中??
?哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文???它距離不超過(guò)2的背景詞“method”、“for”、“word”、“embeddings”的條件概率。??/〇?Output?layer??T?,?Awt??Input?layer?/?/??layer/??〇?wrxJV?ht?i??F-d....
圖2-3?Word2Vec的連續(xù)詞袋模型[55]??_?skip-gram模III類(lèi)似,CBOW模塑的結(jié)構(gòu)同枰是一個(gè)三屬的全連接神經(jīng)網(wǎng)??絡(luò),同樣它只有一個(gè)隱藏層
?哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文???Input?layer??J\??^^mdde^^g011,iayer??X2k?〇?^ht?^'n^V?〇?yj????/?/?F-dim??%?w^/??-;/??5/?CxF-dim??圖2-3?Word2Vec的連續(xù)詞袋模型[55]?....
本文編號(hào):3995763
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3995763.html
下一篇:沒(méi)有了