和元多媒體語料庫系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2021-03-08 14:19
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,不同國家、不同文化、不同語言的人之間越來越渴望能擁有一種新的語言形式來進行更加方便快捷的交流溝通。西北大學小露珠團隊提出了基于網(wǎng)絡(luò)的語言——“和”,旨在方便人們進行跨文化、跨語種、跨地域的的交流。語料庫是語言研究的重要手段。但是現(xiàn)有的網(wǎng)絡(luò)語言研究多是針對文字或者單純的網(wǎng)絡(luò)表情,而現(xiàn)有的多媒體語料庫研究多是針對單個的多媒體語料,沒有把多媒體語料與聊天語言進行有機的結(jié)合。因此,為了更好的推進“和”語言的研究和使用,研究基于“和”語言的多媒體語料庫勢在必行。本文在對傳統(tǒng)多媒體語料庫以及網(wǎng)絡(luò)語言的研究現(xiàn)狀進行總結(jié)和分析基礎(chǔ)上,首先根據(jù)“和”語言的特點,提出了基于網(wǎng)絡(luò)聊天活動的語料概念模型,該語料模型對網(wǎng)絡(luò)聊天活動進行抽象并劃分為活動者的角度、活動的角度以及系統(tǒng)的角度進行研究;其次,為了解決基于網(wǎng)絡(luò)聊天的多媒體語料的處理問題,給出了多媒體語料分層處理模型,該模型從語料物理層、語料語義層以及整體語段、篇章處理層逐層說明了多媒體語料的處理過程;最后在多媒體語料庫模型的基礎(chǔ)上,提出相關(guān)需求,進一步設(shè)計和實現(xiàn)了基于“和”語言的多媒體語料庫系統(tǒng)——和元(Harmony Multi...
【文章來源】:西北大學陜西省 211工程院校
【文章頁數(shù)】:86 頁
【學位級別】:碩士
【部分圖文】:
“和”語言及其相關(guān)系統(tǒng)間的關(guān)系
西北大學碩士專業(yè)學位論文個語料添加一個或多個標簽;第二階段為評審階段,由多位標注者從標注階段獲得的標簽中選出最認可的部分標簽,這些標注者分別從給定語料和其對應(yīng)的標簽集合中選擇一個或多個自己認為最滿意的標簽,系統(tǒng)后臺會對用戶的投票計數(shù),并按投票數(shù)把所有標簽從高到低排列,保留用戶認可度最高的標簽作為該語料的標簽,將該標簽作為語料的語義。荷棠在標注完成后把標注好的語義返回到語料庫中。圖 2 為荷棠的眾包標注模型圖。
SpringBoot的配置
【參考文獻】:
期刊論文
[1]面向聊天記錄的語義分析研究[J]. 王媛媛,范潮欽,蘇玉海. 信息網(wǎng)絡(luò)安全. 2017(09)
[2]新媒體時代網(wǎng)絡(luò)語言的傳播研究[J]. 范娟華. 新媒體研究. 2017(07)
[3]面向海量高清視頻數(shù)據(jù)的高性能分布式存儲系統(tǒng)[J]. 操順德,華宇,馮丹,孫園園,左鵬飛. 軟件學報. 2017(08)
[4]談話節(jié)目語料庫的構(gòu)建與會話結(jié)構(gòu)分析[J]. 王珊,劉銳. 中文信息學報. 2016(06)
[5]漢語網(wǎng)絡(luò)語言研究現(xiàn)狀分析——關(guān)于建立“漢語網(wǎng)絡(luò)語言語料庫”的設(shè)想[J]. 萇淑君. 現(xiàn)代語文(語言研究版). 2016(07)
[6]基于隱馬爾可夫模型的主觀句識別[J]. 劉培玉,荀靜,費紹棟,朱振方. 中文信息學報. 2016(04)
[7]漢語網(wǎng)絡(luò)語言語料庫:研制與應(yīng)用[J]. 曹進,趙鴻章,王灝. 蘭州文理學院學報(社會科學版). 2015(05)
[8]談漢語中介語語料庫的建設(shè)標準[J]. 張寶林,崔希亮. 語言文字應(yīng)用. 2015(02)
[9]中文分詞與詞性標注研究[J]. 梁喜濤,顧磊. 計算機技術(shù)與發(fā)展. 2015(02)
[10]關(guān)于《地書》[J]. 徐冰. 雪蓮. 2014(08)
碩士論文
[1]語料庫眾包工具—荷裳的設(shè)計與實現(xiàn)[D]. 阿宇.西北大學 2018
[2]和音即時通訊工具的設(shè)計與實現(xiàn)[D]. 張國慶.西北大學 2017
本文編號:3071196
【文章來源】:西北大學陜西省 211工程院校
【文章頁數(shù)】:86 頁
【學位級別】:碩士
【部分圖文】:
“和”語言及其相關(guān)系統(tǒng)間的關(guān)系
西北大學碩士專業(yè)學位論文個語料添加一個或多個標簽;第二階段為評審階段,由多位標注者從標注階段獲得的標簽中選出最認可的部分標簽,這些標注者分別從給定語料和其對應(yīng)的標簽集合中選擇一個或多個自己認為最滿意的標簽,系統(tǒng)后臺會對用戶的投票計數(shù),并按投票數(shù)把所有標簽從高到低排列,保留用戶認可度最高的標簽作為該語料的標簽,將該標簽作為語料的語義。荷棠在標注完成后把標注好的語義返回到語料庫中。圖 2 為荷棠的眾包標注模型圖。
SpringBoot的配置
【參考文獻】:
期刊論文
[1]面向聊天記錄的語義分析研究[J]. 王媛媛,范潮欽,蘇玉海. 信息網(wǎng)絡(luò)安全. 2017(09)
[2]新媒體時代網(wǎng)絡(luò)語言的傳播研究[J]. 范娟華. 新媒體研究. 2017(07)
[3]面向海量高清視頻數(shù)據(jù)的高性能分布式存儲系統(tǒng)[J]. 操順德,華宇,馮丹,孫園園,左鵬飛. 軟件學報. 2017(08)
[4]談話節(jié)目語料庫的構(gòu)建與會話結(jié)構(gòu)分析[J]. 王珊,劉銳. 中文信息學報. 2016(06)
[5]漢語網(wǎng)絡(luò)語言研究現(xiàn)狀分析——關(guān)于建立“漢語網(wǎng)絡(luò)語言語料庫”的設(shè)想[J]. 萇淑君. 現(xiàn)代語文(語言研究版). 2016(07)
[6]基于隱馬爾可夫模型的主觀句識別[J]. 劉培玉,荀靜,費紹棟,朱振方. 中文信息學報. 2016(04)
[7]漢語網(wǎng)絡(luò)語言語料庫:研制與應(yīng)用[J]. 曹進,趙鴻章,王灝. 蘭州文理學院學報(社會科學版). 2015(05)
[8]談漢語中介語語料庫的建設(shè)標準[J]. 張寶林,崔希亮. 語言文字應(yīng)用. 2015(02)
[9]中文分詞與詞性標注研究[J]. 梁喜濤,顧磊. 計算機技術(shù)與發(fā)展. 2015(02)
[10]關(guān)于《地書》[J]. 徐冰. 雪蓮. 2014(08)
碩士論文
[1]語料庫眾包工具—荷裳的設(shè)計與實現(xiàn)[D]. 阿宇.西北大學 2018
[2]和音即時通訊工具的設(shè)計與實現(xiàn)[D]. 張國慶.西北大學 2017
本文編號:3071196
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3071196.html
最近更新
教材專著