基于語料庫多維特征聚類關(guān)聯(lián)的成都話語氣詞研究
發(fā)布時間:2020-08-09 16:39
【摘要】:語氣涉及結(jié)構(gòu)、意義、語境多個方面因素,語氣成分的功能有很強(qiáng)的模糊性,多個語氣成分的功能不是排他的而是相容/不相容的,這導(dǎo)致語氣和語氣詞研究的困難:爭議很大,單純的自省法很容易被預(yù)設(shè)的理論框架局限,定性式的確切定義往往難以說明一個語氣詞的復(fù)雜情況。因此本文用真實(shí)文本組建的語料庫為基礎(chǔ)來研究成都話語氣詞系統(tǒng),用11個維度42個特征的多維特征對語料進(jìn)行標(biāo)注,用基于博弈的權(quán)重計(jì)算來確定關(guān)聯(lián)(相似性),在此基礎(chǔ)上按偏向性策略進(jìn)行層次聚類,得到各語氣詞的功能聚類關(guān)聯(lián)情況,總結(jié)出每個語氣詞的核心功能,并研究各功能關(guān)聯(lián)形成的有機(jī)整體。語氣系統(tǒng)是一個多維的分層結(jié)構(gòu),本文考察的層次從低到高為:形式(附著性、分布、句類)、言語行為(具體言行為、信/疑)、判斷(預(yù)期性)、判斷(情感極性、立場)、力度(情緒強(qiáng)中弱)。成都話語氣詞由高層的預(yù)期性、立場和力度驅(qū)動:強(qiáng)意外+反問“嗦”、強(qiáng)意外+反問和弱意外+求證“哇”、強(qiáng)意外+強(qiáng)調(diào)陳述“哦、啊”、強(qiáng)調(diào)詢問+強(qiáng)意外“喃”、強(qiáng)調(diào)確認(rèn)聽者錯誤預(yù)期+同盟“噻”、較強(qiáng)確認(rèn)聽者錯誤預(yù)期+同盟“哈”、強(qiáng)同盟“嘎”、直陳+確認(rèn)+無同盟“V”、強(qiáng)調(diào)+同盟“嘛”、緩和+同盟“吧”。各語氣詞的核心功能能夠區(qū)別開來,各司其職,具有定量區(qū)別、對比區(qū)別和定性區(qū)別3種不同的功能辨識性。各維度還是互相關(guān)聯(lián)的:獨(dú)立成句、句首、句中、多句中趨于人際語篇功能;沒有專門的疑問語氣詞,疑問句類最活躍,一半以上表示無疑的反問式告知/要求或強(qiáng)求認(rèn)同,然后才用于詢問;反問告知/要求是隱性的否定,力度最強(qiáng),強(qiáng)求認(rèn)同次之,之后為祈使要求,直陳可趨向中弱情緒,求證問特別是求證式要求最容易趨弱;強(qiáng)情緒也來自有極性的預(yù)期性,反說者預(yù)期的意外最容易引發(fā)強(qiáng)情緒,其次是指出聽者預(yù)期錯誤的確認(rèn),再次是順應(yīng)聽者預(yù)期,然后是確認(rèn)/順應(yīng)第三方預(yù)期;中弱情緒來自順應(yīng)說者預(yù)期和無預(yù)期;同盟立場在語氣詞中是無標(biāo)記的,情感和情緒分布比較復(fù)雜;反同盟立場是有標(biāo)記的,情感負(fù)面的,情緒強(qiáng);無同盟對語氣詞也是有標(biāo)記的,出現(xiàn)在沒有真正聽者的敘述語篇和自言自語中,趨向中性;負(fù)面情感最容易引發(fā)強(qiáng)情緒,正面情感次之,中性情感趨向非強(qiáng)情緒。關(guān)聯(lián)讓各語氣詞的功能又具有“模糊性”,在歷時自我演變、語言接觸影響和個人用語習(xí)慣等共同作用下,使得各語氣詞在許多功能中或多或少有所“交疊”,交疊時依靠核心功能顯示出來的定量區(qū)別可能有微妙的語感差異。
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:H172.3
【圖文】:
逑想算法的本質(zhì)是要通過所有共現(xiàn)的情況減少空地圖。逡逑當(dāng)然,盡管圖1.5是各點(diǎn)兩兩相連的空地圖,但各邊權(quán)重“粗細(xì)”不一,Cysouw逡逑就可“刪粗留細(xì)”,得到化簡后的圖1.6,認(rèn)為這是人稱語義的“主流規(guī)律”。逡逑pc逡逑圖1.5邋:邋Cysouw人稱語義地圖逡逑這樣我們可以看出第一人稱單復(fù)數(shù)之間關(guān)聯(lián)、第二人稱單復(fù)數(shù)之間關(guān)聯(lián)、第逡逑三人稱單復(fù)數(shù)之間關(guān)聯(lián)強(qiáng)。同時這一關(guān)聯(lián)也得出了人稱在世界語言的主流就是按逡逑第一、第二、第三人稱聚成了邋3類。不過圖1.5和圖1.6有一個問題,就是12-13逡逑間的連線明明很粗為什么也被刪除了?這實(shí)際上來自于研究者的“專家直覺”。逡逑需要考慮的是這后面的“專家直覺”到底是怎樣的一種思路和計(jì)算模式。逡逑?邐<^>逡逑?邐?逡逑?邐?逡逑?邐?逡逑圖1.6:邐Cysouw人稱語義地圖簡圖逡逑另外,郭銳(2012:邋115-116)引入了“關(guān)聯(lián)度”的概念對語義地圖的算法進(jìn)逡逑行了改進(jìn),兩個概念間關(guān)聯(lián)度的計(jì)算公式為公式1.1:逡逑公式邋l.l9邋A邋=邋S1邋?邋S2邋/邋(W1邋+W2-S1邋?邋S2)邋X邋100逡逑簡單地說“關(guān)聯(lián)度”是將完全加權(quán)按一定比例縮放,也是把每一個記錄局部逡逑視作完全圖,計(jì)算的是一種“完全關(guān)聯(lián)度”,同樣很容易出現(xiàn)空地圖,和理想算逡逑法矛盾。逡逑9邋“S1.S2”指基元1和基元2在數(shù)據(jù)中“任意”共現(xiàn)的頻次,W1指具有義項(xiàng)1的總頻次,
逑想算法的本質(zhì)是要通過所有共現(xiàn)的情況減少空地圖。逡逑當(dāng)然,盡管圖1.5是各點(diǎn)兩兩相連的空地圖,但各邊權(quán)重“粗細(xì)”不一,Cysouw逡逑就可“刪粗留細(xì)”,得到化簡后的圖1.6,認(rèn)為這是人稱語義的“主流規(guī)律”。逡逑pc逡逑圖1.5邋:邋Cysouw人稱語義地圖逡逑這樣我們可以看出第一人稱單復(fù)數(shù)之間關(guān)聯(lián)、第二人稱單復(fù)數(shù)之間關(guān)聯(lián)、第逡逑三人稱單復(fù)數(shù)之間關(guān)聯(lián)強(qiáng)。同時這一關(guān)聯(lián)也得出了人稱在世界語言的主流就是按逡逑第一、第二、第三人稱聚成了邋3類。不過圖1.5和圖1.6有一個問題,就是12-13逡逑間的連線明明很粗為什么也被刪除了?這實(shí)際上來自于研究者的“專家直覺”。逡逑需要考慮的是這后面的“專家直覺”到底是怎樣的一種思路和計(jì)算模式。逡逑?邐<^>逡逑?邐?逡逑?邐?逡逑?邐?逡逑圖1.6:邐Cysouw人稱語義地圖簡圖逡逑另外,郭銳(2012:邋115-116)引入了“關(guān)聯(lián)度”的概念對語義地圖的算法進(jìn)逡逑行了改進(jìn),兩個概念間關(guān)聯(lián)度的計(jì)算公式為公式1.1:逡逑公式邋l.l9邋A邋=邋S1邋?邋S2邋/邋(W1邋+W2-S1邋?邋S2)邋X邋100逡逑簡單地說“關(guān)聯(lián)度”是將完全加權(quán)按一定比例縮放,也是把每一個記錄局部逡逑視作完全圖,計(jì)算的是一種“完全關(guān)聯(lián)度”,同樣很容易出現(xiàn)空地圖,和理想算逡逑法矛盾。逡逑9邋“S1.S2”指基元1和基元2在數(shù)據(jù)中“任意”共現(xiàn)的頻次,W1指具有義項(xiàng)1的總頻次,
“刪除非必需邊”的過程。所謂“非必需邊”,就是看邊所連接的兩點(diǎn)能否“獨(dú)逡逑立”地只在兩點(diǎn)共現(xiàn)中出現(xiàn)。如果有是“必需邊”,如果無就是“非必需邊”。但逡逑是即使如此,圖1.5中12-13還是無法自動刪除必須靠“專家直覺”來處理。另逡逑外,本文研究語氣詞所設(shè)置的特征系統(tǒng)中,各例句都由10個左右特征標(biāo)注,根逡逑本不存在只有兩個點(diǎn)獨(dú)立共現(xiàn)的情況,根本沒有“非必需邊”。逡逑0邐¥邐IS邐ts邐20邐25逡逑}邐1邐;邐t邐i逡逑-4邋一逡逑:;r邐14邐逡逑5—丨丨邋1逡逑A邋?邐'邋—l逡逑貨黎邐邐逡逑╁澹保ⅲ卞義希掊危В取義希洌危玻插濉掊危ⅲ㈠澹А鰣澹㈠澹薄誨義!辶x?痘"*邋逦辶x希停翦危跺五義希渝逡唬義希潁翦五五義蟦邐—?邐邐逡逑裰碑邋23逡逑20邋—逡逑R#:邐26邋一逡逑g摩邐27邋一"逡逑煖.?dāng)[邐30逡逑"::n—逡逑15邋—*邐"…■■■■■■邋邋邐逡逑r.:f.邐邐逡逑r邐,邐邐邐邋邐邋邐邐逡逑一逡逑—痛一-*邐邐—逡逑_邋邐逡逑邐i逡逑M邐9邋J..—邋邋邋邋邋邋邋邋邋邋邋邋逡逑圖1.7:中國各省距離層次聚類圖1()逡逑上述關(guān)聯(lián)聚類和的結(jié)果是一次聚類。因?yàn)槲覀兺诰虻闹R往往是結(jié)構(gòu)化的,逡逑可能需要的層次聚類(HierarchicalClustering):多次而非一次聚類,聚出來的類逡逑別具有多層級結(jié)構(gòu)。最常見的層次聚類是兩兩聚類形成的“樹狀圖(Dendrogram)”逡逑層級:計(jì)算各項(xiàng)目之間的絕對相似性
本文編號:2787386
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:H172.3
【圖文】:
逑想算法的本質(zhì)是要通過所有共現(xiàn)的情況減少空地圖。逡逑當(dāng)然,盡管圖1.5是各點(diǎn)兩兩相連的空地圖,但各邊權(quán)重“粗細(xì)”不一,Cysouw逡逑就可“刪粗留細(xì)”,得到化簡后的圖1.6,認(rèn)為這是人稱語義的“主流規(guī)律”。逡逑pc逡逑圖1.5邋:邋Cysouw人稱語義地圖逡逑這樣我們可以看出第一人稱單復(fù)數(shù)之間關(guān)聯(lián)、第二人稱單復(fù)數(shù)之間關(guān)聯(lián)、第逡逑三人稱單復(fù)數(shù)之間關(guān)聯(lián)強(qiáng)。同時這一關(guān)聯(lián)也得出了人稱在世界語言的主流就是按逡逑第一、第二、第三人稱聚成了邋3類。不過圖1.5和圖1.6有一個問題,就是12-13逡逑間的連線明明很粗為什么也被刪除了?這實(shí)際上來自于研究者的“專家直覺”。逡逑需要考慮的是這后面的“專家直覺”到底是怎樣的一種思路和計(jì)算模式。逡逑?邐<^>逡逑?邐?逡逑?邐?逡逑?邐?逡逑圖1.6:邐Cysouw人稱語義地圖簡圖逡逑另外,郭銳(2012:邋115-116)引入了“關(guān)聯(lián)度”的概念對語義地圖的算法進(jìn)逡逑行了改進(jìn),兩個概念間關(guān)聯(lián)度的計(jì)算公式為公式1.1:逡逑公式邋l.l9邋A邋=邋S1邋?邋S2邋/邋(W1邋+W2-S1邋?邋S2)邋X邋100逡逑簡單地說“關(guān)聯(lián)度”是將完全加權(quán)按一定比例縮放,也是把每一個記錄局部逡逑視作完全圖,計(jì)算的是一種“完全關(guān)聯(lián)度”,同樣很容易出現(xiàn)空地圖,和理想算逡逑法矛盾。逡逑9邋“S1.S2”指基元1和基元2在數(shù)據(jù)中“任意”共現(xiàn)的頻次,W1指具有義項(xiàng)1的總頻次,
逑想算法的本質(zhì)是要通過所有共現(xiàn)的情況減少空地圖。逡逑當(dāng)然,盡管圖1.5是各點(diǎn)兩兩相連的空地圖,但各邊權(quán)重“粗細(xì)”不一,Cysouw逡逑就可“刪粗留細(xì)”,得到化簡后的圖1.6,認(rèn)為這是人稱語義的“主流規(guī)律”。逡逑pc逡逑圖1.5邋:邋Cysouw人稱語義地圖逡逑這樣我們可以看出第一人稱單復(fù)數(shù)之間關(guān)聯(lián)、第二人稱單復(fù)數(shù)之間關(guān)聯(lián)、第逡逑三人稱單復(fù)數(shù)之間關(guān)聯(lián)強(qiáng)。同時這一關(guān)聯(lián)也得出了人稱在世界語言的主流就是按逡逑第一、第二、第三人稱聚成了邋3類。不過圖1.5和圖1.6有一個問題,就是12-13逡逑間的連線明明很粗為什么也被刪除了?這實(shí)際上來自于研究者的“專家直覺”。逡逑需要考慮的是這后面的“專家直覺”到底是怎樣的一種思路和計(jì)算模式。逡逑?邐<^>逡逑?邐?逡逑?邐?逡逑?邐?逡逑圖1.6:邐Cysouw人稱語義地圖簡圖逡逑另外,郭銳(2012:邋115-116)引入了“關(guān)聯(lián)度”的概念對語義地圖的算法進(jìn)逡逑行了改進(jìn),兩個概念間關(guān)聯(lián)度的計(jì)算公式為公式1.1:逡逑公式邋l.l9邋A邋=邋S1邋?邋S2邋/邋(W1邋+W2-S1邋?邋S2)邋X邋100逡逑簡單地說“關(guān)聯(lián)度”是將完全加權(quán)按一定比例縮放,也是把每一個記錄局部逡逑視作完全圖,計(jì)算的是一種“完全關(guān)聯(lián)度”,同樣很容易出現(xiàn)空地圖,和理想算逡逑法矛盾。逡逑9邋“S1.S2”指基元1和基元2在數(shù)據(jù)中“任意”共現(xiàn)的頻次,W1指具有義項(xiàng)1的總頻次,
“刪除非必需邊”的過程。所謂“非必需邊”,就是看邊所連接的兩點(diǎn)能否“獨(dú)逡逑立”地只在兩點(diǎn)共現(xiàn)中出現(xiàn)。如果有是“必需邊”,如果無就是“非必需邊”。但逡逑是即使如此,圖1.5中12-13還是無法自動刪除必須靠“專家直覺”來處理。另逡逑外,本文研究語氣詞所設(shè)置的特征系統(tǒng)中,各例句都由10個左右特征標(biāo)注,根逡逑本不存在只有兩個點(diǎn)獨(dú)立共現(xiàn)的情況,根本沒有“非必需邊”。逡逑0邐¥邐IS邐ts邐20邐25逡逑}邐1邐;邐t邐i逡逑-4邋一逡逑:;r邐14邐逡逑5—丨丨邋1逡逑A邋?邐'邋—l逡逑貨黎邐邐逡逑╁澹保ⅲ卞義希掊危В取義希洌危玻插濉掊危ⅲ㈠澹А鰣澹㈠澹薄誨義!辶x?痘"*邋逦辶x希停翦危跺五義希渝逡唬義希潁翦五五義蟦邐—?邐邐逡逑裰碑邋23逡逑20邋—逡逑R#:邐26邋一逡逑g摩邐27邋一"逡逑煖.?dāng)[邐30逡逑"::n—逡逑15邋—*邐"…■■■■■■邋邋邐逡逑r.:f.邐邐逡逑r邐,邐邐邐邋邐邋邐邐逡逑一逡逑—痛一-*邐邐—逡逑_邋邐逡逑邐i逡逑M邐9邋J..—邋邋邋邋邋邋邋邋邋邋邋邋逡逑圖1.7:中國各省距離層次聚類圖1()逡逑上述關(guān)聯(lián)聚類和的結(jié)果是一次聚類。因?yàn)槲覀兺诰虻闹R往往是結(jié)構(gòu)化的,逡逑可能需要的層次聚類(HierarchicalClustering):多次而非一次聚類,聚出來的類逡逑別具有多層級結(jié)構(gòu)。最常見的層次聚類是兩兩聚類形成的“樹狀圖(Dendrogram)”逡逑層級:計(jì)算各項(xiàng)目之間的絕對相似性
本文編號:2787386
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2787386.html
最近更新
教材專著