天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 文藝論文 > 語言藝術論文 >

基于依存語法的中文即時消息作者識別研究

發(fā)布時間:2021-11-11 19:05
  對于可用于司法作者識別的有效的判別特征,學界一向有強烈的研究熱情,尤其當其涉及最有挑戰(zhàn)性且頻繁作為司法證據(jù)使用的文本體裁之一——即時消息的時候。本研究致力于為中文即時消息作者識別開展一項任務,檢驗一系列基于依存語法抽取得到的句法特征的判別力,以提供更多在司法作者識別任務中可供選擇使用的候選特征。提出的特征包括平均依存距離、平均等級距離和各依存關系類型的相對頻數(shù)。方法上,研究開展了一系列分類實驗以證實所提出特征的判別能力:特征提取自人工標注的微信消息,微信消息產(chǎn)生于作者的自然語言,作者間既存在社會語言學相似性又存在社會語言學相異性;特征輸入至分類算法中以訓練模型,基于模型對特征的判別能力進行評估;實驗考慮了不同的特征集和作者組合。統(tǒng)計顯著的結(jié)果證實了特征在中文即時消息作者識別中的判別能力。對于存在社會語言學相似性和社會語言學相異性的作者識別任務,這些特征都作出了不同的貢獻。值得一提的是,在一個涉及高達五名作者且作者間存在社會語言學相似性的案例中,這些特征有令人滿意的表現(xiàn)。此外,包含更多特征的特征集和包含更少作者的作者組合能帶來更好的結(jié)果。最后,對作者們的一些代表性句子的深入句法分析闡明了... 

【文章來源】:廣東外語外貿(mào)大學廣東省

【文章頁數(shù)】:103 頁

【學位級別】:碩士

【文章目錄】:
ACKNOWLEDGEMENT
ABSTRACT
摘要
LIST OF ABBREVIATIONS
CHAPTER ONE INTRODUCTION
    1.1 RESEARCH TOPIC
    1.2 RATIONALE
    1.3 RESEARCH QUESTIONS
    1.4 ORGANIZATION OF THE THESIS
CHAPTER TWO LITERATURE REVIEW
    2.1 THEORETICAL ASSUMPTION UNDERLYING AUTHORSHIP ATTRIBUTION
    2.2 EMPIRICAL OBSERVATION OF IDIOLECTAL STYLES
    2.3 DEMONSTRATION OF CONSISTENCY AND DISTINCTIVENESS
    2.4 METHODOLOGICAL PROCEDURE FOR FORENSIC AUTHORSHIP ATTRIBUTION
    2.5 THE DAUBERT CRITERIA AND ADMISSIBLE EXPERT EVIDENCE
    2.6 DISCRIMINANT FEATURES PREVIOUSLY IDENTIFIED FOR AUTHORSHIP ATTRIBUTION FOR SHORT TEXTS
CHAPTER THREE THEORETICAL FRAMEWORK
    3.1 TESNIèRE'S DEPENDENCY GRAMMAR
    3.2 DEPENDENCY RELATION AND DEPENDENCY ANALYSIS
CHAPTER FOUR METHODOLOGY
    4.1 ANALYTIC FRAMEWORK
    4.2 ANNOTATION GUIDELINES
    4.3 FEATURES
        4.3.1 MEAN DEPENDENCY DISTANCE
        4.3.2 MEAN HIERARCHICAL DISTANCE
        4.3.3 RELATIVE FREQUENCIES OF EACH DEPENDENCY RELATION TYPE
        4.3.4 SUMMARY OF FEATURES
    4.4 MODEL EVALUATION
    4.5 SAMPLE
    4.6 VARIABLES
CHAPTER FIVE EXPERIMENTS AND RESULTS
    5.1 RESULTS OF THE EXPERIMENTS FOR AUTHOR SET 1
        5.1.1 PATTERNS OF THE FEATURES’ DISCRIMINATING POWER FROM THE PERSPECTIVE OF FEATURE SETS
        5.1.2 PATTERNS OF THE FEATURES’ DISCRIMINATING POWER FROM THE PERSPECTIVE OF AUTHOR COMBINATIONS
    5.2 RESULTS OF THE EXPERIMENTS FOR AUTHOR SET 2
    5.3 SUMMARY
CHAPTER SIX DISCUSSIONS
    6.1 DISCUSSIONS ON THE FEATURES’ DISCRIMINATING POWER FOR AUTHOR SET 1
    6.2 DISCUSSIONS ON THE FEATURES’ DISCRIMINATING POWER FOR AUTHOR SET 2
    6.3 POSSIBLE LINGUISTIC MECHANISM UNDERLYING THE FEATURES’ DISCRIMINATING POWER
    6.4 SUMMARY
CHAPTER SEVEN CONCLUSION
    7.1 MAJOR FINDINGS OF THE PRESENT STUDY
    7.2 LIMITATIONS AND SUGGESTIONS FOR FURTHER RESEARCH
REFERENCES


【參考文獻】:
期刊論文
[1]適應多領域多來源文本的漢語依存句法數(shù)據(jù)標注規(guī)范[J]. 郭麗娟,李正華,彭雪,張民.  中文信息學報. 2018(10)
[2]一起涉案打印文件言語人的同一認定[J]. 王志家,賈玉文,王艷玲,馮明帥.  中國司法鑒定. 2003(01)



本文編號:3489362

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/3489362.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶2aaf5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com