天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于學(xué)術(shù)論文全文內(nèi)容的算法提及行為與影響力分析研究

發(fā)布時(shí)間:2023-12-09 17:12
  隨著全文數(shù)據(jù)庫(kù)向用戶免費(fèi)開(kāi)放、自然語(yǔ)言處理與機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,基于全文內(nèi)容的文獻(xiàn)計(jì)量與評(píng)價(jià)研究逐漸興起,如知識(shí)實(shí)體抽取與評(píng)價(jià)研究等。算法是一種典型的知識(shí)實(shí)體,在當(dāng)前大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的處理與分析等關(guān)鍵步驟都離不開(kāi)算法的應(yīng)用。研究算法實(shí)體在特定領(lǐng)域?qū)W術(shù)論文中的提及,并在此基礎(chǔ)上分析其影響力,能夠揭示算法實(shí)體在學(xué)術(shù)論文中的分布,發(fā)現(xiàn)高影響力算法,從而為相關(guān)研究者了解和選擇算法提供參考。為此,本文依據(jù)自然語(yǔ)言處理相關(guān)方法與技術(shù),從全文數(shù)據(jù)中抽取出算法實(shí)體,分析其提及頻次、提及位置以及提及時(shí)間,并在此基礎(chǔ)上研究其學(xué)術(shù)影響力。在算法實(shí)體抽取方面,本研究將其看作一種特殊的命名實(shí)體識(shí)別任務(wù)。首先,通過(guò)人工識(shí)別的方法,從全部4,641篇國(guó)際計(jì)算語(yǔ)言學(xué)年會(huì)(ACL)論文中抽取出977種算法實(shí)體并構(gòu)建算法實(shí)體詞列表;其次,通過(guò)算法詞匹配的方法從原始數(shù)據(jù)集中抽取出算法實(shí)體所在的句子,并以此為標(biāo)注語(yǔ)料,訓(xùn)練算法實(shí)體自動(dòng)抽取模型,從全部全文數(shù)據(jù)中剔除標(biāo)注語(yǔ)料,在剩余語(yǔ)料上抽取出51,884個(gè)實(shí)體詞,將頻次為1的結(jié)果剔除后再進(jìn)行人工篩選最終得到221種新算法實(shí)體;最后,將自動(dòng)抽取結(jié)果與人工抽取結(jié)果進(jìn)行整合得...

【文章頁(yè)數(shù)】:101 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
1.緒論
    1.1 研究背景
    1.2 研究意義
        1.2.1 理論意義
        1.2.2 應(yīng)用價(jià)值
    1.3 本研究要解決的關(guān)鍵問(wèn)題
    1.4 主要研究?jī)?nèi)容
    1.5 本文組織結(jié)構(gòu)
2.文獻(xiàn)綜述
    2.1 實(shí)體識(shí)別研究概述
        2.1.1 基于規(guī)則的實(shí)體識(shí)別
        2.1.2 基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的實(shí)體識(shí)別
        2.1.3 基于深度學(xué)習(xí)的實(shí)體識(shí)別
        2.1.4 實(shí)體識(shí)別相關(guān)研究總結(jié)
    2.2 知識(shí)實(shí)體評(píng)價(jià)研究概述
        2.2.1 不同評(píng)價(jià)方法相關(guān)研究概述
        2.2.2 不同類型知識(shí)實(shí)體相關(guān)研究概述
        2.2.3 知識(shí)實(shí)體評(píng)價(jià)相關(guān)研究總結(jié)
    2.3 全文內(nèi)容分析研究概述
        2.3.1 引文內(nèi)容分析研究概述
        2.3.2 知識(shí)抽取研究概述
        2.3.3 全文內(nèi)容分析相關(guān)研究總結(jié)
    2.4 現(xiàn)有研究工作總結(jié)
3.基于學(xué)術(shù)論文全文的算法實(shí)體抽取研究
    3.1 研究思路
    3.2 算法實(shí)體抽取方法描述
        3.2.1 基于人工的算法實(shí)體抽取
        3.2.2 基于機(jī)器學(xué)習(xí)的算法實(shí)體自動(dòng)抽取
        3.2.3 算法實(shí)體自動(dòng)抽取模型中使用的特征
    3.3 實(shí)驗(yàn)與結(jié)果分析
        3.3.1 實(shí)驗(yàn)數(shù)據(jù)概述
        3.3.2 實(shí)驗(yàn)標(biāo)注語(yǔ)料構(gòu)建
        3.3.3 結(jié)果評(píng)價(jià)指標(biāo)
        3.3.4 模型實(shí)現(xiàn)
        3.3.5 結(jié)果分析
    3.4 ACL未標(biāo)注語(yǔ)料上的算法實(shí)體自動(dòng)抽取結(jié)果分析
        3.4.1 算法實(shí)體自動(dòng)抽取過(guò)程
        3.4.2 算法實(shí)體自動(dòng)抽取結(jié)果
    3.5 本章小結(jié)
4.基于頻次的算法提及行為與影響力分析
    4.1 研究思路與數(shù)據(jù)概述
        4.1.1 研究思路
        4.1.2 數(shù)據(jù)概述
    4.2 算法實(shí)體提及頻次結(jié)果分析
        4.2.1 提及論文數(shù)
        4.2.2 提及總次數(shù)
    4.3 基于提及頻次的算法影響力分析
    4.4 本章小結(jié)
5.基于位置的算法提及行為與影響力分析
    5.1 研究思路
    5.2 算法實(shí)體提及位置信息獲取
    5.3 全部章節(jié)中的算法實(shí)體提及分析
    5.4 重點(diǎn)章節(jié)中的算法實(shí)體提及分析
    5.5 基于位置的算法實(shí)體影響力分析
    5.6 本章小結(jié)
6.基于時(shí)間的算法提及行為與影響力分析
    6.1 研究思路與數(shù)據(jù)概述
        6.1.1 研究思路
        6.1.2 數(shù)據(jù)概述
    6.2 算法實(shí)體整體提及時(shí)間分析
    6.3 高頻算法實(shí)體在不同時(shí)間下的提及分析
    6.4 基于時(shí)間的算法實(shí)體影響力分析
    6.5 本章小結(jié)
7.結(jié)論與未來(lái)展望
    7.1 研究總結(jié)
    7.2 研究創(chuàng)新點(diǎn)
    7.3 研究不足與未來(lái)展望
致謝
參考文獻(xiàn)
附錄1:人工抽取與機(jī)器抽取所得的全部算法實(shí)體(Top100)
附錄2:攻讀碩士學(xué)位期間發(fā)表論文、參與科研項(xiàng)目及獲獎(jiǎng)情況



本文編號(hào):3871880

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3871880.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ac3da***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com