天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

文獻(xiàn)被引片段特征分析與識別研究

發(fā)布時間:2017-12-28 03:35

  本文關(guān)鍵詞:文獻(xiàn)被引片段特征分析與識別研究 出處:《數(shù)據(jù)分析與知識發(fā)現(xiàn)》2017年11期  論文類型:期刊論文


  更多相關(guān)文章: 被引片段 識別方法 引文上下文 引用對象


【摘要】:【目的】對科技文獻(xiàn)領(lǐng)域的被引片段概念的特征進(jìn)行分析,并比較不同識別方法效果的差異!痉椒ā恳訡L-Sci Summ 2016比賽被引片段標(biāo)注數(shù)據(jù)為例,探索被引片段長度、位置與重要性特征,并分析與其對應(yīng)引文上下文在長度和位置上的相關(guān)性。之后以基于詞袋模型、主題模型、Word Net語義詞典的相似性算法為例,比較這些方法在被引片段識別中的效果差異!窘Y(jié)果】研究結(jié)果發(fā)現(xiàn):被標(biāo)注的被引片段有96%少于三句,且更多地出現(xiàn)在文章前部和章節(jié)內(nèi)的前部分,被引片段的Text Rank權(quán)重均值顯著高于其他片段;被引片段與引文上下文在長度上顯著相關(guān),但在出現(xiàn)位置上相關(guān)性不明顯;無論從MMR?還是句子與詞匯層面的匹配度來看,基于詞袋模型的識別方法效果均優(yōu)于基于語義詞典的方法,而后者明顯優(yōu)于基于主題模型的方法!揪窒蕖繉τ诒灰胃拍钆c特性的分析只停留在理論層面,對其特征的分析與有關(guān)識別方法的比較也只是在CL-Sci Summ 2016被引片段標(biāo)注數(shù)據(jù)上進(jìn)行的!窘Y(jié)論】科技文獻(xiàn)的用詞比較規(guī)范嚴(yán)謹(jǐn),所以詞匯特征在被引片段的識別過程中起到關(guān)鍵的作用。
[Abstract]:[Objective] to analyze the characteristics of the concept of cited fragments in the field of scientific and technological literature, and to compare the differences of the effect of different recognition methods. [Methods] taking the tagged data of CL-Sci Summ 2016 competition as an example, we explored the length, location and importance of the cited fragment, and analyzed the relevance between the corresponding context and its length and location. Then, based on the similarity algorithm of word bag model, topic model and Word Net semantic dictionary, we compare the effectiveness of these methods in the recognition of induced fragments. [result] the results showed that: labeled cited are 96% less than three, and more appear in the front part of the front and the section within the Text Rank weighted average citation fragment was significantly higher than that in other segments; cited and citation context fragments significantly correlated in length, but in the position correlation is not obvious; no matter from MMR? Or sentence and word level matching degree, the effect of recognition method based on bag of words model was better than the method based on semantic dictionary, the latter is obviously better than the method based on topic model. [limitations] the analysis of the concept and characteristics of the cited part stays at the theoretical level only. The comparison of its characteristics and the related recognition methods is only carried out on the tagged data of CL-Sci Summ 2016. [Conclusion] the use of words in scientific literature is more rigorous, so lexical features play a key role in the identification of the cited fragments.
【作者單位】: 武漢大學(xué)信息資源研究中心;華中師范大學(xué)信息管理學(xué)院;
【分類號】:G353.1
【正文快照】: 1引言文獻(xiàn)的被引頻次從一定程度上反映了其對學(xué)術(shù)界的貢獻(xiàn)與影響。然而,被引頻次僅能說明文獻(xiàn)整體的影響力與價值,只有對引用行為進(jìn)行更深入的分析才能揭示被引文獻(xiàn)內(nèi)部對學(xué)界有影響力的那部分內(nèi)容。隨著學(xué)術(shù)論文全文獲取難度的降低,引文上下文(Citation Context)的識別與抽取,

本文編號:1344441

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/1344441.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b7b90***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
真实国产乱子伦对白视频不卡| 日本午夜乱色视频在线观看| 国产亚洲二区精品美女久久| 亚洲一区二区三区精选| 国产精品色热综合在线| 欧美野外在线刺激在线观看| 国产欧美日韩视频91| 精品国产亚洲av成人一区| 正在播放玩弄漂亮少妇高潮| 日韩一区二区三区在线日| 最近最新中文字幕免费| 亚洲二区欧美一区二区| 国产一级不卡视频在线观看| 久久精品国产亚洲av麻豆尤物| 欧美日韩最近中国黄片| 国产午夜精品福利免费不| 欧美午夜一级特黄大片| 女厕偷窥一区二区三区在线| 狠狠干狠狠操在线播放| 成人精品日韩专区在线观看| 国产一区一一一区麻豆| 国产视频一区二区三区四区| 国产精品蜜桃久久一区二区| 成人精品视频一区二区在线观看| 最近中文字幕高清中文字幕无| 日本午夜免费观看视频| 国产免费操美女逼视频| 果冻传媒在线观看免费高清| 少妇激情在线免费观看| 成人区人妻精品一区二区三区| 国产剧情欧美日韩中文在线| 好吊日在线观看免费视频| 91久久国产福利自产拍| 亚洲国产成人一区二区在线观看| 在线免费看国产精品黄片| 嫩呦国产一区二区三区av| 色哟哟在线免费一区二区三区| 国产女高清在线看免费观看| 字幕日本欧美一区二区| 久热99中文字幕视频在线| 欧美色欧美亚洲日在线|