天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 論文百科 > 食品論文 >

基于VSM的科技期刊文獻與專利文獻的相似度計算方法研究

發(fā)布時間:2017-09-04 07:23

  本文關(guān)鍵詞:基于VSM的科技期刊文獻與專利文獻的相似度計算方法研究


  更多相關(guān)文章: 自然語言處理 TF-IDF 向量空間模型 科技期刊 專利 相似度


【摘要】:文本相似度的計算方法以采用TF-IDF的方法對文本建模成詞頻向量空間模型(VSM)為主,本文結(jié)合科技期刊文獻和專利文獻特點,對TF-IDF的計算方法進行了改進,將詞頻的統(tǒng)計改進為科技術(shù)語的頻率統(tǒng)計,提出了一種針對科技文獻相似度的計算方法,該方法首先應(yīng)用自然語言處理技術(shù)對科技文獻進行預(yù)處理,采用科技術(shù)語的自動抽取方法進行科技文獻術(shù)語的自動抽取,結(jié)合該文提出的術(shù)語權(quán)重計算公式構(gòu)建向量空間模型,來計算科技期刊文獻和專利文獻之間的相似度。并利用真實有效的科學(xué)期刊和文獻數(shù)據(jù)進行實驗測試,實驗結(jié)果表明文中提出的方法優(yōu)于傳統(tǒng)的TF-IDF計算方法。
【作者單位】: 中國科學(xué)技術(shù)信息研究所;
【關(guān)鍵詞】自然語言處理 TF-IDF 向量空間模型 科技期刊 專利 相似度
【基金】:國家社會科學(xué)基金項目(項目編號:14BTQ038) 中國科學(xué)技術(shù)信息研究所科研項目預(yù)研資金項目(項目編號:YY2016-08)的支持
【分類號】:TP391.1
【正文快照】: 1 引言 國家和政府對科技文獻數(shù)據(jù)資源的建設(shè)非常重視,2012年1月30日劉延?xùn)|同志視察中國科學(xué)技術(shù)信息研究所時強調(diào),加快科技信息事業(yè)發(fā)展,既是應(yīng)對日益激烈的國際競爭、實現(xiàn)創(chuàng)新驅(qū)動的迫切要求,也是提高我國科技改革發(fā)展的基礎(chǔ)水平和創(chuàng)新能力的客觀需要。如何幫助用戶全面、

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 蔡東風(fēng);白宇;于水;葉娜;任曉娜;;一種基于語境的詞語相似度計算方法[J];中文信息學(xué)報;2010年03期

2 丁政建;張路;;一種改進的本體相似度計算方法[J];計算機工程;2010年24期

3 朱珍元;鄭誠;;一種改進的本體相似度計算方法[J];微型機與應(yīng)用;2011年01期

4 崔韜世;麥范金;;詞語相似度計算方法分析[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2012年05期

5 王國春;鄭山紅;趙輝;董亞則;;基于階段遞進的綜合本體相似度計算方法[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2014年02期

6 張忠平;田淑霞;劉洪強;;一種新的本體相似度計算方法[J];計算機應(yīng)用研究;2008年10期

7 趙歡;李仁發(fā);王家琴;張在美;;綜合多層信息的本體概念相似度計算方法的研究[J];通信學(xué)報;2009年06期

8 李改;李章鳳;李磊;;一種新的社會化相似度計算方法[J];計算機應(yīng)用研究;2013年09期

9 曾輝;徐海洲;鐘茂生;;基于主題和焦點的問句相似度計算方法[J];科學(xué)技術(shù)與工程;2014年06期

10 張忠平;田淑霞;劉洪強;;一種綜合的本體相似度計算方法[J];計算機科學(xué);2008年12期

中國重要會議論文全文數(shù)據(jù)庫 前8條

1 白宇;于水;葉娜;蔡東風(fēng);任曉娜;;一種基于語境的詞語相似度計算方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

2 喬林;黃維通;孟威;;一種改進的知網(wǎng)系統(tǒng)詞語相似度計算方法[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

3 菅小艷;鄭家恒;;一種改進的句子相似度計算方法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年

4 盧延科;尹寶生;張桂平;苗雪雷;白宇;;基于偽LCS的中文專利句子相似度計算方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

5 章志凌;虞立群;羅海飛;邵曉敏;;基于改進Corpus庫的詞語相似度計算方法[A];第二十四屆中國控制會議論文集(下冊)[C];2005年

6 章成志;李斌;;基于混合策略的查詢串相似度計算方法[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

7 陳希友;馮少榮;張東站;薛永生;;基于反饋的用戶訪問預(yù)測模型[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(一)[C];2008年

8 李天寧;肖桐;朱靖波;;科技論文的IPC自動標注[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 吳小坤;輕量級服務(wù)推薦算法研究[D];北京郵電大學(xué);2015年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 唐積益;推薦系統(tǒng)中相似度計算方法的研究[D];江蘇科技大學(xué);2015年

2 張廣源;微博檢索系統(tǒng)關(guān)鍵技術(shù)研究與實現(xiàn)[D];北京工業(yè)大學(xué);2015年

3 尹路修;XML文檔的聚類研究[D];湖南師范大學(xué);2015年

4 鄒能清;一種基于語義網(wǎng)絡(luò)的中文文本相似度計算方法[D];湘潭大學(xué);2015年

5 陳欣;一種基于多屬性本體的概念相似度計算方法的研究[D];東北師范大學(xué);2010年

6 唐中林;基于本體的概念相似度計算方法的研究[D];武漢理工大學(xué);2013年

7 徐海洲;自動問答系統(tǒng)中問句相似度計算方法研究[D];華東交通大學(xué);2014年

8 王瑩瑩;中文短語相似度計算方法研究及應(yīng)用[D];長沙理工大學(xué);2008年

9 俞云飛;多特征融合的電影相似度計算方法研究[D];華東師范大學(xué);2012年

10 周舫;漢語句子相似度計算方法及其應(yīng)用的研究[D];河南大學(xué);2005年



本文編號:790125

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenshubaike/jieribaike/790125.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b9277***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com