基于語義擴(kuò)展的句子相似度算法
本文關(guān)鍵詞:基于語義擴(kuò)展的句子相似度算法
更多相關(guān)文章: 句子相似度計算 語義擴(kuò)展 主題模型 特征提取 搜索引擎
【摘要】:現(xiàn)有的句子相似度計算方法僅考慮句子的依存關(guān)系或者組成句子的詞性、詞序、詞義等信息,沒有考慮到整個句子的語義信息,文章提出了一種基于語義擴(kuò)展的句子相似度計算方法,解決了句子相似度計算時忽略句子語義的問題。利用搜索引擎對句子語義擴(kuò)展,從而將簡短的句子轉(zhuǎn)化為長文本,然后使用主題模型對長文本進(jìn)行特征提取,即將句子的相似度計算轉(zhuǎn)化為求兩個句子的語義間的差別運(yùn)算。實驗結(jié)果表明,基于語義擴(kuò)展的句子相似度計算準(zhǔn)確率能達(dá)到87%,而且計算結(jié)果符合常識判斷。
【作者單位】: 西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院;DOCOMO
【關(guān)鍵詞】: 句子相似度計算 語義擴(kuò)展 主題模型 特征提取 搜索引擎
【基金】:國家自然科學(xué)基金(No.61170111;61262058)
【分類號】:TP391.1
【正文快照】: 0引言句子相似度計算是自然語言處理領(lǐng)域中比較基礎(chǔ)而重要的研究課題,它在現(xiàn)實中有廣泛的應(yīng)用。在信息檢索領(lǐng)域,句子相似度計算方法用來對檢索結(jié)果進(jìn)行排序。在問答系統(tǒng)領(lǐng)域,需要使用相似度方法對用戶所提問題和系統(tǒng)知識庫中的問題進(jìn)行比較,找到問題的最佳匹配從而返回最佳答
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 李彬,劉挺,秦兵,李生;基于語義依存的漢語句子相似度計算[J];計算機(jī)應(yīng)用研究;2003年12期
2 張奇,黃萱菁,吳立德;一種新的句子相似度度量及其在文本自動摘要中的應(yīng)用[J];中文信息學(xué)報;2005年02期
3 李茹;王智強(qiáng);李雙紅;梁吉業(yè);Collin Baker;;基于框架語義分析的漢語句子相似度計算[J];計算機(jī)研究與發(fā)展;2013年08期
4 吳佐衍;王宇;;基于HNC理論和依存句法的句子相似度計算[J];計算機(jī)工程與應(yīng)用;2014年03期
5 殷耀明;張東站;;基于關(guān)系向量模型的句子相似度計算[J];計算機(jī)工程與應(yīng)用;2014年02期
6 陳海燕;;基于搜索引擎的詞匯語義相似度計算方法[J];計算機(jī)科學(xué);2015年01期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊松;樓新遠(yuǎn);;基于向量空間模型附加詞義特征的句子相似度研究[J];成都信息工程學(xué)院學(xué)報;2012年03期
2 楊思春;;一種改進(jìn)的句子相似度計算模型[J];電子科技大學(xué)學(xué)報;2006年06期
3 樊勇;鄭家恒;;基于主題的網(wǎng)頁去重[J];電腦開發(fā)與應(yīng)用;2008年04期
4 趙巾幗;徐德智;羅慶云;;漢語句子相似度計算方法比對之研究[J];福建電腦;2007年10期
5 蔡月紅;朱倩;程顯毅;楊天明;;基于句義三維模型的漢語句子相似度計算[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2009年01期
6 毛煜;余正濤;孟祥燕;張志坤;許洋波;郭劍毅;;中文問答對過濾方法研究[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2009年03期
7 劉漢興;劉財興;林旭東;;基于問句相似度的本體問答系統(tǒng)[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2010年01期
8 張達(dá)夫;;基于依存關(guān)系匹配的長難查詢處理[J];電腦知識與技術(shù);2012年19期
9 吳云芳;石靜;萬富強(qiáng);呂學(xué)強(qiáng);;漢語并列復(fù)句的自動識別方法[J];北京大學(xué)學(xué)報(自然科學(xué)版);2013年01期
10 馬彬;洪宇;楊雪蓉;姚建民;朱巧明;;基于語義依存線索的事件關(guān)系識別方法研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2013年01期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 趙妍妍;秦兵;劉挺;張俐;蘇中;;基于多特征融合的句子相似度計算[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
2 菅小艷;鄭家恒;;一種改進(jìn)的句子相似度計算方法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
3 劉寶艷;林鴻飛;楊志豪;;基于改進(jìn)編輯距離和依存結(jié)構(gòu)的句子相似度計算[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
4 宋彥;張桂平;蔡東風(fēng);;基于N-gram的句子相似度計算技術(shù)[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
5 李國華;昝紅英;;基于語句相似度的網(wǎng)頁標(biāo)題抽取方法[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 單建芳;面向事件的文本表示研究[D];上海大學(xué);2012年
2 謝能付;基于語義Web技術(shù)的知識融合和同步方法研究[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2006年
3 李輝;移動商務(wù)導(dǎo)購系統(tǒng)的研究[D];大連理工大學(xué);2008年
4 劉剛;面向領(lǐng)域的軟件需求一致性驗證方法研究[D];哈爾濱工程大學(xué);2008年
5 蔣昌金;基于關(guān)鍵詞提取的中文網(wǎng)頁自動文摘方法研究[D];華南理工大學(xué);2010年
6 張冬梅;文本情感分類及觀點摘要關(guān)鍵問題研究[D];山東大學(xué);2012年
7 李茹;漢語句子框架語義結(jié)構(gòu)分析技術(shù)研究[D];山西大學(xué);2012年
8 江會星;漢語命名實體識別研究[D];北京郵電大學(xué);2012年
9 任函;文本蘊(yùn)涵識別及其在問答系統(tǒng)中的應(yīng)用[D];武漢大學(xué);2011年
10 孫月萍;基于全信息的社區(qū)問答系統(tǒng)研究[D];北京郵電大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 耿倩;基于文本相似度計算的文本聚類算法研究與實現(xiàn)[D];哈爾濱工程大學(xué);2010年
2 王森;基于主題樹的自上而下文本復(fù)制檢測研究[D];大連理工大學(xué);2010年
3 孔勝;文本資源的知識抽取研究[D];大連理工大學(xué);2010年
4 徐美霞;基于web技術(shù)的網(wǎng)上考試系統(tǒng)[D];中國海洋大學(xué);2010年
5 金璐鈺;基于框架的事件抽取關(guān)鍵技術(shù)研究[D];蘇州大學(xué);2010年
6 樊春雷;基于語義分析的糖尿病健康教育系統(tǒng)研究與實現(xiàn)[D];華東理工大學(xué);2011年
7 王鳳林;受限域問答式自然語言數(shù)據(jù)庫查詢研究[D];昆明理工大學(xué);2010年
8 孟祥燕;問答對自動獲取的研究[D];昆明理工大學(xué);2008年
9 王冬嬌;改進(jìn)的語句相似度算法在問答系統(tǒng)中的應(yīng)用研究[D];大連交通大學(xué);2010年
10 陳帥;自然語言理解中介詞管界處理及其在機(jī)械產(chǎn)品設(shè)計領(lǐng)域的應(yīng)用[D];西安電子科技大學(xué);2011年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 呂學(xué)強(qiáng),任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學(xué)學(xué)報;2003年06期
2 楊思春;;一種改進(jìn)的句子相似度計算模型[J];電子科技大學(xué)學(xué)報;2006年06期
3 郭艷華,周昌樂;一種漢語語句依存關(guān)系網(wǎng)協(xié)動生成方法研究[J];杭州電子工業(yè)學(xué)院學(xué)報;2000年04期
4 李素建;基于語義計算的語句相關(guān)度研究[J];計算機(jī)工程與應(yīng)用;2002年07期
5 裴婧;包宏;;漢語句子相似度計算在FAQ中的應(yīng)用[J];計算機(jī)工程;2009年17期
6 趙軍;金千里;徐波;;面向文本檢索的語義計算[J];計算機(jī)學(xué)報;2005年12期
7 李彬,劉挺,秦兵,李生;基于語義依存的漢語句子相似度計算[J];計算機(jī)應(yīng)用研究;2003年12期
8 葛斌;李芳芳;郭絲路;湯大權(quán);;基于知網(wǎng)的詞匯語義相似度計算方法研究[J];計算機(jī)應(yīng)用研究;2010年09期
9 鄭實福,劉挺,秦兵,李生;自動問答綜述[J];中文信息學(xué)報;2002年06期
10 張奇,黃萱菁,吳立德;一種新的句子相似度度量及其在文本自動摘要中的應(yīng)用[J];中文信息學(xué)報;2005年02期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 車萬翔;劉挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然語言理解與機(jī)器翻譯——全國第六屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2001年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張睿;;基于語義擴(kuò)展的醫(yī)學(xué)文獻(xiàn)檢索平臺的設(shè)計與實現(xiàn)[J];中華醫(yī)學(xué)圖書情報雜志;2012年11期
2 寧琳;;一種基于語義擴(kuò)展的跨語言自動檢索方法的設(shè)計[J];現(xiàn)代情報;2014年01期
3 劉端陽;王良芳;;結(jié)合語義擴(kuò)展度和詞匯鏈的關(guān)鍵詞提取算法[J];計算機(jī)科學(xué);2013年12期
4 王玉紅;王東;;查詢請求的語義擴(kuò)展研究[J];福建電腦;2009年09期
5 錢程;陽小蘭;;基于語義擴(kuò)展的網(wǎng)頁標(biāo)簽推薦系統(tǒng)[J];計算機(jī)工程與科學(xué);2012年10期
6 陳萍秀;;基于語義擴(kuò)展搜索的圖書館服務(wù)研究[J];圖書與情報;2013年04期
7 尤佳莉;王勁林;;基于語義擴(kuò)展的P2P網(wǎng)絡(luò)[J];微計算機(jī)應(yīng)用;2008年11期
8 黃磊;馬秀麗;王紅霞;;服務(wù)描述語言O(shè)WL-S的動態(tài)語義擴(kuò)展技術(shù)研究[J];沈陽理工大學(xué)學(xué)報;2011年05期
9 孫霞,鄭慶華;教育資源元數(shù)據(jù)語義擴(kuò)展查找方法的研究[J];計算機(jī)研究與發(fā)展;2004年12期
10 張正;左春;王裕國;;基于語義擴(kuò)展的Web服務(wù)發(fā)現(xiàn)方法[J];通信學(xué)報;2007年01期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 李玲;;語言運(yùn)用中的思維方式與語義擴(kuò)展[A];新世紀(jì)優(yōu)秀學(xué)術(shù)成果評選暨交流大會論文集[C];2000年
2 陳彥萍;朱曉戰(zhàn);;基于OWL-S的JUDDIV3語義擴(kuò)展[A];CCF NCSC 2011——第二屆中國計算機(jī)學(xué)會服務(wù)計算學(xué)術(shù)會議論文集[C];2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 鄧霖;英語人體名詞語義擴(kuò)展的認(rèn)知研究[D];西南大學(xué);2013年
2 王卓君;漢語新義詞語義擴(kuò)展的認(rèn)知機(jī)制[D];北京林業(yè)大學(xué);2008年
3 王文聰;基于本體的知識庫語義擴(kuò)展搜索方法的研究與實現(xiàn)[D];北京化工大學(xué);2012年
4 宋蕓;認(rèn)知視角下英漢Soft/“軟”的語義擴(kuò)展研究[D];華中師范大學(xué);2013年
5 袁文恒;基于語義擴(kuò)展的垂直選擇系統(tǒng)的研究與實現(xiàn)[D];東北大學(xué);2011年
6 朱緒芹;關(guān)于日語“墜る”和漢語“看”的語義擴(kuò)展模式[D];山東大學(xué);2007年
7 周欣藝;基于認(rèn)知語言學(xué)視角下的「いく」和「くる」的語義擴(kuò)展研究[D];遼寧師范大學(xué);2014年
8 程國斌;基于指示詞語義擴(kuò)展的詞義識別方法的研究[D];哈爾濱工程大學(xué);2010年
9 何琴;動詞“見る”和“看”的日中對比研究[D];福建師范大學(xué);2008年
10 羅凱;認(rèn)知“ふく”及相關(guān)動詞的語義擴(kuò)展模式[D];東北林業(yè)大學(xué);2013年
,本文編號:658455
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/658455.html