天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

英文語料庫垂直搜索引擎的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-09-04 08:01
   隨著英文學(xué)習(xí)者的數(shù)量急劇增加,對能夠輔助英文學(xué)習(xí)的工具的研究顯得日趨重要。然而英漢兩種語言的思維差異造成了中國學(xué)習(xí)者在英文學(xué)習(xí)中會(huì)碰到很多問題,而且這些問題的類型與母語學(xué)習(xí)者碰到的有很大的不同,例如:介詞誤用、不定冠詞(a與an)誤用等。語料庫搜索系統(tǒng)能夠快速獲得某種語言現(xiàn)象使用的基礎(chǔ)數(shù)據(jù),如相關(guān)詞語搭配、相關(guān)例句、統(tǒng)計(jì)頻度信息等,通過查詢能夠有效解決上述學(xué)習(xí)者碰到的問題,而這是通用的搜索引擎不具備的,因此英文語料庫搜索具有重要的研究意義和實(shí)用價(jià)值。本文的主要工作和貢獻(xiàn)描述如下:1.借助單詞分布式向量表示的優(yōu)勢,本文提出了一種基于詞性的詞向量表示的相似度計(jì)算方法,區(qū)分單詞的詞性并使用不同的向量表示。該方法與MC數(shù)據(jù)集的相關(guān)系數(shù)達(dá)到了0.847(向量維度1600),在詞向量的不同維度上相關(guān)系數(shù)均高于不區(qū)分詞性的單一向量表示方法。同時(shí)在相似詞識別任務(wù)上,該方法在動(dòng)詞上的準(zhǔn)確率要明顯高于單一向量表示方法。2.本文提出了一種融合多特征的詞語相似度計(jì)算方法,利用WordNet和語料庫統(tǒng)計(jì)的相關(guān)特征,通過使用有監(jiān)督的學(xué)習(xí)方法有效的融合多種特征預(yù)測單詞間的相似度。該方法與MC數(shù)據(jù)集的相關(guān)系數(shù)達(dá)到了0.872,高于本文選取的兩種對比方法:基于知識庫的方法和基于語料庫統(tǒng)計(jì)的方法。同時(shí)與Moby thesaurus數(shù)據(jù)集的Top-k平均準(zhǔn)確率實(shí)驗(yàn)結(jié)果也證實(shí)了該方法的有效性。3.本文提出了一種英文語料庫搜索框架,主要包含例句檢索、N-Gram檢索和相似詞檢索,并根據(jù)該框架構(gòu)建了一個(gè)英文語料庫垂直搜索引擎。與傳統(tǒng)的語料庫搜索系統(tǒng)比較,本系統(tǒng)加入了數(shù)據(jù)更新的過程,通過從互聯(lián)網(wǎng)中周期性地抓取相關(guān)網(wǎng)頁并及時(shí)動(dòng)態(tài)的更新語料數(shù)據(jù);同時(shí)在搜索功能上具有區(qū)分單詞不同詞性的例句檢索、能夠限制單詞詞性及命名實(shí)體等屬性的N-Gram檢索和基于語義的相似詞檢索。
【學(xué)位單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2015
【中圖分類】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊堅(jiān)爭;李朝平;;垂直搜索引擎及其應(yīng)用[J];電子商務(wù);2006年10期

2 羅麗姍;;垂直搜索引擎發(fā)展概述[J];圖書館學(xué)研究;2006年12期

3 嚴(yán)宏偉;何俊;;基于房源分析系統(tǒng)的垂直搜索引擎關(guān)鍵技術(shù)的探討[J];中國科技信息;2007年05期

4 胡華梁;何進(jìn);鐘元生;;圖書垂直搜索引擎的設(shè)計(jì)[J];計(jì)算機(jī)與現(xiàn)代化;2007年08期

5 鄭凱明;李義杰;;垂直搜索引擎及其應(yīng)用價(jià)值[J];信息技術(shù);2008年04期

6 畢建濤;霍云福;;垂直搜索引擎贏利模式探討[J];大連大學(xué)學(xué)報(bào);2008年03期

7 許鑫;黃仲清;;垂直搜索引擎應(yīng)用中的若干策略探討——以12580餐飲垂直搜索為例[J];現(xiàn)代圖書情報(bào)技術(shù);2009年02期

8 孔祥春;李義杰;鄭凱明;;垂直搜索引擎應(yīng)用研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2009年07期

9 楊皖蘇;閆冬;;垂直搜索引擎發(fā)展策略探討[J];商業(yè)時(shí)代;2009年23期

10 肖婷;;垂直搜索引擎與旅游行業(yè)探討[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2009年11期

相關(guān)會(huì)議論文 前4條

1 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年

2 林歡歡;王文杰;史忠植;;移動(dòng)環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

3 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

4 毛華揚(yáng);劉衛(wèi);;會(huì)計(jì)信息搜索方法研究[A];第十屆全國會(huì)計(jì)信息化年會(huì)論文集[C];2011年

相關(guān)重要報(bào)紙文章 前10條

1 北大縱橫管理顧問公司高級顧問戴曉東;“商搜”變法 垂直搜索引擎的春天還遠(yuǎn)嗎?[N];中國經(jīng)營報(bào);2006年

2 王艷;垂直搜索引擎市場看好[N];中國旅游報(bào);2000年

3 王靖;賽迪網(wǎng)推出垂直搜索引擎[N];人民日報(bào)海外版;2000年

4 楊國民;國內(nèi)生物醫(yī)藥行業(yè) 垂直搜索引擎誕生[N];經(jīng)濟(jì)日報(bào);2007年

5 本報(bào)記者 王曉雁;垂直搜索引擎著作權(quán)之爭未破題[N];法制日報(bào);2009年

6 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;用開源軟件建垂直搜索引擎[N];計(jì)算機(jī)世界;2010年

7 中新;生意寶推“生意搜”攪局電子商務(wù)搜索市場[N];經(jīng)理日報(bào);2008年

8 源訊 編譯;搜索巨頭的下一步[N];計(jì)算機(jī)世界;2006年

9 賽迪網(wǎng) 方剛;不只是網(wǎng)站才垂直[N];中國計(jì)算機(jī)報(bào);2000年

10 ;沱沱網(wǎng)“亮劍”國際消費(fèi)電子博覽會(huì) 專業(yè)服務(wù)帶來B2B差異化變革[N];中國貿(mào)易報(bào);2007年

相關(guān)博士學(xué)位論文 前5條

1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年

2 吳羽;面向時(shí)間敏感對象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年

3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年

4 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年

5 王桂紅;農(nóng)產(chǎn)品市場價(jià)格web信息分析方法研究[D];沈陽農(nóng)業(yè)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 韓冰;垂直搜索引擎?zhèn)性化推薦研究與應(yīng)用[D];大連理工大學(xué);2009年

2 關(guān)小敏;垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年

3 吳燕瑋;基于行業(yè)知識垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年

4 柳力麗;旅游垂直搜索引擎的品牌傳播研究[D];西南大學(xué);2015年

5 錢永杰;面向網(wǎng)絡(luò)文學(xué)的垂直搜索引擎的研究與實(shí)現(xiàn)[D];曲阜師范大學(xué);2015年

6 袁鳳云;垂直搜索引擎關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年

7 任睿麗;面向旅游業(yè)的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年

8 張高偉;基于ElasticSearch的分布式視頻垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2014年

9 朱鵬;英文語料庫垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2015年

10 李廣麗;垂直搜索引擎的研究與設(shè)計(jì)[D];華東交通大學(xué);2008年



本文編號:2812068

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2812068.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a8234***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com