蔬菜種植信息語料庫構(gòu)建方法的分析與設計
發(fā)布時間:2019-09-28 19:42
【摘要】:語料庫是用于語言學研究的數(shù)據(jù)庫,小型語料庫具有目標明確、語料收集針對性強、語料可更新、標注靈活等特點,在各個專業(yè)領域的應用日益增多。為了滿足蔬菜種植科普、科研、生產(chǎn)實踐及教學中對語料及技術信息的需求,建設一個蔬菜種植信息小型語料庫提供各種語料檢索具有現(xiàn)實意義。給出了蔬菜種植信息語料庫的語料收集、標注和檢索系統(tǒng)的設計實現(xiàn)過程,該語料庫能以多種方式快速檢索所需的蔬菜種植信息。首先,對一些著名的大型語料庫和當前出現(xiàn)的一些專用小型語料庫研究現(xiàn)狀進行了介紹、分析和總結(jié),對蔬菜種植信息語料庫的構(gòu)建以及未來的發(fā)展趨勢進行了展望,對語料庫建設的各個步驟分別進行了介紹和分析,在此基礎上確定了蔬菜種植信息語料庫的建設步驟。其次,選取國內(nèi)大型的農(nóng)業(yè)信息網(wǎng)站——中國蔬菜網(wǎng),對其中的蔬菜種植信息語料進行了收集,先利用八爪魚采集器對網(wǎng)站的蔬菜種植相關信息進行自動收集,再人工對收集到的語料進行篩選,得到適合本語料庫需要的各種文檔,并進行相應的預處理修改錯字和不齊全的文檔。然后,選擇TEI標注模式對收集到的蔬菜種植信息語料進行標注,在對蔬菜種類、蔬菜種植技術分類和賦碼的基礎上,對語料庫每篇文檔的篇頭給出了主題詞、蔬菜種類、蔬菜種植技術的標注,對文檔篇體給出了關鍵詞、詞語、詞性的標注。最后,對蔬菜種植信息語料庫的檢索系統(tǒng)進行了分析和設計。根據(jù)蔬菜種植信息的實際檢索需要,確定蔬菜種植信息語料庫所需的具體檢索類型包括主題詞檢索、蔬菜分類種植技術分類檢索、關鍵詞檢索、全文檢索,設計了檢索系統(tǒng)所需要的索引數(shù)據(jù)庫,在此基礎上給出了各種類型檢索的具體實現(xiàn)方法,最終設計出蔬菜種植信息語料庫的檢索系統(tǒng)。實驗證明蔬菜種植信息語料庫檢索系統(tǒng)能夠快速檢索各種語料,具有較高的查準率和查全率,可以滿足蔬菜種植研究、教學、生產(chǎn)勞動中對蔬菜種植信息的檢索需求。
【圖文】:
邐第三章蔬菜種植信息語料庫語料收集和篩選邐逡逑集相應的數(shù)據(jù)。逡逑2.設置基本信息以中國蔬菜網(wǎng)為例,任務名為中國蔬菜網(wǎng)(錯誤!超鏈接引逡逑用無效。),,任務組為蔬菜,備注信息可以任意選擇,比如技術。逡逑3.設定采集流程從左邊的工具條中拖動“打開網(wǎng)頁”,將會看到設定要逡逑打開的網(wǎng)址(例如:中國蔬菜網(wǎng)http://www.vegnet.com.cn/),八爪魚米集器會在頁面逡逑下方的瀏覽器中模擬完成此步驟。逡逑4.最終采集結(jié)果至此,基本配置完成,最終采集到的數(shù)據(jù),如圖3-2所逡逑7K邋0逡逑緩蒹技術文意列表邐在中枿菜A技術庳中,共找到咖9條|Y粢技米交章逡逑
【學位授予單位】:河北科技師范學院
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:S63;S-0
本文編號:2543469
【圖文】:
邐第三章蔬菜種植信息語料庫語料收集和篩選邐逡逑集相應的數(shù)據(jù)。逡逑2.設置基本信息以中國蔬菜網(wǎng)為例,任務名為中國蔬菜網(wǎng)(錯誤!超鏈接引逡逑用無效。),,任務組為蔬菜,備注信息可以任意選擇,比如技術。逡逑3.設定采集流程從左邊的工具條中拖動“打開網(wǎng)頁”,將會看到設定要逡逑打開的網(wǎng)址(例如:中國蔬菜網(wǎng)http://www.vegnet.com.cn/),八爪魚米集器會在頁面逡逑下方的瀏覽器中模擬完成此步驟。逡逑4.最終采集結(jié)果至此,基本配置完成,最終采集到的數(shù)據(jù),如圖3-2所逡逑7K邋0逡逑緩蒹技術文意列表邐在中枿菜A技術庳中,共找到咖9條|Y粢技米交章逡逑
【學位授予單位】:河北科技師范學院
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:S63;S-0
【相似文獻】
相關碩士學位論文 前10條
1 鄭婧婧;蔬菜種植信息語料庫構(gòu)建方法的分析與設計[D];河北科技師范學院;2017年
2 張偉;基于語料庫的量詞“對、雙、副”研究[D];華中師范大學;2017年
3 曾卿;語料庫視野下的現(xiàn)代漢語心理動作義場代表詞義項分布研究[D];廣西大學;2017年
4 余韻;巴金前后期小說的計量風格學研究[D];華中師范大學;2017年
5 謝維靈(ALVINA);基于語料庫的漢語中介語“動+賓”搭配考察[D];華中師范大學;2017年
6 張衡;文本語料庫的精煉研究[D];東北師范大學;2017年
7 趙鵬飛;語料庫資源在初中英語詞匯教學中的應用[D];上海師范大學;2017年
8 陳鵬;基于詞向量與可比語料庫的雙語詞典抽取算法研究[D];華中師范大學;2017年
9 王星星;基于語料庫的中國英語專業(yè)大學生口語套語使用研究[D];上海師范大學;2017年
10 李艷紅;基于語料庫的英美新聞報道的批評話語分析[D];廣西大學;2017年
本文編號:2543469
本文鏈接:http://sikaile.net/kejilunwen/nykj/2543469.html
最近更新
教材專著