因果推理類地理試題解答方法研究
本文關(guān)鍵詞:因果推理類地理試題解答方法研究
更多相關(guān)文章: 自動(dòng)答題系統(tǒng) 高中地理 文本分類 知識(shí)推理 序列標(biāo)注
【摘要】:隨著計(jì)算機(jī)技術(shù)的不斷提升,用戶對(duì)信息資源的獲取方式由最初的黃頁(yè)目錄到搜索引擎,再由傳統(tǒng)的問(wèn)答系統(tǒng)到個(gè)人智能助手,然而這些系統(tǒng)都主要是對(duì)事實(shí)類問(wèn)題的查詢。用戶已經(jīng)逐漸不滿足于簡(jiǎn)單的答案檢索,而是期望計(jì)算機(jī)系統(tǒng)理解自己的意圖并能進(jìn)行邏輯推理。近年來(lái),國(guó)內(nèi)外學(xué)術(shù)機(jī)構(gòu)開始著力于研究類人計(jì)算推理技術(shù),如日本啟動(dòng)的通過(guò)大學(xué)入學(xué)考試機(jī)器人項(xiàng)目。因此,考試試題的自動(dòng)答題技術(shù)已成為國(guó)內(nèi)外的研究熱點(diǎn),有助于推動(dòng)自動(dòng)問(wèn)答系統(tǒng)領(lǐng)域的進(jìn)步。本課題研究目的是構(gòu)建能夠自動(dòng)解答高中地理因果推理類試題問(wèn)題的系統(tǒng)。本課題的主要研究?jī)?nèi)容包括高中地理試題的分析、基于分類模型的解題方法、基于知識(shí)推理的解題方法。目前國(guó)內(nèi)暫時(shí)沒有成熟的面向高中考試的自動(dòng)答題技術(shù)研究,本課題首先對(duì)高中地理試題進(jìn)行了分類分析,結(jié)合因果推理類實(shí)際試題給出其形式化定義并分析了通用的推理方式。然后,本課題采用基于分類的解題方法,通過(guò)將原試題轉(zhuǎn)換為多個(gè)是非子問(wèn)題,利用文本分類模型對(duì)這些子問(wèn)題進(jìn)行判斷。因詞向量模型能夠表達(dá)潛在的語(yǔ)義信息,本課題使用詞向量表示子問(wèn)題的文本特征,利用支持向量機(jī)對(duì)其進(jìn)行分類并得到問(wèn)題答案。最后,因地理試題依據(jù)考察知識(shí)點(diǎn)可以分為不同類,對(duì)于每類試題其問(wèn)題描述中存在關(guān)鍵信息與答案對(duì)應(yīng),本課題先后通過(guò)語(yǔ)言模型和實(shí)體識(shí)別技術(shù)抽取問(wèn)題的關(guān)鍵信息,利用知識(shí)推理規(guī)則庫(kù)進(jìn)行相似匹配計(jì)算并推理出答案。其中,后者采用序列標(biāo)注模型進(jìn)行實(shí)體識(shí)別處理,更能準(zhǔn)確提取問(wèn)題關(guān)鍵信息,獲得了良好的效果。本課題的實(shí)驗(yàn)語(yǔ)料主要來(lái)自于高考地理試題、模擬試題、高中地理教材、地理類百度百科詞條以及維基百科中文詞條。使用基于分類模型的解題方法分別在地理高考題和模擬題上測(cè)試得到了平均0.344、0.329的正確率,使用基于知識(shí)推理的解題方法在地理工業(yè)區(qū)位因素類試題上的平均正確率為0.652,這兩類方法都明顯優(yōu)于基于檢索策略方法的平均正確率0.261。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 唐曉文;基于本體論的文本特征提取[J];電腦與信息技術(shù);2005年01期
2 陳炯;張永奎;;一種基于詞聚類的文本特征描述方法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2011年02期
3 陳振亞;陳光輝;徐建民;;一種基于本體的文本特征選取方法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
4 平源;周亞建;張海濱;王樅;楊義先;;強(qiáng)化類別貢獻(xiàn)的文本特征權(quán)重方案[J];北京工業(yè)大學(xué)學(xué)報(bào);2012年09期
5 楊棉絨;;基于文本特征的信息隱藏策略[J];新鄉(xiāng)學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年04期
6 余剛,陳華月,朱征宇,高原;基于詞同現(xiàn)頻率的文本特征描述[J];計(jì)算機(jī)工程與設(shè)計(jì);2005年08期
7 林永民;朱衛(wèi)東;;基尼指數(shù)在文本特征選擇中的應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用;2007年10期
8 廖浩;李志蜀;王秋野;張意;;基于詞語(yǔ)關(guān)聯(lián)的文本特征詞提取方法[J];計(jì)算機(jī)應(yīng)用;2007年12期
9 林東文;白清源;謝麗聰;謝伙生;張瑩;;一種基于本體論的文本特征選取方法[J];計(jì)算機(jī)科學(xué);2008年03期
10 褚力;張世永;;基于集成合并的文本特征提取方法[J];計(jì)算機(jī)應(yīng)用與軟件;2008年10期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前4條
1 王錦;王會(huì)珍;張俐;;基于維基百科類別的文本特征表示[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
2 孔維澤;劉奕群;張敏;馬少平;;問(wèn)答社區(qū)中回答質(zhì)量的評(píng)價(jià)方法研究[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
3 朱祥玉;侯德文;陳希;;基于雙重評(píng)估函數(shù)的文本特征提取方法[A];山東省計(jì)算機(jī)學(xué)會(huì)2005年信息技術(shù)與信息化研討會(huì)論文集(二)[C];2005年
4 代勁;何中市;胡峰;;一種高性能的文本特征自動(dòng)提取算法[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第二分冊(cè))[C];2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 肖雷;面向論壇的文本特征提取及分類技術(shù)研究[D];河北大學(xué);2015年
2 楊凱翔;聊天機(jī)器人知識(shí)挖掘方法研究[D];華南理工大學(xué);2015年
3 陳俊文;作文自動(dòng)評(píng)分關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年
4 吳善鵬;基于概念代數(shù)的微博文本特征擴(kuò)展研究[D];上海大學(xué);2015年
5 洪清華;因果推理類地理試題解答方法研究[D];哈爾濱工業(yè)大學(xué);2015年
6 陳光輝;基于本體的文本特征選取和加權(quán)方法研究[D];河北大學(xué);2010年
7 劉逵;基于野草算法的文本特征選擇研究[D];西南大學(xué);2013年
8 涂安龍;一種CM-RS文本特征提取方法研究[D];華中師范大學(xué);2012年
9 余剛;基于語(yǔ)義概念的文本特征描述[D];重慶大學(xué);2005年
10 方玉萍;基于潛語(yǔ)義與遺傳算法的中文文本特征獲取方法研究[D];云南師范大學(xué);2007年
,本文編號(hào):1281858
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1281858.html