基于模式學(xué)習(xí)的中文問(wèn)答系統(tǒng)答案抽取方法
本文選題:計(jì)算機(jī)軟件 + 問(wèn)答系統(tǒng) ; 參考:《吉林大學(xué)學(xué)報(bào)(工學(xué)版)》2008年01期
【摘要】:答案抽取是中文問(wèn)答系統(tǒng)的關(guān)鍵,而通常答案是借助于問(wèn)題的答案句子模式抽取得到,由于答案句子模式是語(yǔ)言專家根據(jù)語(yǔ)言規(guī)則提煉獲得,因此非常依賴于專家經(jīng)驗(yàn)。針對(duì)這一局限性,提出了一種利用模式學(xué)習(xí)來(lái)獲得中文答案句子模式的方法,該方法利用搜索引擎從互連網(wǎng)上檢索相關(guān)問(wèn)題文本,人工提取包含答案的句子段,并標(biāo)注問(wèn)題類型及答案,形成各種問(wèn)題類型的問(wèn)答訓(xùn)練語(yǔ)料。通過(guò)統(tǒng)計(jì)學(xué)習(xí),提取候選答案句子模式,計(jì)算候選句子模式權(quán)重,并根據(jù)權(quán)重獲得相應(yīng)問(wèn)題類型的答案句子模式;谑聦(shí)的問(wèn)題答案抽取結(jié)果表明,提出的基于模式學(xué)習(xí)的方法有很好的效果,實(shí)驗(yàn)答案提取準(zhǔn)確率值達(dá)到了0.28,學(xué)習(xí)方法獲得的模式基本上覆蓋了常規(guī)答案句子模式。
[Abstract]:Answer extraction is the key of the Chinese question answering system, but the answer is usually obtained by the answer sentence pattern of the question. Because the answer sentence pattern is extracted by the language expert according to the language rules, it is very dependent on the expert experience. Aiming at this limitation, this paper proposes a method of obtaining sentence pattern of Chinese answer by using pattern learning. The method uses search engine to retrieve the relevant question text from the Internet, and manually extracts sentence segments containing the answers. The question types and answers are marked to form question-answering training corpus of various question types. Through statistical learning, the candidate sentence pattern is extracted, the weight of candidate sentence pattern is calculated, and the answer sentence pattern of the corresponding question type is obtained according to the weight. The results of fact-based answer extraction show that the proposed model learning method has a good effect, the accuracy value of experimental answer extraction reaches 0.28, and the pattern obtained by the learning method basically covers the conventional sentence pattern.
【作者單位】: 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(60663004) 高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金項(xiàng)目(20050007023) 云南省中青年學(xué)術(shù)和技術(shù)帶頭人后備人才基金項(xiàng)目(2007PY01-11) 云南省教育廳基金項(xiàng)目(07Z11139) 昆明理工大學(xué)博士基金項(xiàng)目(2006-12)
【分類號(hào)】:TP311.52
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 余正濤,樊孝忠,郭劍毅;基于支持向量機(jī)的漢語(yǔ)問(wèn)句分類[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年09期
2 余正濤;樊孝忠;宋麗哲;高盛祥;;漢語(yǔ)問(wèn)答系統(tǒng)答案提取方法研究[J];計(jì)算機(jī)工程;2006年03期
3 鄭實(shí)福,劉挺,秦兵,李生;自動(dòng)問(wèn)答綜述[J];中文信息學(xué)報(bào);2002年06期
4 張宇,劉挺,文勖;基于改進(jìn)貝葉斯模型的問(wèn)題分類[J];中文信息學(xué)報(bào);2005年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 烏慶敏;方少卿;謝亮亮;;一種加權(quán)的KNN中文問(wèn)句分類方法研究[J];安徽廣播電視大學(xué)學(xué)報(bào);2010年03期
2 段建勇;李俊;張梅;馬禮;;限定領(lǐng)域的自動(dòng)問(wèn)答系統(tǒng)研究[J];北方工業(yè)大學(xué)學(xué)報(bào);2010年01期
3 劉文華;康海燕;;領(lǐng)域問(wèn)答系統(tǒng)生成器的研究[J];北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期
4 康海燕;李飛娟;蘇文杰;;基于問(wèn)句表征的web智能問(wèn)答系統(tǒng)[J];北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
5 余正濤,樊孝忠,宋麗榮;基于特定問(wèn)題類別的漢語(yǔ)問(wèn)答系統(tǒng)查詢擴(kuò)展[J];北京理工大學(xué)學(xué)報(bào);2005年10期
6 劉小明;樊孝忠;李方方;;一種結(jié)合本體和焦點(diǎn)的問(wèn)題分類方法[J];北京理工大學(xué)學(xué)報(bào);2012年05期
7 秦超;;遠(yuǎn)程教學(xué)平臺(tái)中開(kāi)放式綜合答疑系統(tǒng)研究[J];中國(guó)遠(yuǎn)程教育;2006年10期
8 林鴻飛;丁洪文;楊志豪;趙晶;;基于概念和統(tǒng)計(jì)的問(wèn)答系統(tǒng)實(shí)現(xiàn)機(jī)制[J];大連理工大學(xué)學(xué)報(bào);2006年02期
9 黃明;王慧;梁旭;;最大熵模型的語(yǔ)義句法分析在陪護(hù)機(jī)器人中的應(yīng)用[J];大連交通大學(xué)學(xué)報(bào);2011年05期
10 張雪芬;李德玉;王素格;南瑞賢;;基于統(tǒng)計(jì)方法的面向旅游問(wèn)句分類實(shí)驗(yàn)研究[J];電腦開(kāi)發(fā)與應(yīng)用;2009年01期
相關(guān)會(huì)議論文 前10條
1 劉艷芳;封化民;丁天昌;;中文視頻問(wèn)答系統(tǒng)研究[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第15屆中國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT'06)論文集[C];2006年
2 于娟;武港山;;面向政府公文領(lǐng)域的中文問(wèn)題分類[A];2008年中國(guó)高校通信類院系學(xué)術(shù)研討會(huì)論文集(下冊(cè))[C];2009年
3 陳康;武港山;;基于Ontology的信息檢索技術(shù)研究[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
4 吳晨;張全;;基于HNC的自然語(yǔ)言問(wèn)答處理系統(tǒng)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
5 文勖;張宇;劉挺;;類別主特征結(jié)合句法特征的中文問(wèn)題層次分類[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
6 孫景廣;蔡?hào)|風(fēng);呂德新;董燕舉;;基于知網(wǎng)的中文問(wèn)題自動(dòng)分類[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
7 張希娟;朱靖波;;主動(dòng)學(xué)習(xí)中后驗(yàn)概率尖銳現(xiàn)象的平滑處理[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
8 高俊杰;李茹;李雙紅;;基于領(lǐng)域本體的自動(dòng)問(wèn)答系統(tǒng)關(guān)鍵技術(shù)研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
9 繆有棟;邱錫鵬;黃萱菁;;基于主動(dòng)學(xué)習(xí)的中文問(wèn)題類別標(biāo)注研究[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
10 劉立;余正濤;王蒙;毛存禮;郭劍毅;;結(jié)合詞相關(guān)特征與流行學(xué)習(xí)的中文問(wèn)句分類[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 張巍;融合FAQ、本體和推理技術(shù)的問(wèn)答系統(tǒng)研究[D];太原理工大學(xué);2011年
2 倪興良;問(wèn)答系統(tǒng)中的短文本聚類研究與應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
3 劉玉國(guó);基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關(guān)鍵技術(shù)研究[D];山東大學(xué);2011年
4 劉朝濤;中文問(wèn)答系統(tǒng)中的句型理論及其應(yīng)用研究[D];重慶大學(xué);2010年
5 龍華;定義問(wèn)答檢索關(guān)鍵技術(shù)研究[D];重慶大學(xué);2010年
6 邸書(shū)靈;Agent聯(lián)盟和流形學(xué)習(xí)在中文問(wèn)答系統(tǒng)中的應(yīng)用研究[D];天津大學(xué);2010年
7 朱振方;基于微粒群和遺傳優(yōu)化的文本過(guò)濾關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2012年
8 鄭逢斌;關(guān)于計(jì)算機(jī)理解自然查詢語(yǔ)言的研究[D];西南交通大學(xué);2004年
9 張亮;面向開(kāi)放域的中文問(wèn)答系統(tǒng)問(wèn)句處理相關(guān)技術(shù)研究[D];南京理工大學(xué);2006年
10 黃魏;植物營(yíng)養(yǎng)診斷自動(dòng)應(yīng)答網(wǎng)絡(luò)專家系統(tǒng)研究[D];華中農(nóng)業(yè)大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 馮晶晶;面向軟件測(cè)試領(lǐng)域的自動(dòng)問(wèn)答系統(tǒng)[D];河南理工大學(xué);2010年
2 王有權(quán);基于Web的智能答疑技術(shù)研究與實(shí)現(xiàn)[D];南京財(cái)經(jīng)大學(xué);2010年
3 楊朝玉;基于知網(wǎng)的受限域問(wèn)答系統(tǒng)原型的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2010年
4 韓露;領(lǐng)域知識(shí)對(duì)領(lǐng)域問(wèn)答系統(tǒng)答案抽取影響研究[D];昆明理工大學(xué);2008年
5 李英偉;基于增量改進(jìn)貝葉斯領(lǐng)域問(wèn)句分類研究[D];昆明理工大學(xué);2009年
6 趙全;基于半監(jiān)督學(xué)習(xí)的中文問(wèn)句分類研究[D];昆明理工大學(xué);2010年
7 孟祥燕;問(wèn)答對(duì)自動(dòng)獲取的研究[D];昆明理工大學(xué);2008年
8 李慧;基于貝葉斯分類方法的中文問(wèn)句分類研究[D];石家莊鐵道學(xué)院;2010年
9 李歡;基于多Agent及元搜索技術(shù)的中文問(wèn)答系統(tǒng)的研究和應(yīng)用[D];石家莊鐵道學(xué)院;2009年
10 劉智慧;基于搜索引擎的自動(dòng)問(wèn)答系統(tǒng)[D];西安電子科技大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 秦兵;劉挺;王洋;鄭實(shí)福;李生;;基于常問(wèn)問(wèn)題集的中文問(wèn)答系統(tǒng)研究[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2003年10期
2 李素建,劉群,楊志峰;基于最大熵模型的組塊分析[J];計(jì)算機(jī)學(xué)報(bào);2003年12期
3 鄭實(shí)福,劉挺,秦兵,李生;自動(dòng)問(wèn)答綜述[J];中文信息學(xué)報(bào);2002年06期
4 張學(xué)工;關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J];自動(dòng)化學(xué)報(bào);2000年01期
相關(guān)碩士學(xué)位論文 前1條
1 趙輒謙;基于互聯(lián)網(wǎng)的中文問(wèn)答系統(tǒng)研究[D];山西大學(xué);2003年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 田衛(wèi)東;祖永亮;;基于答案模式和語(yǔ)義特征融合的答案抽取方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年13期
2 余正濤;毛存禮;鄧錦輝;章程;郭劍毅;;基于模式學(xué)習(xí)的中文問(wèn)答系統(tǒng)答案抽取方法[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2008年01期
3 李鵬;喬佩利;王曉龍;王寶勛;;基于模式學(xué)習(xí)的形式化答案抽取技術(shù)與置信度評(píng)價(jià)方法[J];電子學(xué)報(bào);2008年12期
4 李季;一個(gè)標(biāo)準(zhǔn)中文問(wèn)答系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2004年06期
5 鄭實(shí)福,劉挺,秦兵,李生;自動(dòng)問(wèn)答綜述[J];中文信息學(xué)報(bào);2002年06期
6 王慧慧;;中文自動(dòng)問(wèn)答系統(tǒng)研究[J];科技信息(學(xué)術(shù)研究);2007年29期
7 劉寧鋒;史曉東;;中文問(wèn)答系統(tǒng)中答案抽取的研究[J];電腦知識(shí)與技術(shù);2011年12期
8 唐娟;杜亞軍;王可亮;;一種基于形式概念分析的問(wèn)答系統(tǒng)答案抽取的研究[J];計(jì)算機(jī)應(yīng)用;2007年03期
9 王宇;戰(zhàn)學(xué)剛;蔡建山;;基于網(wǎng)絡(luò)的中文問(wèn)答系統(tǒng)的研究[J];計(jì)算機(jī)工程與應(yīng)用;2006年07期
10 曹志娟;李祖樞;劉朝濤;;自動(dòng)問(wèn)答系統(tǒng)中的問(wèn)題理解研究[J];計(jì)算機(jī)科學(xué);2005年11期
相關(guān)會(huì)議論文 前10條
1 趙興;余正濤;鄒俊杰;郭劍毅;毛存禮;;結(jié)合依存句法與實(shí)體的領(lǐng)域答案句模學(xué)習(xí)方法[A];中國(guó)自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)A卷[C];2011年
2 何靖;陳,
本文編號(hào):1945916
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1945916.html