天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于并列結(jié)構(gòu)的概念實(shí)例和屬性的同步提取方法

發(fā)布時(shí)間:2018-06-30 04:16

  本文選題:并列結(jié)構(gòu) + 搜索引擎; 參考:《中文信息學(xué)報(bào)》2012年02期


【摘要】:在概念實(shí)例和屬性的提取研究中,針對(duì)基于模式的方法召回率比較低的特點(diǎn),該文提出了一種基于并列結(jié)構(gòu)的概念實(shí)例和屬性的同步提取方法。首先利用并列結(jié)構(gòu)模式去網(wǎng)頁(yè)集合中提取同類(lèi)詞語(yǔ)集合,然后再用基于種子的弱指導(dǎo)方法去學(xué)習(xí)實(shí)例和屬性共現(xiàn)的上下文模式,最后再通過(guò)模式去提取候選實(shí)例或候選屬性。在此過(guò)程中,每提取出一個(gè)候選,就將該候選所在的同類(lèi)詞語(yǔ)集合合并到候選集合中。實(shí)驗(yàn)結(jié)果表明,該文的方法在不降低準(zhǔn)確率的基礎(chǔ)上,能大大提高提取結(jié)果的召回率。
[Abstract]:In the research of concept instance and attribute extraction, this paper proposes a synchronous extraction method of concept instance and attribute based on parallel structure, in view of the low recall rate of pattern based method. The paratactic structure pattern is first used to extract the similar word set from the web page set, then the seed based weak guidance method is used to learn the contextual pattern of instance and attribute co-occurrence, and finally, the candidate instance or candidate attribute is extracted by the schema. In this process, each candidate is extracted, and the set of similar words in which the candidate is located is merged into the candidate set. The experimental results show that the method proposed in this paper can greatly improve the recall rate of the extraction results without reducing the accuracy.
【作者單位】: 北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所;北京大學(xué)計(jì)算語(yǔ)言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金(60873156、61075067) 國(guó)家社會(huì)科學(xué)基金(09BYY032)
【分類(lèi)號(hào)】:TP391.7

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 ;第四屆全國(guó)搜索引擎和網(wǎng)上信息挖掘?qū)W術(shù)研討會(huì)(SEWM2006)在山東大學(xué)舉行[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期

2 那罡;;移動(dòng)搜索的“簡(jiǎn)單”邏輯[J];中國(guó)計(jì)算機(jī)用戶(hù);2006年26期

3 蔡建超;郭一平;王亮;;基于Lucene.Net校園網(wǎng)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年11期

4 ;網(wǎng)絡(luò)[J];電腦愛(ài)好者;2007年04期

5 ;使用搜索引擎的另類(lèi)技巧[J];計(jì)算機(jī)與網(wǎng)絡(luò);2007年06期

6 孫成福;;網(wǎng)絡(luò)搜索引擎的技巧與使用[J];福建電腦;2008年02期

7 楊志;;元數(shù)據(jù)在中文搜索引擎的應(yīng)用研究[J];科技信息(科學(xué)教研);2008年09期

8 陳春陽(yáng);;對(duì)互聯(lián)網(wǎng)搜索引擎的初步認(rèn)識(shí)[J];硅谷;2009年10期

9 沈鑫;;如何“優(yōu)+”搜索引擎賬戶(hù)[J];成功營(yíng)銷(xiāo);2009年08期

10 鐘曉;;自動(dòng)分類(lèi)在搜索引擎中的應(yīng)用[J];福建電腦;2009年10期

相關(guān)會(huì)議論文 前10條

1 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年

2 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

3 倪俊峰;;基于黃頁(yè)搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年

4 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年

5 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年

6 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年

7 陳磊;茹立云;馬少平;;基于用戶(hù)日志挖掘的搜索引擎廣告效果分析[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年

8 李文杰;穗志方;;基于并列結(jié)構(gòu)的概念實(shí)例和屬性的同步提取方法[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

9 申琪君;;電子地圖搜索引擎比較[A];中國(guó)地理學(xué)會(huì)2007年學(xué)術(shù)年會(huì)論文摘要集[C];2007年

10 岑榮偉;劉奕群;張敏;茹立云;馬少平;;網(wǎng)絡(luò)搜索引擎用戶(hù)行為分析和研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

相關(guān)重要報(bào)紙文章 前10條

1 博文邋譯;你的隱私 搜索引擎知道[N];計(jì)算機(jī)世界;2007年

2 楊潔;搜索引擎營(yíng)銷(xiāo)市場(chǎng)生變[N];中國(guó)計(jì)算機(jī)報(bào);2007年

3 劉文君;搜索引擎也在尋求創(chuàng)新[N];大眾科技報(bào);2007年

4 ;法國(guó)挑戰(zhàn)谷歌推出衛(wèi)星地圖搜索引擎[N];人民日?qǐng)?bào);2006年

5 MirrorCity.net技術(shù)總監(jiān) 姚浩;讓搜索引擎回歸最初夢(mèng)想[N];中國(guó)文化報(bào);2008年

6 本報(bào)記者 操秀英;國(guó)雙科技以技術(shù)加服務(wù)贏得市場(chǎng)[N];科技日?qǐng)?bào);2009年

7 趙敏;“魚(yú)群理論”破解搜索營(yíng)銷(xiāo)謎局[N];中國(guó)企業(yè)報(bào);2007年

8 本報(bào)記者 樊哲高;搜索引擎三國(guó)紛爭(zhēng) 中文市場(chǎng)兩軍對(duì)壘[N];中國(guó)電子報(bào);2009年

9 EndTo;優(yōu)化Meta討好搜索引擎[N];電腦報(bào);2009年

10 本報(bào)記者 馬文方;Yebol:從思維科學(xué)導(dǎo)出搜索引擎[N];中國(guó)計(jì)算機(jī)報(bào);2010年

相關(guān)博士學(xué)位論文 前10條

1 岑榮偉;基于用戶(hù)行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年

2 李群;主題搜索引擎聚類(lèi)算法的研究[D];北京林業(yè)大學(xué);2011年

3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年

4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年

5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年

6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年

7 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

8 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年

9 費(fèi)巍;搜索引擎檢索功能的性能評(píng)價(jià)研究[D];武漢大學(xué);2010年

10 黃河;農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究及實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年

2 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年

3 董晨;基于模糊聚類(lèi)的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年

4 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年

5 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實(shí)現(xiàn)[D];華南理工大學(xué);2010年

6 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年

7 歐建斌;基于Web挖掘與信息分類(lèi)的個(gè)性化搜索引擎研究[D];暨南大學(xué);2010年

8 張朝斌;企業(yè)級(jí)搜索引擎的優(yōu)化設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2010年

9 楊曉丹;基于Lucene的主題搜索引擎模板的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江工商大學(xué);2011年

10 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年

,

本文編號(hào):2084835

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2084835.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)00c41***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com