天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于詞項圖分析的查詢分面挖掘方法

發(fā)布時間:2018-03-01 17:36

  本文關(guān)鍵詞: 查詢分面 用戶意圖 頻繁列表 詞項圖 知識庫 社會媒體 社會計算 出處:《計算機(jī)學(xué)報》2017年03期  論文類型:期刊論文


【摘要】:查詢分面是用于描述查詢某一方面內(nèi)容的一組并列的詞或詞組.現(xiàn)有的查詢分面挖掘方法主要通過模式挖掘搜索結(jié)果中包含的高頻列表,并利用無監(jiān)督或有監(jiān)督的方法對高頻列表進(jìn)行聚類,最終得到查詢分面.因為通常采用的搜索結(jié)果的數(shù)目有限,這種方法挖掘出的查詢分面及其包含的分面項的覆蓋率不高.針對這一問題,該文提出了一種基于從大規(guī)模網(wǎng)頁中構(gòu)建的詞項圖的查詢分面挖掘方法.首先基于大規(guī)模網(wǎng)頁數(shù)據(jù)集構(gòu)建詞項圖,圖中的節(jié)點代表詞項,邊代表兩個詞項的相似性.針對每個查詢,從搜索結(jié)果中挖掘出初始分面,然后基于詞項圖對這些初始查詢分面進(jìn)行擴(kuò)充,找到詞項圖中與初始分面類似的候選詞,對候選詞抽取多種特征,最后利用支持向量機(jī)對候選詞進(jìn)行分類,預(yù)測詞項是否可為擴(kuò)充詞項,并將預(yù)測為正例的詞項擴(kuò)充到分面中.該擴(kuò)充過程迭代多次直到無法找到更多分面項.實驗表明該方法可有效提高查詢分面的質(zhì)量,尤其是能夠顯著改善分面項的覆蓋率.
[Abstract]:Query partitioning is a set of paratactic words or phrases used to describe a certain aspect of a query. And using unsupervised or supervised methods to cluster high-frequency lists, and finally get the query facets, because the number of commonly used search results is limited, This method does not have a high coverage of the query partitioning and the items it contains. In view of this problem, In this paper, a query face mining method based on the term graph constructed from large scale web pages is proposed. Firstly, a word item graph is constructed based on a large scale web page data set, and the nodes in the graph represent the word item. The edges represent the similarity of the two terms. For each query, the initial face is mined from the search results, then the initial query faces are expanded based on the term graph, and the candidate words similar to the initial face are found in the term graph. Finally, support vector machine (SVM) is used to classify candidate words to predict whether they can be extended. The term items predicted as positive examples are extended to the facets. The extended process iterates many times until no more facets can be found. Experiments show that this method can effectively improve the quality of query partitioning, especially the coverage of partitioning items.
【作者單位】: 中國人民大學(xué)信息學(xué)院;中國藝術(shù)科技研究所;中國人民大學(xué)大數(shù)據(jù)管理與分析方法研究北京市重點實驗室;
【基金】:國家自然科學(xué)基金(61502501) 國家“九七三”重點基礎(chǔ)研究發(fā)展規(guī)劃項目基金(2014CB340403)資助~~
【分類號】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前2條

1 吳直雄;“’”運用混亂亟待規(guī)范[J];中國出版;1996年12期

2 ;[J];;年期

相關(guān)會議論文 前2條

1 許錦云;;普通邏輯中的概念應(yīng)改為詞項[A];邏輯今探——中國邏輯學(xué)會第五次代表大會暨學(xué)術(shù)討論會論文集[C];1996年

2 李永銘;;普通邏輯三問[A];1997年邏輯研究專輯[C];1997年

相關(guān)重要報紙文章 前1條

1 楊錫彭;漢語中的韻律詞[N];語言文字周報;2013年

相關(guān)博士學(xué)位論文 前3條

1 成軍;論詞項的概念指向性[D];西南大學(xué);2010年

2 吳麗英;詞項裝配與合并的最簡研究[D];上海外國語大學(xué);2008年

3 李翠英;搭配的動態(tài)觀及其應(yīng)用研究[D];蘇州大學(xué);2011年

相關(guān)碩士學(xué)位論文 前5條

1 陳博影;從詞項邏輯的角度判斷“張之江命題”的真?zhèn)蝃D];福建師范大學(xué);2015年

2 洪歡;基于詞重要性的信息檢索圖模型[D];江西師范大學(xué);2015年

3 周國亮;基于交叉詞項的中文信息檢索方法研究[D];華中師范大學(xué);2016年

4 尹浩傳;基于詞項依賴信息的中文信息檢索方法研究[D];華中師范大學(xué);2014年

5 羅楊;英漢身體部位詞項語義引申的認(rèn)知實證研究[D];四川外語學(xué)院;2010年

,

本文編號:1552899

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1552899.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c4c9c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
福利在线午夜绝顶三级| 东京不热免费观看日本| 精品国产91亚洲一区二区三区| 久久久免费精品人妻一区二区三区 | 国产精品一区二区成人在线| 成人日韩在线播放视频| 精品日韩中文字幕视频在线| 一区二区三区亚洲天堂| 91播色在线免费播放| 丰满少妇被粗大猛烈进出视频 | 欧美日韩亚洲巨色人妻| 国产91色综合久久高清| 久久国产人妻一区二区免费| 成人免费视频免费观看| 日本婷婷色大香蕉视频在线观看| 99久久精品午夜一区二| 欧美一区二区口爆吞精| 国产亚洲欧美日韩精品一区| 国产免费黄片一区二区| 国产午夜福利不卡片在线观看| 亚洲天堂精品在线视频| 国产欧美日韩综合精品二区| 国产精品99一区二区三区| 国产在线视频好看不卡| 亚洲精品福利入口在线| 国产亚洲视频香蕉一区| 青青操视频在线播放免费| 久久99精品国产麻豆婷婷洗澡 | 国产精品欧美一区二区三区不卡| 国产一区在线免费国产一区| 日韩国产欧美中文字幕| 欧美亚洲三级视频在线观看| 我要看日本黄色小视频| 五月天婷亚洲天婷综合网| 丰满的人妻一区二区三区| av中文字幕一区二区三区在线| 欧美韩日在线观看一区| 麻豆视传媒短视频免费观看| 国产乱淫av一区二区三区| 九九热精品视频免费在线播放| 国产一区欧美一区日本道|