基于用戶偏好分析的個性化信息檢索關(guān)鍵技術(shù)研究
本文關(guān)鍵詞: 個性化信息檢索 用戶偏好 鼠標滑動 滿意度 意圖邊界檢測 社交網(wǎng)絡 出處:《蘇州大學》2016年碩士論文 論文類型:學位論文
【摘要】:個性化信息檢索旨在根據(jù)用戶不同的信息需求,結(jié)合主觀價值傾向,給具有不同信息需求的用戶返回符合其期望的檢索結(jié)果。其核心內(nèi)容在于分析不同用戶的個性化特征,結(jié)合其自身價值傾向差異,建立個性化檢索模型,從而更好的提升用戶的檢索體驗。本文針對個性化信息檢索中用戶偏好分析任務開展了深入研究,文章的主要內(nèi)容歸納為以下三個方面:基于“滑鼠行為”量化的檢索滿意度研究從用戶信息檢索行為特征入手,提出一種基于“滑鼠行為”能量消耗的滿意度評價及量化模型。其中,“滑鼠行為”指用戶在網(wǎng)頁中的鼠標滑動軌跡以及點擊等行為序列。首先,從用戶端對信息檢索質(zhì)量評價的主觀因素出發(fā),引入“檢索滿意度”作為衡量信息檢索質(zhì)量的新特征;其次,通過計算用戶“滑鼠”過程中的“能量消耗”,分析檢索行為特征與用戶滿意度之間的關(guān)聯(lián)性;最后,基于量化數(shù)據(jù)建立滑鼠的“能量消耗”對比模型,用于表征用戶檢索滿意度的強弱。這一研究重點關(guān)注用戶檢索滿意度的量化分析方法,為信息檢索系統(tǒng)質(zhì)量評價提供了一種新的特征;谶吔鐧z測的查詢意圖切分技術(shù)研究通過分析用戶連續(xù)查詢?nèi)罩?提出一種查詢意圖邊界識別方法。用戶完整查詢意圖中包含大量的檢索習慣及個性化特征,識別查詢意圖發(fā)生改變或轉(zhuǎn)移的臨界位置,能夠為從完整意圖分析層面提取用戶的個性化檢索偏好提供有效的方法。首先,從大規(guī)模樣本集中抽取并人工標注部分完整意圖片段;其次,結(jié)合文本特征抽取方法構(gòu)建自動化學習模型,包括分類及序列標注的方法,分別使用SVM和CRF模型;最后,通過開發(fā)及測試數(shù)據(jù)集優(yōu)化學習算法,獲得最優(yōu)的意圖切分性能。這一研究借助用戶查詢?nèi)罩?通過自動化的意圖片段切分技術(shù),為抽取用戶的個性化偏好特征提供研究基礎(chǔ)和技術(shù)手段。用戶社交媒體活動與信息檢索關(guān)聯(lián)性分析研究通過獲取用戶在一段時間內(nèi)的網(wǎng)絡活動內(nèi)容,分析用戶在不同時間段內(nèi)進行信息檢索與社交網(wǎng)絡活動之間的關(guān)聯(lián)性,建立基于個人文化背景及興趣傾向的個性化檢索模型,改善檢索體驗。首先,設(shè)計實驗平臺抓取用戶在一段時間內(nèi)的網(wǎng)絡活動信息;其次,抽取其中社交網(wǎng)絡內(nèi)容及信息檢索相關(guān)內(nèi)容;最后,構(gòu)建關(guān)聯(lián)性分析模型,度量社交活動與檢索行為之間的關(guān)聯(lián)關(guān)系,以便利用社交網(wǎng)絡信息構(gòu)建個性化檢索模型。這一工作側(cè)重研究用戶的文化背景及價值傾向?qū)π畔z索行為的影響,以便為利用社交網(wǎng)絡信息構(gòu)建個性化檢索模型提供理論依據(jù)及研究基礎(chǔ)。綜上所述,本文針對個性化信息檢索中用戶偏好分析的任務,從三個方面開展相關(guān)工作,旨在為個性化信息檢索中的用戶偏好分析提供更加新穎、有效的研究思路及技術(shù)方法。
[Abstract]:The purpose of personalized information retrieval is to return the desired retrieval results to users with different information needs according to their different information needs and subjective value tendency. The core content of personalized information retrieval is to analyze the personalized characteristics of different users. According to the difference of their own value tendency, a personalized retrieval model is established so as to improve the retrieval experience of users. This paper has carried out a deep research on the task of user preference analysis in personalized information retrieval. The main contents of this paper are summarized as follows: the research of retrieval satisfaction based on "mouse behavior" quantification begins with the characteristics of user information retrieval behavior. This paper presents a satisfaction evaluation and quantification model based on "mouse behavior" energy consumption. Among them, "mouse behavior" refers to the user's mouse track and click behavior sequence in the web page. Starting from the subjective factors of the evaluation of information retrieval quality at the user side, this paper introduces "search satisfaction" as a new feature to measure the quality of information retrieval. By calculating the "energy consumption" of the user "mouse", the correlation between the retrieval behavior characteristics and the user satisfaction degree is analyzed. Finally, a comparative model of the "energy consumption" of the mouse is established based on the quantitative data. This research focuses on the quantitative analysis method of user search satisfaction. It provides a new feature for the quality evaluation of information retrieval system. The research on segmentation of query intention based on boundary detection is based on the analysis of users' continuous query logs. A method for identifying the boundary of query intention is proposed. The complete query intention contains a large number of retrieval habits and personalized features to identify the critical position where the query intention has changed or shifted. It can provide an effective method for extracting users' personalized retrieval preferences from the level of complete intention analysis. Firstly, part of the complete intention fragments are extracted from large scale sample sets and some complete intention fragments are annotated manually. Combining the text feature extraction method to construct the automated learning model, including classification and sequence tagging, using SVM and CRF model respectively. Finally, the learning algorithm is optimized by developing and testing the data set. To obtain optimal intent segmentation performance. This study uses automated intent fragment segmentation technology with the help of user query logs. In order to extract the personalized preference features of users, the research provides the research foundation and technical means. The relevance analysis of user social media activities and information retrieval through the acquisition of users in a period of time network activity content, This paper analyzes the relationship between users' information retrieval and social network activities in different time periods, establishes a personalized retrieval model based on personal cultural background and interest tendency, and improves the retrieval experience. The experiment platform is designed to capture the user's network activity information for a period of time. Secondly, the social network content and information retrieval are extracted. Finally, the relevance analysis model is constructed. The relationship between social activities and retrieval behaviors is measured in order to construct a personalized retrieval model using social network information. This work focuses on the impact of users' cultural background and value orientation on information retrieval behavior. In order to provide theoretical basis and research basis for constructing personalized retrieval model by using social network information. In summary, this paper, aiming at the task of user preference analysis in personalized information retrieval, carries out related work from three aspects. The purpose is to provide more novel and effective research ideas and technical methods for user preference analysis in personalized information retrieval.
【學位授予單位】:蘇州大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.3
【相似文獻】
相關(guān)期刊論文 前10條
1 李樹青;;個性化信息檢索技術(shù)綜述[J];情報理論與實踐;2009年05期
2 易明;操玉杰;毛進;;基于點擊流的個性化信息檢索研究[J];情報科學;2011年04期
3 楊林;;淺析個性化信息檢索模型[J];蘭臺世界;2013年02期
4 楊濤;;個性化信息檢索及其實現(xiàn)方式探析[J];圖書情報論壇;2002年02期
5 陳小華;趙捧未;;基于關(guān)聯(lián)規(guī)則的個性化信息檢索系統(tǒng)研究[J];情報科學;2006年06期
6 郭新明;趙薔;弋改珍;;基于相關(guān)反饋的個性化信息檢索模型研究[J];咸陽師范學院學報;2008年06期
7 田曉珍;張敏;;基于元搜索引擎的個性化信息檢索系統(tǒng)[J];科技情報開發(fā)與經(jīng)濟;2008年02期
8 朱曉斌;周源;;個性化信息檢索在網(wǎng)絡營銷中的應用[J];科技信息(學術(shù)研究);2008年05期
9 徐險峰;;2001—2008年我國個性化信息檢索研究綜述[J];新世紀圖書館;2009年03期
10 張寧;趙德平;;基于領(lǐng)域本體的個性化信息檢索研究與應用[J];科技傳播;2010年12期
相關(guān)會議論文 前2條
1 鄒博偉;張宇;范基禮;鄭偉;劉挺;;基于改進的TextTiling方法的用戶新興趣發(fā)現(xiàn)的研究[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
2 張艷;周國祥;;Web挖掘在個性化信息檢索中的應用[A];計算機技術(shù)與應用進展·2007——全國第18屆計算機技術(shù)與應用(CACIS)學術(shù)會議論文集[C];2007年
相關(guān)重要報紙文章 前1條
1 應曉敏 竇文華;條條道路通羅馬[N];計算機世界;2003年
相關(guān)博士學位論文 前1條
1 王曉春;基于用戶搜索歷史的個性化信息檢索研究[D];哈爾濱工業(yè)大學;2015年
相關(guān)碩士學位論文 前10條
1 王劍;基于用戶偏好分析的個性化信息檢索關(guān)鍵技術(shù)研究[D];蘇州大學;2016年
2 劉宏;基于語義的個性化信息檢索研究[D];華北電力大學(河北);2010年
3 余肖生;數(shù)字圖書館的個性化信息檢索研究[D];華中師范大學;2004年
4 紀明奎;基于語義網(wǎng)的個性化信息檢索模型研究[D];黑龍江大學;2007年
5 尹紅麗;基于本體的個性化信息檢索系統(tǒng)模型研究[D];山東大學;2006年
6 陳小華;數(shù)據(jù)挖掘技術(shù)在個性化信息檢索系統(tǒng)中的應用研究[D];西安電子科技大學;2006年
7 萬里;基于本體的個性化信息檢索研究[D];蘭州理工大學;2013年
8 林霞;個性化信息檢索技術(shù)在勘探門戶中的應用研究[D];西安石油大學;2011年
9 康楊楊;個性化信息檢索中用戶偏好分析技術(shù)研究[D];蘇州大學;2014年
10 王威;基于上下文的個性化信息檢索技術(shù)研究[D];廈門大學;2009年
,本文編號:1508636
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1508636.html