科研社交網(wǎng)絡中的導師推薦研究
本文關鍵詞:科研社交網(wǎng)絡中的導師推薦研究
更多相關文章: 導師推薦 科研分析框架 個性匹配度 科研社交網(wǎng)絡 推薦系統(tǒng)
【摘要】:由于信息技術的迅猛發(fā)展,人們在生活中可以輕易地獲取海量的動態(tài)網(wǎng)絡數(shù)據(jù),但這也使得他們很難快速地尋找到能夠解決棘手任務的最有用信息。在高等教育領域,導師選擇是學生開啟他/她的研究生學術生涯之前的首要任務,F(xiàn)有的相關研究表明,選擇一個合適自己的導師對于這個學生未來的學術生涯是極其重要的。隨著技術的改進,人們可以通過搜索引擎的方式來尋找自己需要的信息,但是,這種方式的有用性是基于用戶很明確地知道自己所要搜索的信息的關鍵詞這個假設前提的。在學生選擇導師的情境中,大部分學生由于經(jīng)驗不足,是不確定應該要搜索怎樣的信息的,是對信息沒有明確方向感的。他們在做選擇的過程中,主要面臨著兩大挑戰(zhàn):信息不完全和信息不對稱。首先,傳統(tǒng)的選擇方式都是在信息不完全的情況下進行的,這樣的選擇結(jié)果可能并不是最優(yōu)的選擇:其次,學生通常都是利用搜索引擎找到潛在導師所在學校的個人主頁,進而參考相關信息,但是,這種信息不對稱的方式使得學生只能獲取部分的信息,這些信息也并沒有及時地更新,在這樣的情況下會導致學生盲目的選擇,產(chǎn)生不匹配現(xiàn)象,進而會影響學生的學術成就。因此,本研究旨在科研社交網(wǎng)絡的平臺基礎上,從推薦的角度提出一套智能方法來解決這個具體問題,主動地為有需要的學生推薦符合其特征的潛在導師,起到輔助決策的作用。在已有的關于導師選擇的研究中,主要提出的方法可以歸結(jié)為三類:第一種是基于主題相關的方法,第二種是基于候選人質(zhì)量的方法,第三種是融合了前兩種的混合方法。Alarfaj, Kruschwitz et al. (2012)提出了一種基于信息檢索技術的解決方案,利用從導師發(fā)表的論文成果中抽取的關鍵詞來表征這個導師的學術特征。學生可以通過系統(tǒng)檢索到感興趣的導師,方法中主要通過計算學生所敲入的檢索關鍵詞和導師的特征關鍵詞的相似度來進行結(jié)果排序。Mosharraf和Taghiyareh (2012)利用優(yōu)化的傳統(tǒng)方法,將學生導師選擇的問題映射成為一個優(yōu)化問題,進而,作者基于遺傳算法提出了適用于解決學生導師選擇這一問題的方法。后來,作者設計了一個名為ADAM的系統(tǒng),它可以在一個學校范圍內(nèi)為學生提供潛在導師選擇的服務。Ray和Marakas在他們的學術研究中,首先進行了問卷調(diào)查學生在考慮導師選擇時比較注重的因素。進而,提出了一種基于AHP的方法,幫助學生在有限的集合里選擇自己感興趣的畢業(yè)論文指導教師。Momeni, Samimi et al. (2011)為了避免AHP方法中涉及到的輔助決策的指標必須互相獨立的假設前提,提出了基于ANP的解決方案。通過讓學生自己來比較指標之間的重要性的過程,最終確定在方案中的每一個指標的權重。Datta, Beriha et al. (2009)在MCDM方法的基礎上提出了一個策略方案,考慮了待選擇的導師所發(fā)表的論文、獲得的項目以及導師信譽等,為了評估候選人的質(zhì)量,作者采用了從灰色關聯(lián)分析改編而來的COPRAS-G方法。通過文獻綜述可以發(fā)現(xiàn),在已有的基于主題相關的方法中,采用的是直接的關鍵詞字面匹配的方法,這會導致“匹配失衡”現(xiàn)象,本文采用考慮關鍵詞的語義相似度的相關度分析方法。在已有的方法中,一些方法只局限于考慮待選擇人選的單方面衡量指標,另一些方法融合考慮了關鍵詞相關度和候選人質(zhì)量度。但是現(xiàn)有的方法存在一定的不足,并沒有一個體系的方法來全面考慮這個特定問題,比如忽略了兩個個體之間個性匹配的重要性,研究表明性格的匹配會影響兩個人的有效溝通和合作,學生導師關系并不是一段短暫的一次性合作機會,而是長期的至少三四年的相處關系,所以在本研究所提出的系統(tǒng)性方法中將會考慮這一點。其次,本文還加入了兩個個體之間連接度的考慮,分別從機構層次連接度和個體層次連接度進行衡量。本文提出了一種個性化的導師智能推薦方法,用于在科研社交網(wǎng)絡上為有需求的學生推薦適合自己個人特征的導師?傮w上,本文提出的方法包含了兩個主要階段,分別為過濾階段和排序階段。首先,在過濾階段中,利用相關度分析在初始階段篩選排除研究領域等學術信息方面不相關的候選人。相關度分析主要是測量給定的學生和潛在的導師之間在學術信息方面的匹配度,這里的學術信息包括了研究興趣、領域?qū)iL、以及知識背景等。本文利用基于學科監(jiān)督的語義相關度匹配的方法來計算相關度分值。第二,在排序階段中,由初始階段產(chǎn)生的初步候選集合將在這一階段基于科研分析框架來進行進一步的連接度分析和質(zhì)量度分析,以及性格匹配度分析。連接度分析結(jié)合了個體層次的社交連接度分析和機構層次的合作連接度分析。質(zhì)量度分析是以導師候選人為中心的,從他/她已發(fā)表的論文和已受資助的項目方面對導師進行產(chǎn)出度的數(shù)量和質(zhì)量的衡量。除了傳統(tǒng)的質(zhì)量分析指標外,本文的質(zhì)量度分析也融入了候選人在科研社交網(wǎng)絡上的社交關注度衡量。此外,已有研究表明性格匹配程度會影響兩個個體之間的有效溝通,所以,本文在排序階段中,通過個性匹配的過程對候選人進行又一維度的分析。本文借鑒心理學方面已有研究成果中所提出的濃縮版的個性分析量表,通過問卷來獲取學生和導師在各個性格維度的相關數(shù)據(jù),進而根據(jù)距離公式(Deza,2009)來進行個性匹配度分析。最后,為了產(chǎn)生最后的候選人排序列表,需要融合分別從四個維度得到的不同分值。本研究采用基于分值的融合方法,即Comb-MNZ算法。針對每個給定的學生,通過這個過濾排序過程都會得到一系列的待推薦候選人。通常,在科研社交網(wǎng)絡上,系統(tǒng)會給每個特定用戶推薦排序前幾名的科研人員。在具體算法上,在相關度分析方面,本文主要融合了兩方面的信息。一方面,根據(jù)教育部學科分類體系標準,形成學科分類樹,采用分類樹方法(Li和Shiu,2002)計算學生所在的專業(yè)與導師所在的學院的匹配度。另一方面,基于每個人的科研相關信息,分別對學生和導師進行特征提取和建模,其中,導師的科研信息包括自填的研究領域、發(fā)表的論文信息(主要為題目、關鍵詞和摘要信息)和教過的課程信息,同時,學生的科研信息包括自填的研究興趣、發(fā)表或者感興趣的論文信息以及通過的課程信息。通過特征提取過程,利用Quattrone, Capra等學者的研究成果,通過自然語言處理技術建立一個關鍵詞-文本的矩陣,其中每個元素代表的是關鍵詞在這個特定文本的詞頻,進而,利用迭代算法構建出關鍵詞矩陣,在這個矩陣中每個元素代表了兩兩關鍵詞之間的相似度。通過這樣的過程來進行有學科監(jiān)督下的語義相關度分析,從而在初始階段就過濾掉不相關的候選人,產(chǎn)生初始候選集合。在連接度分析方面,主要考慮的是給定的學生和潛在待推薦的導師之間在個體層次和機構層次的連接值。首先,基于科研社交網(wǎng)絡上的好友關系網(wǎng)絡挖掘?qū)W生和導師之間的個體層次的社交連接度。一方面,考慮兩個個體之間的共同好友數(shù)量;另一方面,挖掘連接這兩個個體的最短路徑,通過文中所給的綜合考慮這兩方面的算法計算個體層次的社交連接度分值。另外,基于論文成果的機構間合作網(wǎng)絡,挖掘該學生所在的學校和導師所在學校的機構層次的合作連接度,通過計算兩個機構之間合作的成果數(shù)量占兩機構分別的成果數(shù)量總和的比例,來表示兩個個體在機構層次的連接度。最后,線性融合這兩方面的標準化分值來代表連接度維度最后的分值。在質(zhì)量度分析方面,測量了待推薦導師的科研產(chǎn)出度。傳統(tǒng)上,科研產(chǎn)出度一般考慮科研人員所發(fā)表的文章的數(shù)量和質(zhì)量,以及受資助項目的數(shù)量和等級方面的信息。在論文方面,通過JCR的期刊分區(qū)情況,將論文期刊分為了四個區(qū)域等級,系統(tǒng)記錄科研人員發(fā)表的論文所在的不同分區(qū)信息,通過AHP方法對不同區(qū)域等級賦予了相應的權重,最后得到候選人在論文方面的得分。在項目方面,通過以往研究,將項目分為了國家級、教育部、省級以及市級四個類別,同樣通過AHP方法對不同類別賦予了相應的權重,最后得出該候選人在項目方面的分值。本文,在這兩個傳統(tǒng)指標的基礎上,補充考慮了科研人員在科研社交網(wǎng)絡中的社交關注度,通過挖掘科研社交網(wǎng)絡中用戶的相關社交活動,主要涉及了與所發(fā)表的論文以及所資助的項目相關的社交行為,比如在科研社交網(wǎng)絡中用戶的贊、分享、評論以及將感興趣科研對象收藏起來的社交行為數(shù)量。在個性匹配分析方面,本文借鑒了心理學領域?qū)W者的研究成果,IPIP量表(International Personality Item Pool)是最典型的用于測量個性的量表(Goldberg,1999)。出于實際應用中的便利性考慮,Donnellan, Oswald et al. (2006)基于IPIP提出了一個簡化的量表,稱為Mini-IPIP,由20個簡短的題項組成的?偣卜譃槲鍌維度(extraversion, agreeableness, conscientiousness, neuroticism,和imagination)。因此,每個用戶的個性方面都可以被表征為一個五維的數(shù)值向量。接著,通過距離公式計算兩個個體之間的個性匹配程度。最后,在得到了四個維度的不同分值之后,本文采用一種基于分值的融合算法,即Comb-MNZ方法,來集成四個維度的分值,得到最終的推薦列表。每一個特定的學生都將得到排名前幾名的個性化導師推薦服務。為了驗證所提出的導師智能推薦方法,本研究進行了一個基于科研之友注冊用戶的在線調(diào)查實驗。首先,根據(jù)在現(xiàn)有文獻中已有的導師選擇方法,定義了三種基準方法。對已有的導師選擇方法進行歸類后發(fā)現(xiàn),現(xiàn)有的方法主要是基于關鍵詞相關度的方法,基于候選人員的質(zhì)量度的方法,或者混合前兩者的方法。因此,我們設立了三種用于比較推薦結(jié)果的基準方法:第一種是基于相關度的推薦方法;第二種是基于相關度和傳統(tǒng)質(zhì)量度的推薦方法;第三種是基于三維科研分析框架的推薦方法,即融合了相關度分析、質(zhì)量度分析和連接度分析。本研究的驗證過程主要包括了兩個階段:信息收集階段和推薦滿意度反饋階段。首先,在信息收集階段,學生和導師的大部分科研信息都能夠在科研之友上進行收集,比如用戶的主頁、“成果”文件夾、“文獻”文件夾、智能簡歷、以及好友關系網(wǎng)等;同時,系統(tǒng)通過郵件發(fā)放問卷的方式補充收集了用戶在性格方面的信息。其次,在推薦滿意度階段,基于特定用戶的個性化特征,不同方法分別對用戶進行智能導師推薦。每一種推薦方法(本文提出的方法和三種基準方法)均給用戶推薦排名前三的候選人。每一個學生將收到最多12個推薦的導師(不排除重復的情況),進而將這12個推薦結(jié)果打亂順序發(fā)送給這個學生,讓其用1到7的分值區(qū)間對所推薦的人員進行滿意度打分,分值越高表明這個學生用戶對某個特定推薦結(jié)果越滿意。在將反饋信息收集回來之后,我們會將結(jié)果分別對應到不同的推薦方法中去,進行下一步的滿意度的結(jié)果比較。在本研究中,主要通過平均打分指標(AR指標)和標準化折算累計增益值指標(NDCG指標)來比較本文所提出的方法的推薦結(jié)果和三種不同基準方法所推薦的結(jié)果。結(jié)果顯示,無論是基于AR指標還是NDCG指標,本文所提出的智能推薦方法都優(yōu)于其他三種基準方法,它所推薦的結(jié)果能夠得到參與實驗的用戶更高的滿意度評價;贏R指標,本研究提出的智能推薦方法比其他三種基準方法中得到最高用戶滿意度的方法(即基于科研分析框架的推薦方法)提升了15.21%的用戶滿意度評價:根據(jù)NDCG指標,本研究提出的推薦方法比最好的基準方法提升了10.74%的用戶滿意度。綜上所述,本研究在學術貢獻方面,提出了一種智能導師推薦方法,它融合了相關度分析、連接度分析、質(zhì)量度分析、以及個性匹配度分析,有助于為有決策需求的學生提供導師選擇支持。細化而言,在相關度方面,運用了基于學科的關鍵詞語義分析方法來測量學生和導師的相似度。在連接度方面,融合了機構層次的合作連接度和個體層次的社交連接度。在質(zhì)量度方面,除了傳統(tǒng)的衡量指標外,補充加入了人員在科研社交網(wǎng)絡上的社交關注度。另外,本研究強調(diào)并考慮了以往研究中被忽視的兩個個體的性格匹配度在一段合作交流關系過程中的重要性。在實際貢獻方面,本文提出的智能導師推薦方法已在科研之友平臺上進行應用,注冊用戶如有需求,可以在相關應用中得到這一項個性化推薦服務。此外,以往研究表明導師被視為一種動態(tài)知識來源,學生接近導師更是獲取知識的一種有效渠道,所以智能導師推薦服務也提升了學生進行社交學習的潛在機會。最后,本研究也存在一定的不足,同時基于現(xiàn)有研究的不足方面,探討一些未來的潛在學術研究機會。首先,在驗證本研究所提出的推薦方法的有效性方面,目前采用的是較為主觀的用戶滿意度的方式,但是如果在未來深入研究中,能夠進行縱向研究來跟蹤評價推薦結(jié)果,采用真實的導師學生選擇成功率來驗證的話,結(jié)果將會更客觀且更有說服力。其次,本文提出的方法是應用于具體的導師選擇的教育領域場景中,方法的普適性并未得到檢驗,在將來的研究中,可以將所提出的方法應用于不同的類似推薦場景中,并對其進行不斷修正,驗證所提出的推薦方法的普適性。第三,在最后進行四個維度推薦排序列表融合的方式上,本文只采用了Comb-MNZ集成算法,在未來的研究中,可以嘗試運用更多不同的融合方法,比較不同集成算法得出的推薦結(jié)果的差異,并得出一般集成規(guī)律,在具體場景下應采用的具體集成方法提出相關的建議。
【關鍵詞】:導師推薦 科研分析框架 個性匹配度 科研社交網(wǎng)絡 推薦系統(tǒng)
【學位授予單位】:中國科學技術大學
【學位級別】:博士
【學位授予年份】:2016
【分類號】:G252.7;G643
【目錄】:
- 摘要5-10
- ABSTRACT10-14
- CHAPTER 1. INTRODUCTION14-24
- 1.1 Background14-17
- 1.2 Research Objectives17-18
- 1.3 Research Methodology18-21
- 1.4 Thesis Structure21-24
- CHAPTER 2. LITERATURE REVIEW24-40
- 2.1 Supervisor Selection24-31
- 2.1.1 Significance of Suitable Selection24-25
- 2.1.2 Current Methods for Supervisor Selection25-31
- 2.1.2.1 Relevance-quality Based Consideration26-29
- 2.1.2.2 Subjective Characteristic Based Consideration29-31
- 2.2 Academic Recommendation Systems31-36
- 2.2.1 Characteristics of a Researcher's Profile32
- 2.2.2 Expert Recommendation32-35
- 2.2.3 Collaborator Recommendation35-36
- 2.3 Summary and Research Gaps36-40
- CHAPTER 3. PROPOSED APPROACH40-62
- 3.1 Overview of the Proposed Approach41-42
- 3.2 RAF-supported Dimensions42-57
- 3.2.1 Relevance Dimension42-49
- 3.2.1.1 Respective Profiling of Supervisors and Students43
- 3.2.1.2 Discipline-supervised Semantic Relevance Analysis43-49
- 3.2.2 Connectivity Dimension49-53
- 3.2.2.1 Individual-level Social Connection49-50
- 3.2.2.2 Institutional-level Collaboration Connection50-53
- 3.2.3 Quality Dimension53-57
- 3.2.3.1 Published Papers53-55
- 3.2.3.2 Funded Projects55
- 3.2.3.3 Social Popularity55-57
- 3.3 Personality Matching Focused Dimension57-59
- 3.4 Aggregation Process for Final Ranking59-62
- CHAPTER 4.EXPERIMENTAL EVALUATIONS62-74
- 4.1 Experimental Design62-64
- 4.2 Baseline Methods64-65
- 4.3 Evaluation Metrics65-67
- 4.4 Results and Discussion67-71
- 4.5 System Implementation71-74
- CHAPTER 5.CONCLUSIONS AND FUTURE WORKS74-78
- 5.1 Summary of the Research Work74-75
- 5.2 Contributions of the Research Study75-76
- 5.3 Limitations and Future Works76-78
- REFERENCES78-86
- APPENDIX86-88
- ACKNOWLEDGEMENTS88-90
- 在讀期間發(fā)表的學術論文與取得的其他研究成果90
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 呂寒;沈艷;;社交網(wǎng)絡視角下創(chuàng)意產(chǎn)業(yè)價值鏈發(fā)展研究[J];學術評論;2012年Z1期
2 陳星汶;;發(fā)現(xiàn)社交網(wǎng)絡的招聘魅力[J];人力資源管理;2013年04期
3 修春民;;德國限制社交網(wǎng)絡在中小學校的使用[J];世界教育信息;2013年18期
4 張希平;;關于圖書館與社交網(wǎng)絡的設想[J];普洱學院學報;2013年06期
5 周國健;劉璐;邵攸悠;;高校校園社交網(wǎng)絡系統(tǒng)實現(xiàn)設計研究[J];電子技術與軟件工程;2014年10期
6 武會;;淺談社交網(wǎng)絡對高校大學生的影響及若干建議[J];科技致富向?qū)?2013年05期
7 錢煒;;人體的“社交網(wǎng)絡”[J];教師博覽;2013年04期
8 代安楠;;大學生校園社交網(wǎng)絡的使用與建設[J];青年文學家;2013年24期
9 余劍來;;社交網(wǎng)絡化的發(fā)展方向[J];世界科學;2011年01期
10 詹馥榕;;淺議俄羅斯網(wǎng)絡發(fā)展現(xiàn)狀及其社交網(wǎng)絡語匯特征[J];西北民族大學學報(哲學社會科學版);2012年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 趙云龍;李艷兵;;社交網(wǎng)絡用戶的人格預測與關系強度研究[A];第七屆(2012)中國管理學年會商務智能分會場論文集(選編)[C];2012年
2 宮廣宇;李開軍;;對社交網(wǎng)絡中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學科研究生學術論壇獲獎論文[C];2010年
3 楊子鵬;喬麗娟;王夢思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡與大學生焦慮緩解[A];心理學與創(chuàng)新能力提升——第十六屆全國心理學學術會議論文集[C];2013年
4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡解析[A];第九屆全國體育科學大會論文摘要匯編(4)[C];2011年
5 杜p,
本文編號:846520
本文鏈接:http://sikaile.net/jiaoyulunwen/yjsjy/846520.html