基于分解轉移矩陣的PageRank迭代計算方法
本文選題:計算機應用 切入點:中文信息處理 出處:《中文信息學報》2007年05期 論文類型:期刊論文
【摘要】:本文提出了一種基于分解轉移矩陣的PageRank的迭代計算方法。該方法對PageRank理論模型進一步推導,把其Markov狀態(tài)轉移矩陣進行了分解,從而降低存儲開銷和計算復雜度,減少I/O需求,使得PageRank計算的工程化實現(xiàn)更為簡單。實驗表明1 700多萬的網(wǎng)頁2.8億條鏈接,可以在30秒內(nèi)完成一次迭代,內(nèi)存需求峰值585MB,可以滿足工程化應用的需求。
[Abstract]:In this paper, an iterative computing method for PageRank based on factorization transfer matrix is proposed, which further deduces the theoretical model of PageRank and decomposes its Markov state transition matrix, thus reducing the storage overhead and computational complexity, and reducing the requirements of I / O. The experiment shows that more than 17 million web pages with 280 million links can complete an iteration within 30 seconds, and the peak memory requirement is 585MB, which can meet the needs of engineering applications.
【作者單位】: 北京信息科技大學中文信息處理研究中心 北京信息科技大學中文信息處理研究中心 北京信息科技大學中文信息處理研究中心
【基金】:863計劃重點項目資助(2006AA010105) 北京市教委科技發(fā)展計劃項目資助(KM200710772010) 北京市屬市管高校人才強教計劃項目資助(PXM2007_014224_044677,PXM2007_014224_044676)
【分類號】:TP301.6
【相似文獻】
相關期刊論文 前10條
1 木合亞提·尼亞孜別克;古力沙吾利;;哈薩克文信息處理的現(xiàn)狀和發(fā)展方向[J];中文信息學報;2010年04期
2 周程遠;朱敏;楊云;;基于詞典的中文分詞算法研究[J];計算機與數(shù)字工程;2009年03期
3 羅杰;陳力;夏德麟;王凱;;基于新的關鍵詞提取方法的快速文本分類系統(tǒng)[J];計算機應用研究;2006年04期
4 朱曉旭;李培峰;朱巧明;刁紅軍;;一個適用于手持設備的多層漢字輸入法模型[J];中文信息學報;2006年06期
5 扎西加;珠杰;;面向信息處理的藏文分詞規(guī)范研究[J];中文信息學報;2009年04期
6 干俊偉,黃德根;漢語介詞短語的自動識別[J];中文信息學報;2005年04期
7 劉云峰,齊歡,Xiang’en Hu,Zhiqiang Cai;潛在語義分析權重計算的改進[J];中文信息學報;2005年06期
8 趙海;揭春雨;;基于有效子串標注的中文分詞[J];中文信息學報;2007年05期
9 賈寧;張全;;基于句間關系的漢語語義塊省略恢復[J];中文信息學報;2008年06期
10 黃嫻;張克亮;;漢語零形回指研究綜述[J];中文信息學報;2009年04期
相關會議論文 前10條
1 宋蘭;孫茂松;;中文文本全文查重的實驗研究[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
2 劉匯丹;芮建武;吳健;;藏文網(wǎng)頁的編碼識別與轉換[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術會議論文集[C];2006年
3 徐印才;任立群;段元慧;任俊泉;;輸血科智能管理系統(tǒng)的開發(fā)與應用[A];第四屆全國臨床檢驗學術會議論文匯編[C];2006年
4 陳皓;鄭利平;劉曉平;;模板在虛擬現(xiàn)實平臺中的應用[A];計算機技術與應用進展——全國第17屆計算機科學與技術應用(CACIS)學術會議論文集(上冊)[C];2006年
5 唐西隆;;用ToolBook制作多媒體課件的技巧[A];第十五屆全國圖學教育研討會暨第七屆工程制圖CAI課件演示交流會論文集[C];2006年
6 滿正行;李應興;單廣榮;于洪志;;網(wǎng)絡應用中實現(xiàn)藏文支持的一種方案[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年
7 趙曉波;;基于即時通信的客戶服務系統(tǒng)[A];2007年中國通信學會“移動增值業(yè)務與應用”學術年會論文集[C];2007年
8 唐永明;王小捷;文娟;;基于關聯(lián)詞的復句語言模型[A];第三屆中國智能計算大會論文集[C];2009年
9 朱新河;嚴新平;蕭漢梁;;計算機輔助油液監(jiān)測數(shù)據(jù)處理系統(tǒng)[A];第二屆全國青年摩擦學學術會議論文專輯[C];1993年
10 彭朝林;;急診分診處的計算機應用[A];全國護理臨床研究學術交流暨專題講座會議論文會編[C];2001年
相關重要報紙文章 前10條
1 記者 梁捷;我國中文信息處理技術從實驗室走向全面應用[N];光明日報;2009年
2 姚雙云 華中師范大學語言與語言教育研究中心;虛詞知識庫:中文信息處理的基石[N];中國社會科學報;2011年
3 張波 龍雨;中文信息處理國際學術會議在武漢大學召開[N];中國社會科學院院報;2007年
4 記者 韓曉玲邋通訊員 張波 龍雨;海內(nèi)外專家聚焦中文信息處理[N];湖北日報;2007年
5 胡唯元;文字編碼新標準:不再為“名”所累[N];科技日報;2006年
6 撰文 西南證券;計算機應用服務業(yè),隨大勢而動[N];上海金融報;2008年
7 許偉;金友兵 破局國外辦公套件壟斷[N];中國企業(yè)報;2008年
8 ;浙江天宇信息技術有限公司[N];中國計算機報;2009年
9 蘭文科;淺析計算機應用系統(tǒng)平臺建設[N];中國國門時報;2007年
10 王偉 潘麗;構建數(shù)字海事[N];計算機世界;2006年
相關博士學位論文 前9條
1 李蘇紅;基于實體模型的工程圖樣數(shù)字化設計的研究[D];吉林大學;2007年
2 劉杰;泄漏發(fā)射的信息重建與防御對策[D];浙江大學;2004年
3 Memon Abdul Ghafoor;[D];浙江大學;2006年
4 劉磊;概念內(nèi)涵屬性計算研究[D];上海交通大學;2011年
5 王建會;中文信息處理中若干關鍵技術的研究[D];復旦大學;2004年
6 吳應良;網(wǎng)絡計算中的智能信息處理方法研究[D];華南理工大學;2000年
7 梁添才;基于認知機理的漢字智能造字研究[D];華南理工大學;2008年
8 盧建平;基于拓撲學和統(tǒng)計學的無字庫漢字智能造字研究[D];華南理工大學;2010年
9 江會星;漢語命名實體識別研究[D];北京郵電大學;2012年
相關碩士學位論文 前10條
1 王敏;基于改進的隱馬爾科夫模型漢語詞性標注[D];山西大學;2007年
2 黨蘭學;漢字語法語義智能輸入法總體設計與部分實現(xiàn)[D];河南大學;2006年
3 白曉梅;校園網(wǎng)中文搜索引掣系統(tǒng)的設計與實現(xiàn)[D];吉林大學;2006年
4 曹林峰;中文文字差錯率統(tǒng)計軟件的實現(xiàn)[D];西安電子科技大學;2007年
5 張玉華;基于碼本的輸入法評測系統(tǒng)的設計和實現(xiàn)[D];蘇州大學;2005年
6 杜瑩;漢字語法語義智能輸入法核心算法及實現(xiàn)技術[D];河南大學;2006年
7 徐瑞;一個中文語義語料庫的研究與建設[D];蘇州大學;2006年
8 沈威;基于渡越矩陣與語境計算模型的復句關系詞的自動標注[D];華中師范大學;2007年
9 羅麗俊;中文信息處理中若干技術的研究與實現(xiàn)[D];遼寧科技大學;2008年
10 毋琳;特定領域問答系統(tǒng)中通用語義理解框架的設計與實現(xiàn)[D];河南大學;2007年
,本文編號:1571439
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1571439.html