天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

關于維基百科內(nèi)容質量的研究

發(fā)布時間:2021-10-24 23:47
  維基百科是一種基于Wiki技術的,用不同語言寫成的網(wǎng)絡百科全書。隨著Web2.0技術的快速發(fā)展,維基百科所收錄的文章數(shù)量和參與編輯的作者數(shù)量日益增多。事實證明其中大部分的信息都是可信的,為廣大互聯(lián)網(wǎng)用戶提供了方便的內(nèi)容服務,并作為科研和工業(yè)研發(fā)中的知識庫所廣泛使用。然而由快速發(fā)展而引起的信息和數(shù)據(jù)膨脹正在引起業(yè)界的重視,同時,維基百科的數(shù)據(jù)量也呈現(xiàn)著爆發(fā)式的增長。在這種情況下如何保證其提供內(nèi)容的質量、準確性和可信度將成為一個亟待解決的問題。本文從這個角度出發(fā),對維基百科中爭議性的條目和非正常編輯行為進行了挖掘,給出了有效的解決方案。在爭議性條目挖掘的方面,維基百科的一些文章的用戶對同一條目可能持有不同的見解,從而產(chǎn)生對該條目意見上的分歧。發(fā)現(xiàn)此類爭議性并將其解決無疑將保證維基百科的內(nèi)容質量,避免因任何用戶的偏激行為,促使信息的不準確。我們選取了維基百科的編輯歷史作為研究對象,針對編輯歷史中所提供的信息,提取與爭議度有關的元數(shù)據(jù)。這種形式相較于傳統(tǒng)的針對文本自身的挖掘形式更具效率和可操作性。在對爭議度進行評分時,除了從文章自身角度分析之外,我們引入與用戶角色結合的方式計算文章的爭議度得分... 

【文章來源】:大連理工大學遼寧省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:57 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
1 緒論
    1.1 關于維基百科
    1.2 研究目的及問題描述
        1.2.1 研究目的
        1.2.2 問題描述
    1.3 研究現(xiàn)狀
    1.4 論文組織結構
2 相關理論基礎
    2.1 爭議性排序方法
        2.1.1 互增強理論
        2.1.2 算法思想
        2.1.3 排序模型
    2.2 特征變換理論
        2.2.1 特征變換的概念
        2.2.2 特征抽取方法
3 基于特殊角色的維基百科爭議挖掘
    3.1 問題概述
    3.2 用戶角色定義
        3.2.1 爭議性用戶
        3.2.2 強爭議性用戶
    3.3 排序模型
        3.3.1 靜態(tài)排序模型
        3.3.2 基于用戶角色的爭議排序模型
        3.3.3 基于用戶角色與ACR融合的爭議排序模型
    3.4 實驗設計
        3.4.1 數(shù)據(jù)集
        3.4.2 評價方法
    3.5 實驗結果
        3.5.1 參數(shù)選擇
        3.5.2 角色模型的實驗結果
        3.5.3 融合模型的結果
    3.6 本章小結
4 維基百科惡意修改行為挖掘
    4.1 任務背景及動機
    4.2 基與特征變換的惡意行為識別
        4.2.1 原始特征集合構造
        4.2.2 特征變換
    4.3 實驗設計
        4.3.1 數(shù)據(jù)集及實驗方法
        4.3.2 評價方法
    4.4 實驗結果
        4.4.1 實驗結果
        4.4.2 實驗分析
    4.5 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表學術論文情況
致謝



本文編號:3456231

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3456231.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶b4c8c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com