天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 民族史志論文 >

地方歷史文獻的數(shù)字化、數(shù)據(jù)化與文本挖掘:以《中國地方歷史文獻數(shù)據(jù)庫》為例

發(fā)布時間:2017-09-21 04:08

  本文關鍵詞:地方歷史文獻的數(shù)字化、數(shù)據(jù)化與文本挖掘:以《中國地方歷史文獻數(shù)據(jù)庫》為例


  更多相關文章: 地方歷史文獻 數(shù)字人文 文本挖掘 元數(shù)據(jù)


【摘要】:歷史文獻數(shù)據(jù)庫可區(qū)分為數(shù)字化、數(shù)據(jù)化、文本挖掘三種不同形態(tài),迄今多數(shù)中文歷史文獻數(shù)據(jù)庫實現(xiàn)了數(shù)字化功能,部分地實現(xiàn)數(shù)據(jù)化功能,而能夠實現(xiàn)文本挖掘功能的則十分少見。數(shù)字化是將文獻的物理形態(tài)轉化為電子形態(tài),數(shù)據(jù)化是將文獻轉化為可量化分析的數(shù)據(jù),編制元數(shù)據(jù)是主要方法。文本發(fā)掘是在此基礎上開發(fā)文本分析工具。《中國地方歷史文獻數(shù)據(jù)庫》以文獻學研究為基礎,建立特定的元數(shù)據(jù)結構,提供交叉導航、數(shù)據(jù)統(tǒng)計等多種功能,這些功能不僅可以幫助研究者找到自己的所需文獻,更可能幫助研究者發(fā)現(xiàn)新的研究議題。史學研究中,數(shù)據(jù)庫有必要被視作一種新的文獻形態(tài),建立針對性的文獻學方法論。
【作者單位】: 上海交通大學人文學院歷史系;
【關鍵詞】地方歷史文獻 數(shù)字人文 文本挖掘 元數(shù)據(jù)
【基金】:上海市晨光計劃“十九世紀徽州鄉(xiāng)村的土地市場與社會關系網(wǎng)絡”(項目編號:14CGA013)階段性成果
【分類號】:G256;K29
【正文快照】: 引言 數(shù)字化(digitalization)、數(shù)據(jù)化(datalization)、文本挖掘(text mining)是歷史文獻數(shù)據(jù)庫的三種不同形態(tài)。數(shù)字化是將文獻從物理形態(tài)轉化為電子形態(tài),數(shù)據(jù)化是將電子形態(tài)進一步轉換為可識別的文本與可分析的數(shù)據(jù),文本挖掘則是針對文本、數(shù)據(jù)做進一步的計量、相關性、GIS

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 張輝,薛貴榮;基于文本挖掘的搭配詞典自動架構探討[J];上海工程技術大學學報;2004年04期

2 ;[J];;年期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 陳林;王曉華;李殿峗;文俊浩;;基于自增模式的文本挖掘研究[A];’2004計算機應用技術交流會議論文集[C];2004年

2 王巍;楊武;張樂君;鄭軍;;支持網(wǎng)絡話題管理的文本挖掘算法分析[A];全國網(wǎng)絡與信息安全技術研討會論文集(下冊)[C];2007年

3 王繼成;孫穎;張福炎;;文本挖掘-數(shù)據(jù)挖掘研究的新課題[A];第十六屆全國數(shù)據(jù)庫學術會議論文集[C];1999年

4 高飛;荊繼武;向繼;;文本挖掘系統(tǒng)的可視化方法研究[A];全國網(wǎng)絡與信息安全技術研討會論文集(上冊)[C];2007年

5 朱強生;田英;周延泉;何華燦;;基于非負因子分析的模糊文本挖掘[A];2006通信理論與技術新進展——第十一屆全國青年通信學術會議論文集[C];2006年

6 錢程揚;龍毅;徐震;孫昊;;基于Web文本挖掘的地理位置信息重建技術[A];中國地理學會2007年學術年會論文摘要集[C];2007年

7 蔣子海;周斌;吳泉源;;基于UIMA AS的文本挖掘系統(tǒng)的性能分析與評估[A];全國計算機安全學術交流會論文集·第二十五卷[C];2010年

8 邱曉蕾;張聰超;;基于SVD和部分聚集分類的文本挖掘算法[A];第二屆全國信息檢索與內(nèi)容安全學術會議(NCIRCS-2005)論文集[C];2005年

9 武洪萍;周國祥;;Web文本挖掘研究[A];計算機技術與應用進展·2007——全國第18屆計算機技術與應用(CACIS)學術會議論文集[C];2007年

10 陳宇;王強;;聚類算法在Web文本挖掘中的應用研究[A];2009全國計算機網(wǎng)絡與通信學術會議論文集[C];2009年

中國重要報紙全文數(shù)據(jù)庫 前4條

1 本報記者 施鵬;非結構信息和文本挖掘[N];21世紀經(jīng)濟報道;2009年

2 周青 編譯;文本挖掘工具實現(xiàn)非結構化數(shù)據(jù)價值[N];計算機世界;2004年

3 ;SAS公司收購Teragram 強化BI領域地位[N];計算機世界;2008年

4 ;用挖掘技術使學術資源利用效益最大化[N];中國計算機報;2007年

中國博士學位論文全文數(shù)據(jù)庫 前10條

1 曹奇敏;網(wǎng)絡信息文本挖掘若干問題研究[D];北京理工大學;2015年

2 陳虹樞;基于主題模型的專利文本挖掘方法及應用研究[D];北京理工大學;2015年

3 李梅;文本挖掘中若干關鍵技術研究[D];西北農(nóng)林科技大學;2016年

4 孫道軍;文本挖掘預處理相關基礎技術分析與應用研究[D];北京郵電大學;2008年

5 周雪忠;文本挖掘在中醫(yī)藥中的若干應用研究[D];浙江大學;2004年

6 王明春;基于粗糙集的數(shù)據(jù)及文本挖掘方法研究[D];天津大學;2005年

7 李芳;文本挖掘若干關鍵技術研究[D];北京化工大學;2010年

8 文翰;面向信息檢索的Web文本挖掘方法研究[D];華南理工大學;2012年

9 卜東波;聚類/分類理論研究及其在文本挖掘中的應用[D];中國科學院研究生院(計算技術研究所);2000年

10 陳曉云;文本挖掘若干關鍵技術研究[D];復旦大學;2005年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 任振宇;基于網(wǎng)絡新聞文本挖掘的英語寫作訓練應用[D];華南理工大學;2015年

2 劉超;基于文本挖掘的輕量級搜索引擎[D];西南大學;2015年

3 張磊;基于文本挖掘的項目風險分析方法研究[D];山東大學;2015年

4 梁楠;基于文本挖掘的律師推薦方法研究與應用[D];電子科技大學;2015年

5 滕家雨;云框架下的文本挖掘算法并行化研究[D];中國礦業(yè)大學;2015年

6 唐東;基于XML和SVM的Web文本挖掘系統(tǒng)研究[D];電子科技大學;2014年

7 秦輝;基于文本挖掘的分布式網(wǎng)絡監(jiān)控系統(tǒng)的研究與實現(xiàn)[D];電子科技大學;2014年

8 諶語;文本挖掘關鍵技術的研究及模擬實現(xiàn)[D];電子科技大學;2014年

9 靳旭東;基于社會網(wǎng)絡分析下文本挖掘的微博營銷[D];蘭州財經(jīng)大學;2015年

10 何敏;基于MapReduce的文本挖掘研究[D];電子科技大學;2015年

,

本文編號:892268

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shekelunwen/zgmzsz/892268.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶88431***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com