基于Solr和Mahout在線資訊自動分類與全文搜索引擎的實現(xiàn)
本文關(guān)鍵詞:基于Solr和Mahout在線資訊自動分類與全文搜索引擎的實現(xiàn)
更多相關(guān)文章: 文本自動分類 分類器 資訊 信息服務(wù)方式 分類算法 全文檢索系統(tǒng) 檢索界面 全文索引 業(yè)務(wù)需求 用戶要求
【摘要】:正在當(dāng)前信息爆炸式增長的時代,用戶對信息服務(wù)的需求已經(jīng)從信息匯聚為主的廣播式服務(wù)逐漸過渡到要求提供按需、定制化、定向的集成化信息服務(wù)。用戶要求能按照其特定的業(yè)務(wù)需求,對信息進行預(yù)加工、過濾后,提供給他們精品化的"干貨"。這對我們通訊社的信息服務(wù)方式也提出了新的要求。在大數(shù)據(jù)時代,信息量呈幾何方式增長,同時我們也積累了大量的歷史資訊數(shù)據(jù),如果不能對
【作者單位】: 新華社技術(shù)局;
【關(guān)鍵詞】: 文本自動分類 分類器 資訊 信息服務(wù)方式 分類算法 全文檢索系統(tǒng) 檢索界面 全文索引 業(yè)務(wù)需求 用戶要求
【分類號】:TP391.3
【正文快照】: 在當(dāng)前信息爆炸式增長的時代,用戶對信息服務(wù)的需求已經(jīng)從信息匯聚為主的廣播式服務(wù)逐漸過渡到要求提供按需、定制化、定向的集成化信息服務(wù)。用戶要求能按照其特定的業(yè)務(wù)需求,對信息進行預(yù)加工、過濾后,提供給他們精品化的“干貨”。這對我們通訊社的信息服務(wù)方式也提出了新
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉苗;謝邦昌;;基于概率潛在語義分析和Adaboost算法的文本分類技術(shù)研究[J];統(tǒng)計與決策;2010年19期
2 許璐蕾;;面向搜索引擎的文本自動分類系統(tǒng)實現(xiàn)[J];蘇州市職業(yè)大學(xué)學(xué)報;2007年04期
3 郭少友;;基于詞語上下文關(guān)系的文本自動分類方法研究[J];現(xiàn)代圖書情報技術(shù);2008年05期
4 劉冬梅;王俊義;;HTML文本自動分類預(yù)處理方法的研究應(yīng)用[J];內(nèi)蒙古大學(xué)學(xué)報(自然科學(xué)版);2007年01期
5 夏火松;劉建;;基于VSM的文本分類挖掘算法綜述[J];情報探索;2010年09期
6 牟堯;李曦;;關(guān)于文本自動分類算法的研究——以檔案自動歸類的應(yīng)用為例[J];中國西部科技;2011年24期
7 張婷慧,耿煥同,蔡慶生;基于CBR的文本自動分類研究[J];計算機應(yīng)用;2005年09期
8 張婷慧;耿煥同;蔡慶生;;一種改進的VSM及其在文本自動分類中的應(yīng)用[J];微電子學(xué)與計算機;2005年12期
9 胡燕;熊浩勇;付香英;;線性可分文本的SVM算法研究與改進[J];計算機與數(shù)字工程;2008年03期
10 付香英;王春麗;王芳;;非線性可分文本的SVM算法研究與改進[J];九江學(xué)院學(xué)報;2008年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 雷蕾;吳乃君;劉鵬;劉蘭娟;;靈敏度分析:分類器中的缺失數(shù)據(jù)[A];第11屆海峽兩岸信息管理發(fā)展策略研討會論文集[C];2005年
2 穆明生;;基于特征集的多種分類器模型的在線筆跡認證[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
3 徐蔚然;于武貴;郭軍;;基于統(tǒng)計方法的混排文字切分與分類[A];第八屆全國漢字識別學(xué)術(shù)會議論文集[C];2002年
4 劉艷民;;中文網(wǎng)頁分類方法的研究[A];2009年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(下冊)[C];2009年
5 李剛;郭崇慧;林鴻飛;楊志豪;唐煥文;;基于詞典法和機器學(xué)習(xí)法相結(jié)合的蛋白質(zhì)名識別[A];大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)術(shù)論文集(第2卷)[C];2005年
6 沈錢波;何加銘;;連筆手寫識別搜索算法研究[A];浙江省電子學(xué)會2008年學(xué)術(shù)年會論文集[C];2008年
7 王先梅;林子鈺;;基于HMM的脫機手寫大寫金額識別中的單分類器性能分析[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年
8 王穎;毋立芳;關(guān)媛;王涓涓;;基于LBP的SVM人臉姿勢估計方法[A];第十三屆全國信號處理學(xué)術(shù)年會(CCSP-2007)論文集[C];2007年
9 龔妙昆;萬福永;許建強;袁震東;;心電圖小波壓縮特征提取及SVM分類分析[A];2005中國控制與決策學(xué)術(shù)年會論文集(下)[C];2005年
10 李玉良;王良松;李晶;;圖像中數(shù)字字符識別技術(shù)概覽[A];節(jié)能環(huán)保 和諧發(fā)展——2007中國科協(xié)年會論文集(一)[C];2007年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 本報記者 許繼楠;博科資訊:Yigo語言助用戶快速響應(yīng)市場[N];中國計算機報;2011年
2 南方;博科資訊業(yè)務(wù)矩陣引發(fā)行業(yè)聚焦[N];中國企業(yè)報;2009年
3 本報記者 邱燕娜;新加坡:先流程化,后電子化構(gòu)建整合政府[N];中國計算機報;2010年
4 王;博科資訊2009年“加速度”戰(zhàn)略發(fā)布[N];國際商報;2009年
5 萊陽農(nóng)學(xué)院教育技術(shù)中心 徐鵬民;用MSSQL Serve 建立Internet上的全文檢索系統(tǒng)[N];計算機世界;2000年
6 記者 呂好問;博科資訊幫助全球億萬家企業(yè)挖掘新財源[N];中國國門時報;2008年
7 計世資訊 CCW Research;社保:向軟件和服務(wù)傾斜[N];計算機世界;2009年
8 姜靖;有道閱讀開啟資訊閱讀新模式[N];科技日報;2008年
9 本版編輯 中國科學(xué)院計算技術(shù)研究所數(shù)字媒體研究中心 山世光 陳熙霖 高文 徐昕 劉洪宇;你的臉,你的身份證明[N];中國計算機報;2006年
10 山東省交通廳科技處副處長 王其峰;六種出行信息方式 服務(wù)山東百姓[N];中國計算機報;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 楊顯飛;數(shù)據(jù)流集成分類器算法研究[D];哈爾濱工程大學(xué);2011年
2 王U,
本文編號:901198
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/901198.html