基于Solr和Mahout在線資訊自動(dòng)分類與全文搜索引擎的實(shí)現(xiàn)
本文關(guān)鍵詞:基于Solr和Mahout在線資訊自動(dòng)分類與全文搜索引擎的實(shí)現(xiàn)
更多相關(guān)文章: 文本自動(dòng)分類 分類器 資訊 信息服務(wù)方式 分類算法 全文檢索系統(tǒng) 檢索界面 全文索引 業(yè)務(wù)需求 用戶要求
【摘要】:正在當(dāng)前信息爆炸式增長(zhǎng)的時(shí)代,用戶對(duì)信息服務(wù)的需求已經(jīng)從信息匯聚為主的廣播式服務(wù)逐漸過(guò)渡到要求提供按需、定制化、定向的集成化信息服務(wù)。用戶要求能按照其特定的業(yè)務(wù)需求,對(duì)信息進(jìn)行預(yù)加工、過(guò)濾后,提供給他們精品化的"干貨"。這對(duì)我們通訊社的信息服務(wù)方式也提出了新的要求。在大數(shù)據(jù)時(shí)代,信息量呈幾何方式增長(zhǎng),同時(shí)我們也積累了大量的歷史資訊數(shù)據(jù),如果不能對(duì)
【作者單位】: 新華社技術(shù)局;
【關(guān)鍵詞】: 文本自動(dòng)分類 分類器 資訊 信息服務(wù)方式 分類算法 全文檢索系統(tǒng) 檢索界面 全文索引 業(yè)務(wù)需求 用戶要求
【分類號(hào)】:TP391.3
【正文快照】: 在當(dāng)前信息爆炸式增長(zhǎng)的時(shí)代,用戶對(duì)信息服務(wù)的需求已經(jīng)從信息匯聚為主的廣播式服務(wù)逐漸過(guò)渡到要求提供按需、定制化、定向的集成化信息服務(wù)。用戶要求能按照其特定的業(yè)務(wù)需求,對(duì)信息進(jìn)行預(yù)加工、過(guò)濾后,提供給他們精品化的“干貨”。這對(duì)我們通訊社的信息服務(wù)方式也提出了新
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉苗;謝邦昌;;基于概率潛在語(yǔ)義分析和Adaboost算法的文本分類技術(shù)研究[J];統(tǒng)計(jì)與決策;2010年19期
2 許璐蕾;;面向搜索引擎的文本自動(dòng)分類系統(tǒng)實(shí)現(xiàn)[J];蘇州市職業(yè)大學(xué)學(xué)報(bào);2007年04期
3 郭少友;;基于詞語(yǔ)上下文關(guān)系的文本自動(dòng)分類方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2008年05期
4 劉冬梅;王俊義;;HTML文本自動(dòng)分類預(yù)處理方法的研究應(yīng)用[J];內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年01期
5 夏火松;劉建;;基于VSM的文本分類挖掘算法綜述[J];情報(bào)探索;2010年09期
6 牟堯;李曦;;關(guān)于文本自動(dòng)分類算法的研究——以檔案自動(dòng)歸類的應(yīng)用為例[J];中國(guó)西部科技;2011年24期
7 張婷慧,耿煥同,蔡慶生;基于CBR的文本自動(dòng)分類研究[J];計(jì)算機(jī)應(yīng)用;2005年09期
8 張婷慧;耿煥同;蔡慶生;;一種改進(jìn)的VSM及其在文本自動(dòng)分類中的應(yīng)用[J];微電子學(xué)與計(jì)算機(jī);2005年12期
9 胡燕;熊浩勇;付香英;;線性可分文本的SVM算法研究與改進(jìn)[J];計(jì)算機(jī)與數(shù)字工程;2008年03期
10 付香英;王春麗;王芳;;非線性可分文本的SVM算法研究與改進(jìn)[J];九江學(xué)院學(xué)報(bào);2008年03期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 雷蕾;吳乃君;劉鵬;劉蘭娟;;靈敏度分析:分類器中的缺失數(shù)據(jù)[A];第11屆海峽兩岸信息管理發(fā)展策略研討會(huì)論文集[C];2005年
2 穆明生;;基于特征集的多種分類器模型的在線筆跡認(rèn)證[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
3 徐蔚然;于武貴;郭軍;;基于統(tǒng)計(jì)方法的混排文字切分與分類[A];第八屆全國(guó)漢字識(shí)別學(xué)術(shù)會(huì)議論文集[C];2002年
4 劉艷民;;中文網(wǎng)頁(yè)分類方法的研究[A];2009年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2009年
5 李剛;郭崇慧;林鴻飛;楊志豪;唐煥文;;基于詞典法和機(jī)器學(xué)習(xí)法相結(jié)合的蛋白質(zhì)名識(shí)別[A];大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)術(shù)論文集(第2卷)[C];2005年
6 沈錢波;何加銘;;連筆手寫識(shí)別搜索算法研究[A];浙江省電子學(xué)會(huì)2008年學(xué)術(shù)年會(huì)論文集[C];2008年
7 王先梅;林子鈺;;基于HMM的脫機(jī)手寫大寫金額識(shí)別中的單分類器性能分析[A];2006中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2006年
8 王穎;毋立芳;關(guān)媛;王涓涓;;基于LBP的SVM人臉姿勢(shì)估計(jì)方法[A];第十三屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2007)論文集[C];2007年
9 龔妙昆;萬(wàn)福永;許建強(qiáng);袁震東;;心電圖小波壓縮特征提取及SVM分類分析[A];2005中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集(下)[C];2005年
10 李玉良;王良松;李晶;;圖像中數(shù)字字符識(shí)別技術(shù)概覽[A];節(jié)能環(huán)保 和諧發(fā)展——2007中國(guó)科協(xié)年會(huì)論文集(一)[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 本報(bào)記者 許繼楠;博科資訊:Yigo語(yǔ)言助用戶快速響應(yīng)市場(chǎng)[N];中國(guó)計(jì)算機(jī)報(bào);2011年
2 南方;博科資訊業(yè)務(wù)矩陣引發(fā)行業(yè)聚焦[N];中國(guó)企業(yè)報(bào);2009年
3 本報(bào)記者 邱燕娜;新加坡:先流程化,后電子化構(gòu)建整合政府[N];中國(guó)計(jì)算機(jī)報(bào);2010年
4 王;博科資訊2009年“加速度”戰(zhàn)略發(fā)布[N];國(guó)際商報(bào);2009年
5 萊陽(yáng)農(nóng)學(xué)院教育技術(shù)中心 徐鵬民;用MSSQL Serve 建立Internet上的全文檢索系統(tǒng)[N];計(jì)算機(jī)世界;2000年
6 記者 呂好問(wèn);博科資訊幫助全球億萬(wàn)家企業(yè)挖掘新財(cái)源[N];中國(guó)國(guó)門時(shí)報(bào);2008年
7 計(jì)世資訊 CCW Research;社保:向軟件和服務(wù)傾斜[N];計(jì)算機(jī)世界;2009年
8 姜靖;有道閱讀開(kāi)啟資訊閱讀新模式[N];科技日?qǐng)?bào);2008年
9 本版編輯 中國(guó)科學(xué)院計(jì)算技術(shù)研究所數(shù)字媒體研究中心 山世光 陳熙霖 高文 徐昕 劉洪宇;你的臉,你的身份證明[N];中國(guó)計(jì)算機(jī)報(bào);2006年
10 山東省交通廳科技處副處長(zhǎng) 王其峰;六種出行信息方式 服務(wù)山東百姓[N];中國(guó)計(jì)算機(jī)報(bào);2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 楊顯飛;數(shù)據(jù)流集成分類器算法研究[D];哈爾濱工程大學(xué);2011年
2 王U,
本文編號(hào):901198
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/901198.html