隨機森林在運營商大數(shù)據(jù)補全中的應用
本文關鍵詞:隨機森林在運營商大數(shù)據(jù)補全中的應用,由筆耕文化傳播整理發(fā)布。
【摘要】:電信運營商有大量數(shù)據(jù),但是鑒于多種原因,數(shù)據(jù)的質(zhì)量不夠理想,出現(xiàn)大量數(shù)據(jù)不完整甚至缺失。對于已有數(shù)據(jù)的挖掘,必須在數(shù)據(jù)滿足質(zhì)量要求且達到足夠采樣比例的前提下開展。依托現(xiàn)有的全國日志留存系統(tǒng),設計完整數(shù)據(jù)的模板樣庫,鑒別不能滿足質(zhì)量要求的數(shù)據(jù),使用隨機森林算法,找到最符合的相同或相關數(shù)據(jù),補全數(shù)據(jù)并提升數(shù)據(jù)質(zhì)量;用回溯反饋的方法優(yōu)化并擴充模板樣庫。在全國日志留存系統(tǒng)中構(gòu)建數(shù)據(jù)補全子系統(tǒng),實現(xiàn)端到端的數(shù)據(jù)質(zhì)量保障和提升,補全并改善歷史數(shù)據(jù)甚至實時數(shù)據(jù)的質(zhì)量,最終滿足數(shù)據(jù)處理和挖掘的要求,提升運營商數(shù)據(jù)質(zhì)量和價值。
【作者單位】: 中國電信股份有限公司上海研究院;
【關鍵詞】: 大數(shù)據(jù) 隨機森林 機器學習 數(shù)據(jù)補全
【分類號】:F626;TP311.13
【正文快照】: 1引言電信運營商是天然的大數(shù)據(jù)擁有者,擁有著基于用戶的信令、上網(wǎng)、位置等多種類型的數(shù)據(jù)。隨著近年大數(shù)據(jù)技術發(fā)展和應用推廣,電信運營商也愈發(fā)重視數(shù)據(jù)這一戰(zhàn)略資產(chǎn),研發(fā)了多種基于大數(shù)據(jù)技術的平臺和系統(tǒng),用來收集、存儲、處理、開放和應用電信運營商的數(shù)據(jù),體現(xiàn)電信運營
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉足華;熊惠霖;;基于隨機森林的目標檢測與定位[J];計算機工程;2012年13期
2 董師師;黃哲學;;隨機森林理論淺析[J];集成技術;2013年01期
3 陳姝;彭小寧;;基于粒子濾波和在線隨機森林分類的目標跟蹤[J];江蘇大學學報(自然科學版);2014年02期
4 王麗婷;丁曉青;方馳;;基于隨機森林的人臉關鍵點精確定位方法[J];清華大學學報(自然科學版);2009年04期
5 李建更;高志坤;;隨機森林針對小樣本數(shù)據(jù)類權(quán)重設置[J];計算機工程與應用;2009年26期
6 吳華芹;;基于訓練集劃分的隨機森林算法[J];科技通報;2013年10期
7 程光;王貴錦;何禮;林行剛;;人體姿勢估計中隨機森林訓練算法的并行化[J];計算機應用研究;2014年05期
8 于延;王建華;;基于云計算平臺的隨機森林算法的研究與實現(xiàn)[J];科技通報;2013年04期
9 劉永春;宋弘;;基于隨機森林的乳腺腫瘤診斷研究[J];電視技術;2014年15期
10 楊帆;林琛;周綺鳳;符長虹;羅林開;;基于隨機森林的潛在k近鄰算法及其在基因表達數(shù)據(jù)分類中的應用[J];系統(tǒng)工程理論與實踐;2012年04期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 謝程利;王金橋;盧漢清;;核森林及其在目標檢測中的應用[A];第六屆和諧人機環(huán)境聯(lián)合學術會議(HHME2010)、第19屆全國多媒體學術會議(NCMT2010)、第6屆全國人機交互學術會議(CHCI2010)、第5屆全國普適計算學術會議(PCC2010)論文集[C];2010年
2 武曉巖;方慶偉;;基因表達數(shù)據(jù)分析的隨機森林方法及算法改進[A];黑龍江省第十次統(tǒng)計科學討論會論文集[C];2008年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 賀捷;隨機森林在文本分類中的應用[D];華南理工大學;2015年
2 張文婷;交通環(huán)境下基于改進霍夫森林的目標檢測與跟蹤[D];華南理工大學;2015年
3 王宇恒;推薦系統(tǒng)中隨機森林算法的優(yōu)化與應用[D];浙江大學;2016年
4 張玉桃;旅客社會網(wǎng)絡中的家庭出行預測及其行為特征分析[D];北京交通大學;2016年
5 張興;基于Spark大數(shù)據(jù)平臺的火電廠節(jié)能分析[D];太原理工大學;2016年
6 楊麗;音頻場景分析與識別方法研究[D];南京大學;2013年
7 魯奉軍;基于隨機森林算法的目標檢測與動作識別方法研究[D];吉林大學;2016年
8 吳敏;融合多特征的產(chǎn)品垃圾評論識別[D];福州大學;2012年
9 鐘龍申;隨機森林算法處理不平衡數(shù)據(jù)的改進及其并行化[D];廣東工業(yè)大學;2016年
10 胡太祥;大規(guī)模圖像標注方法研究[D];華中科技大學;2014年
本文關鍵詞:隨機森林在運營商大數(shù)據(jù)補全中的應用,由筆耕文化傳播整理發(fā)布。
,本文編號:478210
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/478210.html