基于大規(guī)模社會調(diào)查的流數(shù)據(jù)關(guān)聯(lián)規(guī)則分析
【圖文】:
繼數(shù)據(jù)流模型被提出之后,學(xué)者們又在 1999~2002 年間陸續(xù)提出了許多數(shù)據(jù)流處理技術(shù)和方法(如圖 1-1),并在靜態(tài)關(guān)聯(lián)規(guī)則挖掘的思想基礎(chǔ)上結(jié)合數(shù)據(jù)流模型數(shù)據(jù)流預(yù)處理技術(shù),使得流關(guān)聯(lián)規(guī)則挖掘算法在 2002 后得到了迅速的發(fā)展。這些算中,國外比較有代表性的有基于界標(biāo)窗口的 Lossy _ counting算法、韓家煒[8](美籍人)的基于滑動窗口的 FP_stream 算法、以及基于衰減窗口的 estDec 算法Lossy _ counting將抽樣技術(shù)與窗口技術(shù)結(jié)合,在界標(biāo)窗口上實(shí)現(xiàn)了對全局頻繁模式挖掘要求、FP_stream 算法以FP_growth 為基礎(chǔ),在滑動窗口上實(shí)現(xiàn)了多時(shí)間粒度下存頻繁模式,滿足了時(shí)間敏感的查詢需求、estDec將衰減因子引入窗口模型,在一程度上消除了歷史挖掘結(jié)果對當(dāng)前挖掘結(jié)果的影響。國內(nèi)比較有代表性的研究如李微教授[9]提出的 MSW 算法、劉學(xué)軍等人[10]的 FP-CDS 算法。這兩種算法都借鑒FP_growth 的挖掘策略,并以此為基礎(chǔ)做出的相應(yīng)改進(jìn),因此都屬于“類 FP_grow算法?傮w來說,從 1993~2002 年經(jīng)過近十年的發(fā)展,,數(shù)據(jù)流關(guān)聯(lián)規(guī)則挖掘體系(下簡稱流關(guān)聯(lián)挖掘)已經(jīng)日趨成熟。但是,在其后續(xù)的發(fā)展中(2002~現(xiàn)在)仍存在一亟待解決的問題,如二次掃描、頻繁模式的更新、剪枝策略等問題。
論文組織結(jié)構(gòu)
【學(xué)位授予單位】:長春理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:C915
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王巍;黨甄甄;劉美爽;;數(shù)據(jù)挖掘技術(shù)在食品配餐中的應(yīng)用[J];美食研究;2015年03期
2 向晶;;人口結(jié)構(gòu)調(diào)整對我國城鎮(zhèn)居民消費(fèi)的影響[J];經(jīng)濟(jì)理論與經(jīng)濟(jì)管理;2013年12期
3 林光華;沈衛(wèi)平;錢鑫;;耐用品消費(fèi)的內(nèi)需擴(kuò)大效應(yīng)——基于農(nóng)村家庭支出結(jié)構(gòu)的視角[J];江蘇社會科學(xué);2013年06期
4 劉大為;王麗媛;;城鎮(zhèn)居民的耐用品消費(fèi)差異研究[J];未來與發(fā)展;2013年11期
5 丁繼紅;應(yīng)美玲;杜在超;;我國農(nóng)村家庭消費(fèi)行為研究——基于健康風(fēng)險(xiǎn)與醫(yī)療保障視角的分析[J];金融研究;2013年10期
6 黃瀟;;健康在多大程度上引致貧困脆弱性——基于CHNS農(nóng)村數(shù)據(jù)的經(jīng)驗(yàn)分析[J];統(tǒng)計(jì)與信息論壇;2013年09期
7 張兵兵;徐康寧;;影響耐用品消費(fèi)需求的因素研究——來自美國家庭汽車消費(fèi)市場的經(jīng)驗(yàn)分析[J];軟科學(xué);2013年07期
8 王波;吳子玉;;大數(shù)據(jù)時(shí)代精準(zhǔn)營銷模式研究[J];經(jīng)濟(jì)師;2013年05期
9 張建林;周超良;;關(guān)聯(lián)規(guī)則在股票板塊聯(lián)動分析中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2013年02期
10 孫巍;楊程博;謝淑萍;;現(xiàn)階段城鎮(zhèn)居民耐用品消費(fèi)行為特征變化的計(jì)量研究[J];學(xué)習(xí)與探索;2013年01期
本文編號:2606384
本文鏈接:http://www.sikaile.net/shekelunwen/shgj/2606384.html