天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于高平均效用的模式挖掘算法研究

發(fā)布時(shí)間:2020-03-21 00:04
【摘要】:數(shù)據(jù)挖掘的主要目標(biāo)是從不同類型的數(shù)據(jù)集中挖掘出重要的,有意義的,具有潛在價(jià)值的信息。頻繁項(xiàng)集和關(guān)聯(lián)規(guī)則挖掘是模式挖掘中經(jīng)典的課題之一,其主要考慮項(xiàng)集的頻繁度并對(duì)得到的項(xiàng)集進(jìn)行關(guān)聯(lián)分析。頻繁項(xiàng)集挖掘僅考慮項(xiàng)集在數(shù)據(jù)集中出現(xiàn)的頻繁度,沒(méi)有涉及其他維度的信息。為發(fā)現(xiàn)更多有意義的模式,例如高利潤(rùn)的商品組合,通過(guò)綜合考慮項(xiàng)集的數(shù)量和利潤(rùn),高效用項(xiàng)集挖掘被提出用于挖掘出具有高效用的項(xiàng)集。高效用項(xiàng)集挖掘的缺點(diǎn)在于其沒(méi)有考慮項(xiàng)集的長(zhǎng)度,容易挖掘出無(wú)效的長(zhǎng)模式,其中組成長(zhǎng)模式的項(xiàng)的效用非常低。因此,通過(guò)綜合考慮效用和長(zhǎng)度,高平均效用項(xiàng)集挖掘被提出,在高平均效用的概念框架下,本文主要解決目前存在的三個(gè)問(wèn)題。針對(duì)現(xiàn)有算法在挖掘增量式數(shù)據(jù)集時(shí)效率低下問(wèn)題,本文提出了一個(gè)基于HAUP-tree樹模式的算法。該算法在內(nèi)存中維護(hù)一個(gè)特殊的樹結(jié)構(gòu),用于保存歷史數(shù)據(jù)集的必要信息。每當(dāng)有新數(shù)據(jù)插入時(shí),算法只需要對(duì)新增數(shù)據(jù)進(jìn)行遍歷獲取必要信息,然后基于設(shè)計(jì)的快速更新策略,更新內(nèi)存中的樹結(jié)構(gòu),并執(zhí)行挖掘算法。相比現(xiàn)有算法,該算法僅需要很少次數(shù)的數(shù)據(jù)集遍歷就能達(dá)到和現(xiàn)有算法一樣的挖掘效果。由于現(xiàn)有算法采用的上限模型過(guò)于寬松,因此本文提出了一個(gè)更加高效的算法,該算法通過(guò)設(shè)計(jì)的二個(gè)新上限模型和基于該模型的剪枝策略,減小了搜索空間,提升了項(xiàng)集挖掘的效率。新的上限模型從理論上保證了新算法的搜索空間小于采用舊上限模型的算法。由于現(xiàn)有算法都是在設(shè)置單一閾值的情況下挖掘項(xiàng)集,忽略了數(shù)據(jù)集中不同項(xiàng)的特點(diǎn),容易導(dǎo)致稀有項(xiàng)解問(wèn)題,即設(shè)置過(guò)大的閾值容易漏掉有意義的項(xiàng)集,而設(shè)置過(guò)小則又易挖掘出許多無(wú)意義的項(xiàng)集。針對(duì)該問(wèn)題,本文提出了基于多閾值的高平均效用項(xiàng)集算法,該算法能夠克服現(xiàn)有算法低效的弱點(diǎn),通過(guò)設(shè)計(jì)的排序搜索樹保證上限模型的向下封閉性,并基于優(yōu)化的平均效用表結(jié)構(gòu)設(shè)計(jì)剪枝策略,減小搜索空間,避免現(xiàn)有算法頻繁掃描數(shù)據(jù)庫(kù)的缺點(diǎn)。本文針對(duì)性的解決了高平均效用項(xiàng)集中的三個(gè)基本問(wèn)題,并設(shè)計(jì)和運(yùn)行大量實(shí)驗(yàn)驗(yàn)證了本文所提出算法的有效性,其均能克服現(xiàn)有算法的缺點(diǎn),達(dá)到更高效更節(jié)省內(nèi)存的目標(biāo)。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 徐涵;黃衛(wèi)東;劉國(guó)祥;張歆;劉帥;吳群紅;徐岳;;成本-效用分析中效用值的測(cè)量方法[J];中國(guó)衛(wèi)生經(jīng)濟(jì);2016年01期

2 徐喜卿;王珉;李順平;陳鋼;;乳腺癌患者健康效用值測(cè)量研究[J];中國(guó)衛(wèi)生經(jīng)濟(jì);2016年03期

3 伍紅艷;孫利華;;時(shí)間權(quán)衡法在測(cè)量健康狀態(tài)效用值中的應(yīng)用及問(wèn)題探討[J];中國(guó)藥房;2012年44期

4 王倬彥;一種確定效用值的隸屬函數(shù)[J];系統(tǒng)工程理論與實(shí)踐;1988年03期

5 高振峰;劉喜更;;效用值決策法在分析品種區(qū)域結(jié)果中的應(yīng)用[J];河北農(nóng)業(yè)大學(xué)學(xué)報(bào);1988年04期

6 付希婧;梁敏洪;孫茂;高鵬;孔彩;朱文濤;;映射法在健康效用值測(cè)量中的應(yīng)用研究[J];中國(guó)衛(wèi)生經(jīng)濟(jì);2014年10期

7 周挺;馬愛(ài)霞;;不同時(shí)間權(quán)衡法在健康效用值研究中的應(yīng)用[J];中國(guó)衛(wèi)生經(jīng)濟(jì);2017年01期

8 孫園園;余正;李洪超;;健康效用值測(cè)量中的映射法及其相關(guān)模型概述[J];中國(guó)藥房;2017年29期

9 伍紅艷;孫利華;;歐洲五維健康量表效用值積分體系構(gòu)建方法及結(jié)果的國(guó)際比較[J];中國(guó)新藥雜志;2012年06期

10 邢文榮,邵元福,張純,陳盛新;健康效用值及其測(cè)量方法的選擇[J];藥物流行病學(xué)雜志;1999年04期

相關(guān)會(huì)議論文 前3條

1 楊東升;苗永強(qiáng);;改進(jìn)模糊Borda法在風(fēng)險(xiǎn)分析過(guò)程中應(yīng)用研究[A];2012年中國(guó)航空學(xué)會(huì)管理科學(xué)分會(huì)學(xué)術(shù)交流會(huì)論文集[C];2012年

2 張培培;韓明亮;;旅客運(yùn)輸綜合交通網(wǎng)絡(luò)運(yùn)能分配優(yōu)化[A];中國(guó)企業(yè)運(yùn)籌學(xué)第十屆學(xué)術(shù)年會(huì)論文集[C];2015年

3 張雨;李漢文;;政府采購(gòu)多目標(biāo)風(fēng)險(xiǎn)型概率決策[A];第二屆全國(guó)大學(xué)生政府采購(gòu)論壇論文集[C];2014年

相關(guān)重要報(bào)紙文章 前6條

1 華高萊斯國(guó)際地產(chǎn)顧問(wèn)(北京)有限公司;地產(chǎn)行業(yè)的深度調(diào)研[N];中國(guó)房地產(chǎn)報(bào);2004年

2 廖聯(lián)明 黃靜;QALY脫穎而出[N];醫(yī)藥經(jīng)濟(jì)報(bào);2018年

3 馮剛耀;藥品怎能不看市場(chǎng)的臉色?[N];醫(yī)藥經(jīng)濟(jì)報(bào);2003年

4 記者 劉小微;環(huán)境風(fēng)險(xiǎn)管理“利器”效用值得期待[N];金融時(shí)報(bào);2013年

5 劉秀羅 劉寶宏;數(shù)字化真實(shí)世界[N];計(jì)算機(jī)世界;2001年

6 哈爾濱工業(yè)大學(xué) 董雪艷 王鐵男 趙超;合理利用企業(yè)資源的效用度量和匹配測(cè)度模型促進(jìn)龍江經(jīng)濟(jì)可持續(xù)發(fā)展[N];哈爾濱日?qǐng)?bào);2017年

相關(guān)博士學(xué)位論文 前4條

1 伍紅艷;健康效用值測(cè)量研究[D];沈陽(yáng)藥科大學(xué);2012年

2 吳春眉;EQ-5D效用值中國(guó)積分體系應(yīng)用于中國(guó)人群的可適性研究[D];華中科技大學(xué);2017年

3 楊君;支持敏捷服務(wù)優(yōu)化的綠色云計(jì)算關(guān)鍵技術(shù)研究[D];南京大學(xué);2017年

4 周歡;機(jī)會(huì)移動(dòng)網(wǎng)絡(luò)中的數(shù)據(jù)傳輸機(jī)制研究[D];浙江大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 任師鋒;基于高平均效用的模式挖掘算法研究[D];哈爾濱工業(yè)大學(xué);2018年

2 管娟中;基于時(shí)間權(quán)衡法的安徽省農(nóng)村人群健康效用值測(cè)量研究[D];安徽醫(yī)科大學(xué);2018年

3 劉利;成本效用分析中效用值測(cè)量方法的應(yīng)用研究[D];北京中醫(yī)藥大學(xué);2012年

4 徐喜卿;乳腺癌患者不同健康效用值測(cè)量方式的比較研究[D];山東大學(xué);2015年

5 付希婧;映射法在健康效用值測(cè)量中的應(yīng)用研究[D];北京中醫(yī)藥大學(xué);2015年

6 呂存?zhèn)?面向效用的模式挖掘算法研究[D];浙江工業(yè)大學(xué);2017年

7 徐斌;中國(guó)上市公司財(cái)務(wù)指標(biāo)評(píng)估體系研究[D];清華大學(xué);2005年

8 Geoffrey Eustace Mtui;面向最優(yōu)效用的機(jī)器學(xué)習(xí)隱私模型[D];哈爾濱工業(yè)大學(xué);2017年

9 叢建輝;品牌、價(jià)格與綠色認(rèn)證:食用油消費(fèi)影響因素的聯(lián)合分析[D];山東師范大學(xué);2011年

10 李霆;基于不確定數(shù)據(jù)的高平均效用序列模式挖掘算法的研究[D];哈爾濱工業(yè)大學(xué);2016年

,

本文編號(hào):2592408

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2592408.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b7d65***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com