多種數(shù)據(jù)挖掘技術對于電子商務分類問題研究
本文關鍵詞:多種數(shù)據(jù)挖掘技術對于電子商務分類問題研究
更多相關文章: 數(shù)據(jù)挖掘 電子商務 分類模型
【摘要】:電子商務行業(yè)競爭激烈,數(shù)據(jù)的價值正日益受到市場的重視。然而,相關統(tǒng)計工具僅提供統(tǒng)計信息、統(tǒng)計模型和假設檢驗結(jié)論,仍缺乏對數(shù)據(jù)空間的細節(jié)認知。而數(shù)據(jù)挖掘技術正是從數(shù)據(jù)空間和信息論的角度對數(shù)據(jù)進行分析,給出宏觀與微觀的數(shù)據(jù)結(jié)構特征,并利用這些特征幫助對未分類數(shù)據(jù)進行預測。不同領域的數(shù)據(jù)具有不同的分布特征,且名義屬性、數(shù)值屬性的分類效率是截然不同的,這使得傳統(tǒng)分類器只適用于特定的場合。普適優(yōu)化的分類器模型需要在克服以上困難的同時,利用盡可能多的信息對一個分類問題進行建模,以統(tǒng)一的方法和流程提供數(shù)據(jù)空間的特征知識,提升預測性能水平?紤]到電子商務數(shù)據(jù)集的數(shù)據(jù)量一般較大,分類器應盡量分散計算負擔,以提高訓練和預測計算速度。同時,電子商務的數(shù)據(jù)具有分布式,流量大等特點,其數(shù)據(jù)需要被有效整合并理解,以促進企業(yè)的發(fā)展。本文對數(shù)據(jù)挖掘相關技術進行了分析,指出現(xiàn)有技術存在的不足,如對數(shù)據(jù)類型,尺度和結(jié)構限制較多,且分類模型并非普適,對大型數(shù)據(jù)運算較慢等。本文描述了產(chǎn)生上述不足的原因,在改進現(xiàn)有挖掘技術的基礎上,提出針對電子商務數(shù)據(jù)分布特點的新模型,并給出實驗結(jié)果和模型的加速性能,通過和現(xiàn)有模型的對比,論證該模型方案的有效性和優(yōu)越性,同時,明確相關指標閥值的重要性。
【關鍵詞】:數(shù)據(jù)挖掘 電子商務 分類模型
【學位授予單位】:復旦大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP311.13
【目錄】:
- 摘要5-6
- Abstract6-7
- 第一章 引言7-10
- 1.1 研究背景7-8
- 1.2 本文貢獻8-9
- 1.3 本文結(jié)構9-10
- 第二章 預備知識及定義10-12
- 2.1 屬性分類10
- 2.2 數(shù)據(jù)預處理10-11
- 2.3 數(shù)據(jù)分群11-12
- 第三章 數(shù)據(jù)挖掘算法分析12-30
- 3.1 聚類12-16
- 3.1.1 基于中心聚類12-13
- 3.1.2 基于密度聚類及可視化改進13-15
- 3.1.3 聚類評價指標15-16
- 3.2 非線性分類器16-30
- 3.2.1 決策樹16-18
- 3.2.2 神經(jīng)網(wǎng)絡及算法改進18-23
- 3.2.3 神經(jīng)網(wǎng)絡堆疊泛化及算法改進23-24
- 3.2.4 高斯過程24-29
- 3.2.5 預測準確度定義29-30
- 第四章 電子商務分類優(yōu)化整合模型設計30-43
- 4.1 聚類算法特性分析30-32
- 4.2 非線性分類器特性分析32-34
- 4.3 模型設計方案34-41
- 4.3.1 模型設計思路34-37
- 4.3.2 模型訓練37-39
- 4.3.3 模型預測39-41
- 4.3.4 模型準確度定義41
- 4.4 G-KM-NC模型綜述41-43
- 第五章 模型性能分析43-63
- 5.1 實驗1,互聯(lián)網(wǎng)廣告43-53
- 5.1.1 性能基線44
- 5.1.2 分群44-49
- 5.1.3 分群+聚類49-52
- 5.1.4 加速52
- 5.1.5 小結(jié)52-53
- 5.2 實驗2,小額信貸審批53-61
- 5.2.1 性能基線55
- 5.2.2 分群55-57
- 5.2.3 分群+聚類57-59
- 5.2.4 加速59-60
- 5.2.5 小結(jié)60-61
- 5.3 模型性能綜述61-63
- 第六章 總結(jié)63-64
- 參考文獻64-68
- 致謝68-69
- 碩士期間發(fā)表的論文69-70
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張紅軍;談談數(shù)據(jù)挖掘技術及其應用[J];廣西梧州師范高等?茖W校學報;2003年03期
2 楊雪;淺析數(shù)據(jù)挖掘技術[J];華南金融電腦;2005年08期
3 李繼嵬;劉書明;李春平;;數(shù)據(jù)挖掘技術在稅收預測分析中的應用[J];計算機系統(tǒng)應用;2006年09期
4 劉春明;;數(shù)據(jù)挖掘技術在金融行業(yè)中的應用[J];科技資訊;2006年25期
5 勞飛;朱玉業(yè);;數(shù)據(jù)挖掘技術在農(nóng)業(yè)中的應用[J];安徽農(nóng)業(yè)科學;2007年13期
6 何樹稱;羅嵐;;數(shù)據(jù)挖掘技術在客戶獲取中的應用分析[J];保山師專學報;2007年02期
7 汪楠;成鷹;崔婀娜;;數(shù)據(jù)挖掘技術怎么用[J];經(jīng)營與管理;2007年07期
8 馬騁;;數(shù)據(jù)挖掘技術探討[J];化工之友;2007年17期
9 趙穎;;數(shù)據(jù)挖掘技術在政府電子政務中的應用[J];軟件導刊;2008年11期
10 徐曉偉;;淺談數(shù)據(jù)挖掘技術[J];福建電腦;2008年12期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 孫義明;曾繼東;;數(shù)據(jù)挖掘技術及其應用[A];全國計算機安全學術交流會論文集(第二十二卷)[C];2007年
2 馬洪杰;曲曉飛;;數(shù)據(jù)挖掘技術和過程的特點[A];面向21世紀的科技進步與社會經(jīng)濟發(fā)展(上冊)[C];1999年
3 寧紅梅;安志興;葛亞明;李敬璽;趙坤;鐘華;陳俊杰;崔艷紅;;數(shù)據(jù)挖掘技術在獸醫(yī)學中的應用[A];Proceedings of 2010 National Vocational Education of Communications and Information Technology Conference (2010 NVCIC)[C];2010年
4 王桂芹;黃道;;數(shù)據(jù)挖掘技術綜述[A];計算機技術與應用進展·2007——全國第18屆計算機技術與應用(CACIS)學術會議論文集[C];2007年
5 徐寶蓮;李曉奇;;數(shù)據(jù)挖掘技術在網(wǎng)絡游戲中的應用[A];第十一屆中國不確定系統(tǒng)年會、第十五屆中國青年信息與管理學者大會論文集[C];2013年
6 胡廣芹;陸小左;;數(shù)據(jù)挖掘技術在中醫(yī)診斷中的應用[A];中國中西醫(yī)結(jié)合學會診斷專業(yè)委員會2009’年會論文集[C];2009年
7 戈欣;吳曉芬;許建榮;;數(shù)據(jù)挖掘技術在放射科醫(yī)療管理中的潛在作用[A];2009中華醫(yī)學會影像技術分會第十七次全國學術大會論文集[C];2009年
8 鐵軍;吳智明;;數(shù)據(jù)挖掘技術在工業(yè)鋁電解生產(chǎn)中的應用[A];第十九屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2002年
9 王建華;王菲;黃國建;;數(shù)據(jù)挖掘技術研究的現(xiàn)狀及展望[A];中國運籌學會第六屆學術交流會論文集(上卷)[C];2000年
10 肖健華;吳今培;;數(shù)據(jù)挖掘技術及其應用實例[A];2001年中國智能自動化會議論文集(下冊)[C];2001年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 記者 呂賢如;大力加強數(shù)據(jù)挖掘技術研究應用[N];光明日報;2006年
2 主持人 李禾;數(shù)據(jù)挖掘技術如何驅(qū)動經(jīng)濟車輪[N];科技日報;2007年
3 梅靜彥;數(shù)據(jù)挖掘技術在美國銀行的應用[N];金融時報;2006年
4 鄒廣普;數(shù)據(jù)挖掘技術在保險業(yè)中的應用[N];中國保險報;2010年
5 陳曉 山西財經(jīng)大學教師;數(shù)據(jù)挖掘技術在高校教學管理中的應用[N];山西經(jīng)濟日報;2010年
6 張崇峰;挖掘,再挖掘[N];中國計算機報;2003年
7 劉紅巖、何軍;利用數(shù)據(jù)挖掘技術獲得商業(yè)智能[N];中國計算機報;2003年
8 ;IBM公司推出新型數(shù)據(jù)挖掘技術[N];中國高新技術產(chǎn)業(yè)導報;2001年
9 劉軍 蘭小紅 龔富強;新技術為老裝備“保駕護航”[N];大眾科技報;2006年
10 ;軟件產(chǎn)業(yè)人才培養(yǎng)又辟新路[N];中國高新技術產(chǎn)業(yè)導報;2000年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 姚山;基于數(shù)據(jù)挖掘技術的造林決策研究[D];北京林業(yè)大學;2008年
2 曹秀英;基于粗集的數(shù)據(jù)挖掘技術及其應用研究[D];哈爾濱工程大學;2003年
3 伍平陽;基于數(shù)據(jù)挖掘技術的醫(yī)療設備績效預測方法的應用研究[D];南方醫(yī)科大學;2008年
4 劉剛;數(shù)據(jù)挖掘技術與分類算法研究[D];中國人民解放軍信息工程大學;2004年
5 王勇;時序數(shù)據(jù)挖掘技術及其在水質(zhì)預測中的應用研究[D];廣東工業(yè)大學;2005年
6 毛國君;數(shù)據(jù)挖掘技術與關聯(lián)規(guī)則挖掘算法研究[D];北京工業(yè)大學;2003年
7 熊忠陽;面向商業(yè)智能的并行數(shù)據(jù)挖掘技術及應用研究[D];重慶大學;2004年
8 朱恒民;領域知識制導的數(shù)據(jù)挖掘技術及其在中藥提取中的應用[D];南京航空航天大學;2006年
9 王萍;基于數(shù)據(jù)挖掘技術的消費者行為研究[D];吉林大學;2004年
10 白一鳴;基于數(shù)據(jù)挖掘技術的模糊推理系統(tǒng)設計[D];大連海事大學;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 吳輝;數(shù)據(jù)挖掘技術的研究與應用[D];武漢理工大學;2009年
2 馮璐;基于數(shù)據(jù)挖掘技術的犯罪規(guī)律分析研究[D];青島大學;2009年
3 郭珉江;數(shù)據(jù)挖掘技術在疾病診斷相關分組中的應用[D];中南大學;2009年
4 倪泉;基于數(shù)據(jù)挖掘技術的保險續(xù)期催交方法研究[D];華東師范大學;2006年
5 張晨希;數(shù)據(jù)挖掘技術在股票預測中的應用[D];安徽大學;2006年
6 安建華;數(shù)據(jù)挖掘技術在零售業(yè)中的應用研究[D];東北財經(jīng)大學;2005年
7 沈捷;數(shù)據(jù)挖掘技術在銀行反洗錢領域中的應用研究[D];浙江大學;2007年
8 賈琳;數(shù)據(jù)挖掘技術及應用的研究[D];蘭州理工大學;2003年
9 許惠君;數(shù)據(jù)挖掘技術及其在徑流預報中的研究與應用[D];華中科技大學;2006年
10 張颯;數(shù)據(jù)挖掘技術在銀行監(jiān)管工作中的應用[D];吉林大學;2007年
,本文編號:1097380
本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/1097380.html