天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 領導決策論文 >

考慮特征變量異質(zhì)性的分類方法及其在風險決策中的應用研究

發(fā)布時間:2017-05-18 19:06

  本文關鍵詞:考慮特征變量異質(zhì)性的分類方法及其在風險決策中的應用研究,由筆耕文化傳播整理發(fā)布。


【摘要】: 風險決策中廣泛存在著具有如下特征的一類問題,即風險決策者首先需要建立歷史數(shù)據(jù)樣本與自然狀態(tài)之間的依賴關系,然后根據(jù)該依賴關系估計一個新的數(shù)據(jù)樣本所對應自然狀態(tài)的出現(xiàn)概率,最后建立風險決策模型,以最大化收益函數(shù)(或最小化風險損失函數(shù))為目標選擇最優(yōu)行動方案。從建立歷史數(shù)據(jù)樣本與自然狀態(tài)的依賴關系這一意義上,可以將這類風險決策問題歸納為數(shù)據(jù)挖掘中的分類問題,因而數(shù)據(jù)挖掘中的各種分類方法可以應用于該類風險決策問題。由于分類的高效性和準確性對于風險決策具有關鍵性影響,因此分類方法及其在風險決策中的應用研究具有重要的理論和現(xiàn)實意義。 已有的相關研究主要從分類方法及其應用的角度考慮風險決策問題。事實上,在應用各種數(shù)據(jù)挖掘技術前,探索了解數(shù)據(jù)的特性將對挖掘結果有重要甚至關鍵性的影響。在分類問題中,特征變量異質(zhì)性是一種重要的數(shù)據(jù)特性,對于分類方法的應用結果具有顯著影響。因此,本文主要研究考慮特征變量異質(zhì)性的分類方法及其在風險決策問題中的應用。研究目的在于探索數(shù)據(jù)中存在的特征異質(zhì)性這一數(shù)據(jù)特性,并提出相應的解決方法以提高分類的準確性,使分類方法能夠更好地為風險決策提供支持。 本文從第一章到第六章的內(nèi)容安排如下: 第一章概述了本文的研究背景,回顧了分類方法及其在風險決策問題中的相關研究和分類問題中特征變量異質(zhì)性的研究現(xiàn)狀,說明了本文的研究內(nèi)容和研究意義。 第二章首先對分類問題進行簡要介紹,然后概述分類問題中的特征變量相關性和特征變量選擇問題。在此基礎上,根據(jù)一系列理論和實際應用研究對特征變量異質(zhì)性的概念進行描述。由于特征變量異質(zhì)性無法從數(shù)據(jù)樣本集合中直接觀察和測度,本章基于薈萃分析的基本思想,提出了一種利用全局特征變量選擇和數(shù)據(jù)樣本集合隨機劃分的方法來測度特征變量異質(zhì)性的方法。在一系列基準數(shù)據(jù)集和人工構造的混合數(shù)據(jù)集上的實驗計算結果說明了該測度方法的有效性。 第三章主要考察特征變量異質(zhì)性對分類方法效果的影響。本章首先對特征變量異質(zhì)性的影響進行簡要分析,然后通過實證研究說明分類問題中存在的特征變量異質(zhì)性對分類方法的準確率具有較為顯著的影響。本章采用的分類方法為一種將logistic回歸與支持向量機集成的分類方法,該方法的主要思想是應用logistic回歸的輸出概率為支持向量機提供支持信息,以提高分類判別準確性。實證研究以企業(yè)財務困境預測這一風險管理和決策問題為背景,通過比較考慮特征變量異質(zhì)性前后的分類預測準確率,說明了在存在特征變量異質(zhì)性的分類問題中,考慮特征變量異質(zhì)性有利于提高分類方法的準確率。 第四章提出了一種基于因子分析和聚類分析的分類策略,該策略的基本思想是首先將原始的特征變量轉(zhuǎn)化為新的特征變量,使得新的特征變量能夠體現(xiàn)出原始特征變量在數(shù)據(jù)樣本空間中的異質(zhì)性,然后通過聚類分析得到各個具有特征變量同質(zhì)性的樣本子集,并在每個樣本子集中分別建立相應的分類模型,從而減小特征變量異質(zhì)性對分類方法準確率的影響。對于一個未知類標記樣本,該分類策略首先將其轉(zhuǎn)化為因子得分向量,然后將該因子得分向量按照最近鄰規(guī)則劃分到與之最近的樣本子集合中,最后利用該樣本子集合中的分類模型進行分類。在一系列基準數(shù)據(jù)集上的實驗計算結果說明了該分類策略的有效性。 第五章提出了一種考慮特征變量異質(zhì)性且具有增量式學習特性的分類方法,可有效應用于一類具有特征變量異質(zhì)性且需要決策者利用分類方法進行在線實時風險決策的問題。該方法首先利用基于網(wǎng)格的有指導聚類對數(shù)據(jù)樣本集合進行劃分,從而得到若干數(shù)據(jù)簇,且每個數(shù)據(jù)簇中數(shù)據(jù)樣本點的類標記相同。在去除異常數(shù)據(jù)點后,該方法計算各個數(shù)據(jù)簇的特征變量相關性,并將該相關性作為距離測度中各特征變量的權重,應用最近鄰方法進行分類。本章最后將該分類方法應用于一系列基準數(shù)據(jù)集和市場營銷中的顧客確定問題,實證結果說明了該方法的有效性。 第六章總結本文的工作,歸納本文的主要創(chuàng)新點,指出目前本文研究的局限,并根據(jù)已取得的研究結果對未來進一步研究的問題進行思考。 本文工作的主要創(chuàng)新點如下: (1)提出了一種有效的特征變量異質(zhì)性的測度方法,該方法可用于探索分類問題中存在的特征變量異質(zhì)性,為解決分類問題提供策略性的信息。 (2)提出了一種基于logistic回歸與支持向量機集成的分類方法,該方法利用logistic回歸得到的后驗概率信息對支持向量機的輸出結果進行修正,能夠有效提高傳統(tǒng)支持向量機的分類準確性。 (3)提出了一種有效的考慮特征變量異質(zhì)性的分類策略,該策略將具有特征變量異質(zhì)性的數(shù)據(jù)樣本集合劃分為若干同質(zhì)性的子集合,然后通過在各個子集合中分別建立分類模型來提高分類的準確性。 (4)提出了一種具有增量式學習特性的分類方法,該方法能夠以增量學習的方式處理由于數(shù)據(jù)樣本頻繁更新而導致的特征變量異質(zhì)性模式變化,可以在存在特征變量異質(zhì)性且需要實時在線決策的風險決策問題中得到有效的應用。
【關鍵詞】:風險決策 分類 特征變量異質(zhì)性 因子分析 聚類 增量學習
【學位授予單位】:中國科學技術大學
【學位級別】:博士
【學位授予年份】:2009
【分類號】:F224;C934
【目錄】:
  • 摘要5-8
  • ABSTRACT8-12
  • 目錄12-14
  • 圖序14-15
  • 表序15-16
  • 第1章 緒論16-28
  • 1.1 本文的研究背景和意義17-20
  • 1.1.1 本文的研究背景17-19
  • 1.1.2 本文的研究意義19-20
  • 1.2 研究現(xiàn)狀20-24
  • 1.2.1 分類方法在風險決策問題中的應用研究現(xiàn)狀20-21
  • 1.2.2 分類問題中特征變量異質(zhì)性的研究現(xiàn)狀21-24
  • 1.3 本文的主要工作和創(chuàng)新24-25
  • 1.3.1 本文的主要工作24-25
  • 1.3.2 本文的主要創(chuàng)新25
  • 1.4 本文的內(nèi)容組織結構25-28
  • 第2章 特征變量異質(zhì)性的概念和測度方法28-46
  • 2.1 分類問題中的特征變量相關性和特征變量選擇28-32
  • 2.1.1 分類問題簡介28-30
  • 2.1.2 特征變量相關性和特征變量選擇30-32
  • 2.2 特征變量異質(zhì)性的概念32
  • 2.3 特征變量異質(zhì)性測度32-38
  • 2.3.1 薈萃分析簡介33-35
  • 2.3.2 特征變量異質(zhì)性測度方法35-38
  • 2.4 實驗計算結果38-45
  • 2.5 本章總結45-46
  • 第3章 特征變量異質(zhì)性對分類的影響46-70
  • 3.1 特征變量異質(zhì)性的影響46-47
  • 3.2 支持向量機與logistic回歸集成預測方法47-63
  • 3.2.1 支持向量機簡介47-53
  • 3.2.2 Logistic回歸簡介53-58
  • 3.2.3 IBDR58-61
  • 3.2.4 基準數(shù)據(jù)集實驗結果61-63
  • 3.3 企業(yè)財務困境預測實證研究63-67
  • 3.3.1 財務困境預測指標體系63-64
  • 3.3.2 企業(yè)財務困境預測結果及分析64-67
  • 3.4 本章小結67-70
  • 第4章 基于因子分析與聚類分析集成的分類策略70-90
  • 4.1 因子分析簡介71-73
  • 4.2 聚類分析簡介73-77
  • 4.2.1 劃分型聚類73-75
  • 4.2.2 層次型聚類75
  • 4.2.3 密度聚類75-76
  • 4.2.4 其它聚類方法76-77
  • 4.3 CAFAC77-82
  • 4.3.1 CAFAC的基本原理77-79
  • 4.3.2 CAFAC的步驟79-82
  • 4.4 實驗計算結果82-88
  • 4.4.1 CAFAC在36個混合數(shù)據(jù)集上的結果82-86
  • 4.4.2 CAFAC與其它分類方法的比較結果86-88
  • 4.5 本章小結88-90
  • 第5章 具有增量學習特性的分類方法90-104
  • 5.1 問題背景90-91
  • 5.2 本文提出的方法91-97
  • 5.2.1 SCCFSH的基本思想92
  • 5.2.2 基于網(wǎng)格的有指導聚類92-94
  • 5.2.3 數(shù)據(jù)簇的有指導合并和去除異常點94-95
  • 5.2.4 基于加權距離的分類95-97
  • 5.3 實驗計算結果97-101
  • 5.3.1 基準數(shù)據(jù)集計算結果97-100
  • 5.3.2 消費者確定問題中的應用100-101
  • 5.4 本章小結101-104
  • 第6章 總結與展望104-106
  • 6.1 全文總結104-105
  • 6.2 未來可能的研究展望105-106
  • 參考文獻106-112
  • 致謝112-113
  • 在讀期間發(fā)表的學術論文與取得的研究成果113

【引證文獻】

中國期刊全文數(shù)據(jù)庫 前1條

1 劉又滋;;論財務會計報表對煙草公司的影響[J];財經(jīng)界;2010年12期

中國博士學位論文全文數(shù)據(jù)庫 前1條

1 張雪梅;供應鏈環(huán)境中滿足顧客差異化需求的產(chǎn)品設計策略[D];中國科學技術大學;2011年


  本文關鍵詞:考慮特征變量異質(zhì)性的分類方法及其在風險決策中的應用研究,由筆耕文化傳播整理發(fā)布。

,

本文編號:376887

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/lindaojc/376887.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶b27ef***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com