天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于AUC的分類器性能評估問題研究

發(fā)布時間:2017-07-03 23:19

  本文關鍵詞:基于AUC的分類器性能評估問題研究


  更多相關文章: 機器學習 AUC 分類模型 錯誤代價 實例得分


【摘要】:近幾十年來,隨著計算機技術的飛速發(fā)展,人工智能被人們廣泛關注和深入研究,其分支機器學習也快速崛起并已經(jīng)滲透到社會的各個領域。其中,分類模型是其重要研究方向,分類模型的性能一般用準確率和召回率來衡量。然而,當數(shù)據(jù)集的類別分布不平衡時,準確率和召回率并不能保證分類模型性能評估的準確性。ROC(Receiver Operating Characteristic,接收者操作特征曲線)評估算法衡量了分類模型在任何數(shù)據(jù)集類別分布情況下的性能,并用AUC(area under the curve,曲線下方面積)量化ROC曲線性能。由于數(shù)據(jù)集類別分布比例的不確定性,ROC曲線在分類模型性能評估中變得越來越重要。ROC和AUC在分類模型性能評估中已經(jīng)得到廣泛應用,但普通的AUC和ROC卻存在一些缺陷:首先是公認的AUC的計算只利用得分排序而忽略了得分值;然后是AUC對分類錯誤代價是弱敏感的,分類模型性能會因為錯誤代價而存在很大差別。所以,本文將分兩部分進行討論。第一部分針對得分值提出了切割點和切割函數(shù)的概念,進而提出sor ROC曲線和sor AUC:根據(jù)P-N對設置切割點和切割函數(shù),最終得到sor ROC曲線,sor AUC即為sor ROC曲線下方面積;第二部分基于假正例和假負例,從不同錯誤代價的角度提出v AUC和v ROC的概念:將v AUC看做一塊厚度均勻且各個區(qū)域密度不同的1*1的板子,用ROC對其進行切割,剩下板子質(zhì)量即為v AUC。在提出新算法之后,本文提出算法相關的幾條定義,然后從理論上推導證明了算法的若干性質(zhì)并用一個簡單的實例說明了新算法和普通AUC、ROC的優(yōu)劣。最后,本文使用UCI數(shù)據(jù)集對新算法和AUC進行對比實驗。實驗分為兩個部分:第一部分將sor AUC和AUC、s AUC、p AUC作對比實驗,實驗表明sor AUC比AUC更精確,并且與s AUC、p AUC具有相同的性能評估能力,而且sor ROC曲線的繪制比p ROC曲線更簡單、可靠;第二部分將v AUC和AUC、s AUC、p AUC進行對比實驗,實驗表明:v AUC充分利用了樣本實例的錯誤代價,使其對分類模型的評估更精確,也更具針對性。在錯分代價不同的情況下,v AUC具有更好的性能評估能力,也更接近于真實的結(jié)果。
【關鍵詞】:機器學習 AUC 分類模型 錯誤代價 實例得分
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP181
【目錄】:
  • 摘要4-6
  • Abstract6-10
  • 第1章 緒論10-17
  • 1.1 研究背景及選題意義10-12
  • 1.2 國內(nèi)外研究現(xiàn)狀12-15
  • 1.2.1 關于分類器的研究12-14
  • 1.2.2 關于分類模型評估算法的研究14-15
  • 1.3 論文結(jié)構(gòu)15-17
  • 第2章 ROC曲線及AUC17-27
  • 2.1 混淆矩陣17-18
  • 2.2 ROC曲線18-19
  • 2.3 曲線下方面積19-22
  • 2.4 ROC的生成及AUC的計算22-25
  • 2.5 ROC曲線生成算法25-27
  • 第3章 基于得分的ROC和AUC27-33
  • 3.1 考慮得分的AUC27-28
  • 3.2 sor AUC定義28-30
  • 3.3 sor ROC的繪制和sor AUC的計算30-33
  • 第4章 基于誤分代價的ROC和AUC33-41
  • 4.1 誤分代價AUC33-34
  • 4.2 v AUC定義34-38
  • 4.3 vROC繪制及v AUC計算38-41
  • 第5章 實驗結(jié)果與分析41-50
  • 5.1 sor AUC實驗結(jié)果與分析41-45
  • 5.1.1 數(shù)據(jù)集及參數(shù)設置41
  • 5.1.2 評估算法比較41-45
  • 5.2 vAUC實驗結(jié)果與分析45-50
  • 5.2.1 數(shù)據(jù)集及參數(shù)設置45-46
  • 5.2.2 評估算法比較46-48
  • 5.2.3 假正例代價和假負例代價48-50
  • 第6章 結(jié)論與展望50-52
  • 參考文獻52-55
  • 作者簡介及在學期間所取得的科研成果55-56
  • 致謝56

【相似文獻】

中國碩士學位論文全文數(shù)據(jù)庫 前1條

1 蔣帥;基于AUC的分類器性能評估問題研究[D];吉林大學;2016年



本文編號:515571

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/515571.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶e652e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com