RU-SMOTE-SVM利潤(rùn)操作識(shí)別模型構(gòu)建
發(fā)布時(shí)間:2022-02-05 07:20
融合SVM智能技術(shù)與RU-SMOTE不平衡樣本處理方法兩者之所長(zhǎng),文章構(gòu)建出RU-SMO TE-SVM模型。該模型的運(yùn)作機(jī)理為:通過SMOTE人工合成新的樣本,以RU方式消除部分樣本中的噪聲及冗余信息,充分借助SVM尋找全局最優(yōu)解的能力;谠撃P,文章構(gòu)建效率性指標(biāo)體系,模型在上市公司利潤(rùn)操作識(shí)別中的應(yīng)用為對(duì)象進(jìn)行具體研究,對(duì)比不同的識(shí)別性能結(jié)果,結(jié)果顯示RU-SMOTE-SVM模型對(duì)上市公司利潤(rùn)操作行為的識(shí)別具有較強(qiáng)的適用性和很高的使用價(jià)值。
【文章來源】:財(cái)會(huì)通訊. 2020,(22)北大核心
【文章頁數(shù)】:4 頁
【部分圖文】:
表2中,RBF為徑向基函數(shù),也簡(jiǎn)稱為高斯函數(shù),用輸入模式與中心向量的距離作為函數(shù)的自變量,具有“局圖2RU-SMOTE-SVM模型在不同核函數(shù)下的上市公司利潤(rùn)操作識(shí)別結(jié)果
真”的錯(cuò)誤,拒絕了正確的、實(shí)際上成立的假設(shè),基于樣本統(tǒng)計(jì)量推斷其結(jié)論并非絕對(duì)正確,也可能存在錯(cuò)誤;二類錯(cuò)誤與第一類錯(cuò)誤相對(duì),是進(jìn)行假設(shè)檢驗(yàn)時(shí)原假設(shè)不正確而接受原假設(shè)的錯(cuò)誤。由圖2、表2可知,RBF核函數(shù)下的模型具有最低值,從準(zhǔn)確率方面分析則RBF核函數(shù)下的模型具有最高值。所以,與其他核函數(shù)下的模型相比,基于RBF構(gòu)建的RU-SMOTE-SVM模型性能更為優(yōu)異,能夠?qū)ι鲜泄镜睦麧?rùn)操作行為進(jìn)行有效識(shí)別。同時(shí),本文進(jìn)一步將RU-SMOTE-SVM模型與傳統(tǒng)的SVM、SMOTE-SVM、RU-SVM模型進(jìn)行性能結(jié)果的對(duì)比,具體如表3、圖3所示,再次驗(yàn)證RBF核函數(shù)下RU-SMOTE-SVM模型對(duì)上市公司利潤(rùn)操作行為具有良好的識(shí)別性能。由圖3、表3可知,SMOTE-SVM、RU-SVM及RU-SMOTE-SVM模型中均引入了不平衡樣本處理方法,與單獨(dú)的SVM方法相比具有更高的預(yù)測(cè)效率,對(duì)SVM自身存在的不平衡樣本問題予以有效解決,出現(xiàn)的一類和二類錯(cuò)誤較低。RU方式采取的是隨機(jī)采樣,存在大量的噪聲樣本,嚴(yán)重影響識(shí)別性能。而RU-SMOTE-SVM模型通過SMOTE人工合成新的樣本,通過RU方式將部分樣本中的噪聲及冗余信息消除,并充分借助了SVM尋找全局最優(yōu)解的能力,避免了簡(jiǎn)單復(fù)制樣本造成的數(shù)據(jù)無效問題。四、結(jié)論本文在上市公司利潤(rùn)操作識(shí)別模型構(gòu)建過程中引入了SVM智能技術(shù),其中融入RU-SMOTE不平衡樣本處理方法進(jìn)行傳統(tǒng)識(shí)別模型的優(yōu)化,形成改進(jìn)版的RU-SMOTE-SVM模型,有效克服不平衡樣本問題。同時(shí),上市公司的利潤(rùn)操作行為具有較強(qiáng)的隱蔽性,傳統(tǒng)的性能評(píng)估指標(biāo)無法滿足模型需求。所以,本文引入了效率指標(biāo),提高了模型的識(shí)別精度,并對(duì)模型的識(shí)別性能及識(shí)別結(jié)果的有效性進(jìn)行驗(yàn)證,結(jié)果表明RBF核函數(shù)條件下構(gòu)建的模型識(shí)別性能最優(yōu),即一類、二類錯(cuò)誤最低,對(duì)上市公司利?
疲?嚀邐??(1)對(duì)兩種合集所包含樣本的數(shù)量差異進(jìn)行計(jì)算,即|Sp|-|SNon-p|=|R|,將|R|/2個(gè)位發(fā)生利潤(rùn)操作行為的樣本從中隨機(jī)剔除,獲得新的未發(fā)生利潤(rùn)操作行為的樣本集合SNewNon-p。(2)對(duì)SNon-p中各樣本點(diǎn)中最近鄰的發(fā)生利潤(rùn)操作行為的樣本進(jìn)行計(jì)算。同時(shí),在原樣點(diǎn)的基礎(chǔ)上,加上用[0,1]之間的隨機(jī)乘數(shù)與原樣點(diǎn)和隨機(jī)選擇鄰點(diǎn)之間的差值的乘積,公式表示為XNew=XSNon-p+(XSNon-p-XSNon-p)*啄。在人工合成的新樣本數(shù)量達(dá)到|R|/2之前,與RU-SMOTE不平衡樣本處理方圖1SMOTE方法的樣例合成李增欣蒲凌:RU-SMOTE-SVM利潤(rùn)操作識(shí)別模型構(gòu)建116
【參考文獻(xiàn)】:
期刊論文
[1]基于混合采樣的非平衡數(shù)據(jù)分類算法[J]. 吳藝凡,梁吉業(yè),王俊紅. 計(jì)算機(jī)科學(xué)與探索. 2019(02)
[2]基于聚類欠采樣的集成不均衡數(shù)據(jù)分類算法[J]. 武森,劉露,盧丹. 工程科學(xué)學(xué)報(bào). 2017(08)
本文編號(hào):3614813
【文章來源】:財(cái)會(huì)通訊. 2020,(22)北大核心
【文章頁數(shù)】:4 頁
【部分圖文】:
表2中,RBF為徑向基函數(shù),也簡(jiǎn)稱為高斯函數(shù),用輸入模式與中心向量的距離作為函數(shù)的自變量,具有“局圖2RU-SMOTE-SVM模型在不同核函數(shù)下的上市公司利潤(rùn)操作識(shí)別結(jié)果
真”的錯(cuò)誤,拒絕了正確的、實(shí)際上成立的假設(shè),基于樣本統(tǒng)計(jì)量推斷其結(jié)論并非絕對(duì)正確,也可能存在錯(cuò)誤;二類錯(cuò)誤與第一類錯(cuò)誤相對(duì),是進(jìn)行假設(shè)檢驗(yàn)時(shí)原假設(shè)不正確而接受原假設(shè)的錯(cuò)誤。由圖2、表2可知,RBF核函數(shù)下的模型具有最低值,從準(zhǔn)確率方面分析則RBF核函數(shù)下的模型具有最高值。所以,與其他核函數(shù)下的模型相比,基于RBF構(gòu)建的RU-SMOTE-SVM模型性能更為優(yōu)異,能夠?qū)ι鲜泄镜睦麧?rùn)操作行為進(jìn)行有效識(shí)別。同時(shí),本文進(jìn)一步將RU-SMOTE-SVM模型與傳統(tǒng)的SVM、SMOTE-SVM、RU-SVM模型進(jìn)行性能結(jié)果的對(duì)比,具體如表3、圖3所示,再次驗(yàn)證RBF核函數(shù)下RU-SMOTE-SVM模型對(duì)上市公司利潤(rùn)操作行為具有良好的識(shí)別性能。由圖3、表3可知,SMOTE-SVM、RU-SVM及RU-SMOTE-SVM模型中均引入了不平衡樣本處理方法,與單獨(dú)的SVM方法相比具有更高的預(yù)測(cè)效率,對(duì)SVM自身存在的不平衡樣本問題予以有效解決,出現(xiàn)的一類和二類錯(cuò)誤較低。RU方式采取的是隨機(jī)采樣,存在大量的噪聲樣本,嚴(yán)重影響識(shí)別性能。而RU-SMOTE-SVM模型通過SMOTE人工合成新的樣本,通過RU方式將部分樣本中的噪聲及冗余信息消除,并充分借助了SVM尋找全局最優(yōu)解的能力,避免了簡(jiǎn)單復(fù)制樣本造成的數(shù)據(jù)無效問題。四、結(jié)論本文在上市公司利潤(rùn)操作識(shí)別模型構(gòu)建過程中引入了SVM智能技術(shù),其中融入RU-SMOTE不平衡樣本處理方法進(jìn)行傳統(tǒng)識(shí)別模型的優(yōu)化,形成改進(jìn)版的RU-SMOTE-SVM模型,有效克服不平衡樣本問題。同時(shí),上市公司的利潤(rùn)操作行為具有較強(qiáng)的隱蔽性,傳統(tǒng)的性能評(píng)估指標(biāo)無法滿足模型需求。所以,本文引入了效率指標(biāo),提高了模型的識(shí)別精度,并對(duì)模型的識(shí)別性能及識(shí)別結(jié)果的有效性進(jìn)行驗(yàn)證,結(jié)果表明RBF核函數(shù)條件下構(gòu)建的模型識(shí)別性能最優(yōu),即一類、二類錯(cuò)誤最低,對(duì)上市公司利?
疲?嚀邐??(1)對(duì)兩種合集所包含樣本的數(shù)量差異進(jìn)行計(jì)算,即|Sp|-|SNon-p|=|R|,將|R|/2個(gè)位發(fā)生利潤(rùn)操作行為的樣本從中隨機(jī)剔除,獲得新的未發(fā)生利潤(rùn)操作行為的樣本集合SNewNon-p。(2)對(duì)SNon-p中各樣本點(diǎn)中最近鄰的發(fā)生利潤(rùn)操作行為的樣本進(jìn)行計(jì)算。同時(shí),在原樣點(diǎn)的基礎(chǔ)上,加上用[0,1]之間的隨機(jī)乘數(shù)與原樣點(diǎn)和隨機(jī)選擇鄰點(diǎn)之間的差值的乘積,公式表示為XNew=XSNon-p+(XSNon-p-XSNon-p)*啄。在人工合成的新樣本數(shù)量達(dá)到|R|/2之前,與RU-SMOTE不平衡樣本處理方圖1SMOTE方法的樣例合成李增欣蒲凌:RU-SMOTE-SVM利潤(rùn)操作識(shí)別模型構(gòu)建116
【參考文獻(xiàn)】:
期刊論文
[1]基于混合采樣的非平衡數(shù)據(jù)分類算法[J]. 吳藝凡,梁吉業(yè),王俊紅. 計(jì)算機(jī)科學(xué)與探索. 2019(02)
[2]基于聚類欠采樣的集成不均衡數(shù)據(jù)分類算法[J]. 武森,劉露,盧丹. 工程科學(xué)學(xué)報(bào). 2017(08)
本文編號(hào):3614813
本文鏈接:http://www.sikaile.net/jingjilunwen/touziyanjiulunwen/3614813.html
最近更新
教材專著