基于關鍵詞和支持向量機的財務大數(shù)據(jù)爬蟲
本文關鍵詞:基于關鍵詞和支持向量機的財務大數(shù)據(jù)爬蟲
更多相關文章: 大數(shù)據(jù) 主題爬蟲 關鍵詞 支持向量機 尋優(yōu)算法
【摘要】:從互聯(lián)網上獲取信息進行分析,已經成為人們進行決策的重要手段。有效地從海量數(shù)據(jù)中獲取正確的目標信息是當前的重點和難點問題。通用搜索引擎檢索的結果由于主題相關性不強,無法滿足特定用戶的需求。文章在改進SVM參數(shù)尋優(yōu)算法的基礎上,提出了結合關鍵詞過濾算法和適用于大數(shù)據(jù)分類的支持向量機算法,并利用設計的財務管理相關主題信息分類算法,構建了財務管理相關主題爬蟲系統(tǒng)。實驗結果表明,基于關鍵詞與改進支持向量機的財務管理主題相關爬蟲能有效地采集目標信息,能夠較好地適用于財務管理輿情管理和財務管理危機管理等相關領域。
【作者單位】: 內蒙古財經大學會計學院;
【關鍵詞】: 大數(shù)據(jù) 主題爬蟲 關鍵詞 支持向量機 尋優(yōu)算法
【基金】:內蒙古自治區(qū)高校創(chuàng)新平臺“會計信息化實驗實訓創(chuàng)新教育實驗室”培育項目
【分類號】:F275
【正文快照】: 一、研究綜述由于網絡技術的發(fā)展以及互聯(lián)網服務的提升,大數(shù)據(jù)的容量得以爆發(fā)增長。據(jù)國際數(shù)據(jù)公司(IDC)公司統(tǒng)計,2011年全球被創(chuàng)建和被復制的數(shù)據(jù)總量為1.8ZB(1021)。遠遠超過人類有史以來所有印刷材料的數(shù)據(jù)總量(200PB)[1]。比較通用的搜索引擎如谷歌、百度等,強調搜索覆蓋
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 賈凝;;支持向量機模型在統(tǒng)計學上的應用研究[J];統(tǒng)計與決策;2010年13期
2 呂向陽;高尚;;基于支持向量機的品牌特色專業(yè)評價[J];價值工程;2011年24期
3 黃勝忠;;遺傳支持向量機在股市趨向的預測[J];計算機與數(shù)字工程;2012年01期
4 胡奎;朱成文;;基于支持向量機的雷達信號分類[J];統(tǒng)計與決策;2008年23期
5 許建萍;;基于支持向量機的工程索賠合理工效研究[J];科技創(chuàng)新導報;2009年07期
6 張明;劉念祖;;電子商務信用管理的支持向量機應用[J];中國管理信息化(綜合版);2007年09期
7 高尚;梅亮;;基于支持向量機的電價組合預測模型[J];電力自動化設備;2008年11期
8 王毅;;支持向量機技術及其應用研究[J];中國高新技術企業(yè);2008年15期
9 呂月英;;基于支持向量機工程施工風險預警研究[J];科技創(chuàng)新導報;2009年07期
10 芮麗梅;;改進支持向量機的商業(yè)銀行評級算法[J];企業(yè)導報;2011年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 余樂安;姚瀟;;基于中心化支持向量機的信用風險評估模型[A];第六屆(2011)中國管理學年會——商務智能分會場論文集[C];2011年
2 劉希玉;徐志敏;段會川;;基于支持向量機的創(chuàng)新分類器[A];山東省計算機學會2005年信息技術與信息化研討會論文集(一)[C];2005年
3 史曉濤;劉建麗;駱玉榮;;一種抗噪音的支持向量機學習方法[A];全國第19屆計算機技術與應用(CACIS)學術會議論文集(下冊)[C];2008年
4 何琴淑;劉信恩;肖世富;;基于支持向量機的系統(tǒng)辨識方法研究及應用[A];中國力學大會——2013論文摘要集[C];2013年
5 劉駿;;基于支持向量機方法的衢州降雪模型[A];第五屆長三角氣象科技論壇論文集[C];2008年
6 王婷;胡秀珍;;基于組合向量的支持向量機方法預測膜蛋白類型[A];第十一次中國生物物理學術大會暨第九屆全國會員代表大會摘要集[C];2009年
7 趙晶;高雋;張旭東;謝昭;;支持向量機綜述[A];全國第十五屆計算機科學與技術應用學術會議論文集[C];2003年
8 周星宇;王思元;;智能數(shù)學與支持向量機[A];2005年中國智能自動化會議論文集[C];2005年
9 顏根廷;馬廣富;朱良寬;宋斌;;一種魯棒支持向量機算法[A];2006中國控制與決策學術年會論文集[C];2006年
10 侯澍e,
本文編號:1097719
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1097719.html