在線社交網絡用戶分類算法研究
發(fā)布時間:2020-05-10 13:54
【摘要】:近些年來,隨著互聯網的普及,各類在線社交網絡、在線服務應運而生,社交網絡也成為人們日常生活溝通交流的主要平臺。社交網絡以用戶為主體,以現實生活中的人際關系為原型,用戶借助該平臺互動交流、傳播信息。社交網絡在給人們帶來便利的同時,也帶來了各種各樣的問題。用戶頻繁的在線互動、信息的爆炸,一方面使用戶無法正確選擇有價值的信息,另一方面攻擊者偽裝成正常用戶盜用正常用戶身份傳播虛假、惡意消息,使得用戶的隱私安全以及正確的價值觀受到威脅。因此如何從海量信息中提取出有用的信息,進行個性化推薦、檢測異常用戶成為關鍵問題,針對這個問題,本文以新浪微博為研究對象,根據不同的需求對用戶進行分類,重點研究在線社交網絡中識別不同水軍用戶的問題,主要的工作如下:1.基于現有互信息算法的不足提出了改進的特征評價函數。傳統互信息由于忽略詞頻因素導致了低詞頻特征詞作用被放大,有用特征詞被漏選,針對這個問題,在特征評價函數中引入權重因子、類內離散因子和類間離散因子來彌補其不足,并通過實驗驗證了改進的方法在性能方面優(yōu)于現有互信息方法。2.在屬性約簡的基礎上,針對現有樸素貝葉斯加權算法在求取權值時不能從全局考慮的局限性和初始權值設置時的隨機盲目性,采用粒子群優(yōu)化算法,以詞頻比率為初始權值,迭代優(yōu)化求取最優(yōu)權值,構建加權樸素貝葉斯分類器,并通過實驗驗證了改進的樸素貝葉斯算法在分類精確率方面優(yōu)于現有的樸素貝葉斯分類算法。3.在屬性約簡的基礎上,針對現有支持向量機算法都只是在核函數和多分類模型做了單方面改進的問題,首先利用粒子群優(yōu)化算法對混合核函數中的參數進行迭代求取最優(yōu)參數組合,然后結合改進的決策樹多分類模型構建多分類支持向量機分類器,并通過實驗驗證了改進的多分類支持向量機算法在分類精確率方面優(yōu)于現有的支持向量機分類算法。
【學位授予單位】:長春理工大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP393.09;TP181
本文編號:2657403
【學位授予單位】:長春理工大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP393.09;TP181
【參考文獻】
相關期刊論文 前10條
1 王軍強;劉建平;;基于樸素貝葉斯的社交網絡消息文本分類算法的研究[J];工業(yè)控制計算機;2015年09期
2 王輝;黃自威;劉淑芬;;新型加權粗糙樸素貝葉斯算法及其應用研究[J];計算機應用研究;2015年12期
3 王道明;魯昌華;蔣薇薇;肖明霞;李必然;;基于粒子群算法的決策樹SVM多分類方法研究[J];電子測量與儀器學報;2015年04期
4 賀超波;楊鎮(zhèn)雄;洪少文;湯庸;陳國華;鄭凱;;應用隨機游走的社交網絡用戶分類方法[J];計算機科學;2015年02期
5 李鋒剛;梁鈺;GAO Xiao-zhi;ZENGER Kai;;基于LDA-wSVM模型的文本分類研究[J];計算機應用研究;2015年01期
6 孟祥飛;徐路;王思雨;;基于新浪微博的社交網絡垃圾用戶分析與檢測[J];科技與創(chuàng)新;2014年15期
7 劉海峰;姚澤清;蘇展;;基于詞頻的優(yōu)化互信息文本特征選擇方法[J];計算機工程;2014年07期
8 趙芳;馬玉磊;;自訓練半監(jiān)督加權球結構支持向量機多分類方法[J];重慶郵電大學學報(自然科學版);2014年03期
9 汪海燕;黎建輝;楊風雷;;支持向量機理論及算法研究綜述[J];計算機應用研究;2014年05期
10 劉春衛(wèi);羅健旭;;基于混合核函數的PSO-SVM分類算法[J];華東理工大學學報(自然科學版);2014年01期
,本文編號:2657403
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2657403.html
最近更新
教材專著