一種基于支持向量機(jī)的垃圾微博識(shí)別方法
發(fā)布時(shí)間:2021-11-08 06:31
針對(duì)中文微博垃圾特點(diǎn),提取基于向量空間模型的中文文本相似度、長(zhǎng)短鏈接相似度、發(fā)文時(shí)間規(guī)律等新的分類特征,加入現(xiàn)有的特征集,運(yùn)用支持向量機(jī)方法,訓(xùn)練后得到分類模型。實(shí)驗(yàn)結(jié)果表明,該方法是一種有效的垃圾微博識(shí)別技術(shù)。
【文章來(lái)源】:安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013,30(04)
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
1 支持向量機(jī)
2 分類特征分析
2.1 基于博文內(nèi)容的特征
2.1.1 文本特征
2.1.2 符號(hào)特征
2.1.3 鏈接特征
2.1.4 時(shí)間特征
2.2 用戶自身特征
3 實(shí)驗(yàn)結(jié)果與分析
3.1 使用的數(shù)據(jù)集
3.2 特征分析
3.3 識(shí)別結(jié)果
3.4 識(shí)別效果的評(píng)價(jià)標(biāo)準(zhǔn)
3.5 實(shí)驗(yàn)對(duì)比
4 結(jié)語(yǔ)
【參考文獻(xiàn)】:
期刊論文
[1]支持向量機(jī)在TE過(guò)程故障診斷中的應(yīng)用[J]. 李芳. 安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(02)
本文編號(hào):3483194
【文章來(lái)源】:安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013,30(04)
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
1 支持向量機(jī)
2 分類特征分析
2.1 基于博文內(nèi)容的特征
2.1.1 文本特征
2.1.2 符號(hào)特征
2.1.3 鏈接特征
2.1.4 時(shí)間特征
2.2 用戶自身特征
3 實(shí)驗(yàn)結(jié)果與分析
3.1 使用的數(shù)據(jù)集
3.2 特征分析
3.3 識(shí)別結(jié)果
3.4 識(shí)別效果的評(píng)價(jià)標(biāo)準(zhǔn)
3.5 實(shí)驗(yàn)對(duì)比
4 結(jié)語(yǔ)
【參考文獻(xiàn)】:
期刊論文
[1]支持向量機(jī)在TE過(guò)程故障診斷中的應(yīng)用[J]. 李芳. 安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(02)
本文編號(hào):3483194
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3483194.html
最近更新
教材專著