面向短文本的動(dòng)態(tài)聚類方法研究
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-2LDA的生成概率模型圖
圖2-2LDA的生成概率模型圖圖中,矩形方框表示循環(huán)生成,無(wú)陰影圖形表示不可觀測(cè)變量,即潛在的參影圖形表示可觀測(cè)變量。且M表示語(yǔ)料庫(kù)中的文檔篇數(shù),K表示主題個(gè)數(shù),含有V個(gè)詞項(xiàng),Nm表示在文檔dm中所包含的詞語(yǔ)數(shù)目。wm,n表示在文檔dm中詞語(yǔ)。zm,n表示在文....
圖3-2DCT模型在模擬數(shù)據(jù)集上獲取的各數(shù)據(jù)點(diǎn)的類別標(biāo)簽
貴州大學(xué)碩士學(xué)位論文圖3-2和3-3所示。其中,DDMM模型在各時(shí)間窗口內(nèi)進(jìn)行聚類分析計(jì)算出的NMI值分別為:0.991、0.996、0.993,Purity值分別為:0.990、0.998、0.997。DCT模型在各時(shí)間窗口內(nèi)進(jìn)行聚類分析計(jì)算出的NMI值分別....
圖3-3DDMM模型在模擬數(shù)據(jù)集上獲取的各數(shù)據(jù)點(diǎn)的類別標(biāo)簽
貴州大學(xué)碩士學(xué)位論文圖3-2和3-3所示。其中,DDMM模型在各時(shí)間窗口內(nèi)進(jìn)行聚類分析計(jì)算出的NMI值分別為:0.991、0.996、0.993,Purity值分別為:0.990、0.998、0.997。DCT模型在各時(shí)間窗口內(nèi)進(jìn)行聚類分析計(jì)算出的NMI值分別....
圖3-4DDMM模型在每輪迭代中獲取的聚類個(gè)數(shù)
貴州大學(xué)碩士學(xué)位論文知:新主題的產(chǎn)生更符合動(dòng)態(tài)數(shù)據(jù)的實(shí)際特征,因此使得聚類為DDMM模型具有產(chǎn)生新主題的偏向性,并且其聚類指標(biāo)DDMM模型在聚類過(guò)程中能夠自動(dòng)估算出聚類個(gè)數(shù),這是代過(guò)程中設(shè)置了一個(gè)足夠大的主題數(shù)K,然后在每輪迭代中將狀態(tài),便可得出實(shí)際的主題數(shù)K*,實(shí)驗(yàn)結(jié)....
本文編號(hào):3921783
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3921783.html