一種自動分類的網(wǎng)頁搜索排序算法
發(fā)布時間:2021-04-22 11:59
針對傳統(tǒng)網(wǎng)頁排序算法Okapi BM25通常會出現(xiàn)網(wǎng)頁與查詢關(guān)鍵詞領(lǐng)域無關(guān)的領(lǐng)域漂移現(xiàn)象,以及改進算法需要人工建立領(lǐng)域向量的問題,提出了一種基于BM25和softmax回歸分類模型的網(wǎng)頁搜索排序算法。方法對網(wǎng)頁文本進行數(shù)據(jù)預(yù)處理并利用詞袋模型進行網(wǎng)頁文本的向量表示,之后通過少量的網(wǎng)頁數(shù)據(jù)訓(xùn)練Softmax回歸分類模型,來預(yù)測測試網(wǎng)頁數(shù)據(jù)的類別分數(shù),并與BM25信息檢索的分數(shù)結(jié)合在一起,得到最終的網(wǎng)頁排序結(jié)果。實驗結(jié)果顯示該檢索算法無須人工建立領(lǐng)域向量,即可達到很好的網(wǎng)頁排序結(jié)果。
【文章來源】:計算機應(yīng)用研究. 2019,36(01)北大核心CSCD
【文章頁數(shù)】:4 頁
【文章目錄】:
0 引言
1 本文方法
1.1 數(shù)據(jù)預(yù)處理
1.2 Okapi BM25算法
1.3 網(wǎng)頁文本分類
1.4 算法整體描述
2 實驗結(jié)果及分析
2.1 實驗設(shè)置
2.2 實驗檢索關(guān)鍵詞及語料
2.3 評價標準
2.4 參數(shù)調(diào)優(yōu)
2.5 對比實驗結(jié)果
3 結(jié)束語
【參考文獻】:
期刊論文
[1]基于領(lǐng)域模型的網(wǎng)頁搜索排序算法[J]. 潘澄,吳共慶,李磊,胡學(xué)鋼. 計算機系統(tǒng)應(yīng)用. 2015(11)
本文編號:3153736
【文章來源】:計算機應(yīng)用研究. 2019,36(01)北大核心CSCD
【文章頁數(shù)】:4 頁
【文章目錄】:
0 引言
1 本文方法
1.1 數(shù)據(jù)預(yù)處理
1.2 Okapi BM25算法
1.3 網(wǎng)頁文本分類
1.4 算法整體描述
2 實驗結(jié)果及分析
2.1 實驗設(shè)置
2.2 實驗檢索關(guān)鍵詞及語料
2.3 評價標準
2.4 參數(shù)調(diào)優(yōu)
2.5 對比實驗結(jié)果
3 結(jié)束語
【參考文獻】:
期刊論文
[1]基于領(lǐng)域模型的網(wǎng)頁搜索排序算法[J]. 潘澄,吳共慶,李磊,胡學(xué)鋼. 計算機系統(tǒng)應(yīng)用. 2015(11)
本文編號:3153736
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3153736.html
最近更新
教材專著