一種融入用戶點擊模型Word2Vec查詢詞聚類
發(fā)布時間:2017-10-16 17:36
本文關(guān)鍵詞:一種融入用戶點擊模型Word2Vec查詢詞聚類
更多相關(guān)文章: 查詢詞 聚類 WordVec 點擊模型 CT-WordVec
【摘要】:用戶查詢聚類能夠幫助搜索引擎了解當(dāng)前熱點、用戶興趣及需求,在搜索引擎性能優(yōu)化及定向廣告投放等起到了非常重要的作用.基于用戶查詢詞長度非常短的特點,提出基于Word2Vec的詞向量的用戶查詢詞表示方法.并在Word2Vec的基礎(chǔ)上提出CT-Word2Vec神經(jīng)網(wǎng)絡(luò)語言模型.CT-Word2Vec模型不僅利用詞匯的上下文信息將詞轉(zhuǎn)化成向量,而且還將用戶的搜索點擊行為融入詞向量的學(xué)習(xí)過程當(dāng)中.聚類實驗結(jié)果表明,基于Word2Vec的詞向量的查詢詞表示方法相對于傳統(tǒng)的詞袋法在熵、純度衡量指標(biāo)上有20%到30%的提高.基于CT-Word2Vec的詞向量表示方法與Word2Vec相比有2%到4%的提升.
【作者單位】: 華東師范大學(xué)計算機應(yīng)用研究所;華東師范大學(xué)上海市多維度信息處理重點實驗室;
【關(guān)鍵詞】: 查詢詞 聚類 WordVec 點擊模型 CT-WordVec
【基金】:國家科技支撐項目(2012BAH93F03)資助 上海市科委項目(14511107000)資助
【分類號】:TP391.3
【正文快照】: 1引言隨著信息技術(shù)的極速發(fā)展,互聯(lián)網(wǎng)信息呈現(xiàn)了指數(shù)型增長,人們只能在搜索引擎的幫助下從海量的信息當(dāng)中獲得特定的信息.用戶的搜索行為直接或間接地反應(yīng)了用戶的潛在興趣及需求.用戶提供的查詢詞是搜索行為當(dāng)中最為重要的一部分.用戶查詢詞聚類是用戶查詢詞挖掘中最常用的方,
本文編號:1044001
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1044001.html
最近更新
教材專著