基于深度語義的多模型學(xué)習(xí)排序研究
發(fā)布時(shí)間:2022-08-08 11:44
隨著計(jì)算機(jī)信息技術(shù)的飛速發(fā)展,網(wǎng)上購物已經(jīng)慢慢進(jìn)入我們的日常生活,從本質(zhì)上影響并逐漸改變了人們的購物消費(fèi)習(xí)慣。網(wǎng)上購物的飛速發(fā)展在給電商帶來巨大收益的同時(shí),也為消費(fèi)者帶來方便,例如可以隨時(shí)隨地網(wǎng)上購物,方便快捷。但是隨著網(wǎng)上商品種類以及相似種類越來越多,用戶在面對大量的搜索結(jié)果的同時(shí)亦面臨商品標(biāo)簽或者標(biāo)題摻入高排名或與商品相關(guān)度不高的詞匯,導(dǎo)致搜索精度不高、商品分類粗糙以及搜索結(jié)果的頁面顯示混亂等問題。面對以上多種問題,本文從傳統(tǒng)的信息檢索領(lǐng)域出發(fā),研究了常用的信息檢索模型,并對Pointwise、Pairwise以及Listwise這三種方法進(jìn)行了系統(tǒng)的實(shí)驗(yàn)對比分析;在此基礎(chǔ)上,首先分析了機(jī)器學(xué)習(xí)中學(xué)習(xí)排序模型訓(xùn)練與測試的整體流程及Bag-of-words模型,為了提高現(xiàn)有模型的商品搜索精度,提出“商品圖像深度語義”概念,并綜合“特征工程”和“學(xué)習(xí)”兩方面建立特征構(gòu)造方法;之后,針對Listwise模型進(jìn)行剖析,重點(diǎn)研究其計(jì)算過程中分?jǐn)?shù)序列轉(zhuǎn)化為概率分布的機(jī)理,通過優(yōu)選實(shí)驗(yàn),確定以整個(gè)序列為例的ListNet方法是解決商品搜索過程中排序?qū)W習(xí)流程最直接、最有效的方法;針對ListNet...
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 研究現(xiàn)狀
1.3 研究目標(biāo)與內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)理論和技術(shù)
2.1 傳統(tǒng)排序模型
2.1.1 布爾模型
2.1.2 向量空間模型
2.1.3 概率檢索模型
2.1.4 語言模型
2.2 排序?qū)W習(xí)概述
2.2.1 單文檔方法(Pointwise方法)
2.2.2 文檔對方法(Pairwise方法)
2.2.3 文檔列表方法(Listwise方法)
2.3 本章小結(jié)
第三章 排序?qū)W習(xí)模型構(gòu)建
3.1 特征工程
3.1.1 特征工程的概況
3.1.2 特征工程的子過程
3.2 模型的訓(xùn)練
3.3 訓(xùn)練數(shù)據(jù)構(gòu)建
3.4 特征集的構(gòu)建
3.4.1 關(guān)于查詢與文檔的特征
3.4.2 有關(guān)于商品特性的特征
3.4.3 Bag-of-words圖片語義特征向量提取
3.5 對商品進(jìn)行學(xué)習(xí)排序的結(jié)果評價(jià)方法
3.5.1 學(xué)習(xí)排序無序結(jié)果評價(jià)方法
3.5.2 學(xué)習(xí)排序有序結(jié)果評價(jià)標(biāo)準(zhǔn)
3.6 排序?qū)W習(xí)與常規(guī)機(jī)器學(xué)習(xí)的異同之處
3.7 本章小結(jié)
第四章 基于深度語義的多模型學(xué)習(xí)排序
4.1 ListNet算法
4.2 組合概率
4.3 Top-1概率
4.4 損失函數(shù)的融合
4.5 改進(jìn)的ListNet算法描述
4.6 本章小結(jié)
第五章 實(shí)驗(yàn)及結(jié)果分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 數(shù)據(jù)集
5.3 不同模型結(jié)果的比較與分析
5.4 基于改進(jìn)的ListNet算法結(jié)果分析
5.5 不同數(shù)據(jù)集結(jié)果比較分析
5.6 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
攻讀碩士期間獲得的學(xué)術(shù)成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于Pairwise排序?qū)W習(xí)的因子分解推薦算法[J]. 周俊宇,戴月明,吳定會(huì). 計(jì)算機(jī)應(yīng)用與軟件. 2016(06)
[2]基于圖像信息和排序?qū)W習(xí)技術(shù)的疾病預(yù)測方法[J]. 黃偉,曾舒如. 南昌工程學(xué)院學(xué)報(bào). 2015(03)
[3]基于用戶行為分析的本地搜索排序算法優(yōu)化[J]. 蔣宗禮,張婷. 計(jì)算機(jī)技術(shù)與發(fā)展. 2014(02)
[4]基于神經(jīng)網(wǎng)絡(luò)的Listwise排序?qū)W習(xí)方法的研究[J]. 林原,林鴻飛. 情報(bào)學(xué)報(bào). 2012 (01)
[5]基于Listwise的新型排序算法[J]. 程凡,李龍澍. 計(jì)算機(jī)工程. 2011(23)
碩士論文
[1]針對結(jié)構(gòu)化商品數(shù)據(jù)的多樣性搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 陳相如.上海交通大學(xué) 2013
[2]排序?qū)W習(xí)損失函數(shù)的研究[D]. 吳佳金.大連理工大學(xué) 2011
[3]電子商務(wù)系統(tǒng)中的全文檢索及排序優(yōu)化算法[D]. 孫文禮.浙江大學(xué) 2008
本文編號(hào):3671446
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 研究現(xiàn)狀
1.3 研究目標(biāo)與內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)理論和技術(shù)
2.1 傳統(tǒng)排序模型
2.1.1 布爾模型
2.1.2 向量空間模型
2.1.3 概率檢索模型
2.1.4 語言模型
2.2 排序?qū)W習(xí)概述
2.2.1 單文檔方法(Pointwise方法)
2.2.2 文檔對方法(Pairwise方法)
2.2.3 文檔列表方法(Listwise方法)
2.3 本章小結(jié)
第三章 排序?qū)W習(xí)模型構(gòu)建
3.1 特征工程
3.1.1 特征工程的概況
3.1.2 特征工程的子過程
3.2 模型的訓(xùn)練
3.3 訓(xùn)練數(shù)據(jù)構(gòu)建
3.4 特征集的構(gòu)建
3.4.1 關(guān)于查詢與文檔的特征
3.4.2 有關(guān)于商品特性的特征
3.4.3 Bag-of-words圖片語義特征向量提取
3.5 對商品進(jìn)行學(xué)習(xí)排序的結(jié)果評價(jià)方法
3.5.1 學(xué)習(xí)排序無序結(jié)果評價(jià)方法
3.5.2 學(xué)習(xí)排序有序結(jié)果評價(jià)標(biāo)準(zhǔn)
3.6 排序?qū)W習(xí)與常規(guī)機(jī)器學(xué)習(xí)的異同之處
3.7 本章小結(jié)
第四章 基于深度語義的多模型學(xué)習(xí)排序
4.1 ListNet算法
4.2 組合概率
4.3 Top-1概率
4.4 損失函數(shù)的融合
4.5 改進(jìn)的ListNet算法描述
4.6 本章小結(jié)
第五章 實(shí)驗(yàn)及結(jié)果分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 數(shù)據(jù)集
5.3 不同模型結(jié)果的比較與分析
5.4 基于改進(jìn)的ListNet算法結(jié)果分析
5.5 不同數(shù)據(jù)集結(jié)果比較分析
5.6 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
攻讀碩士期間獲得的學(xué)術(shù)成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于Pairwise排序?qū)W習(xí)的因子分解推薦算法[J]. 周俊宇,戴月明,吳定會(huì). 計(jì)算機(jī)應(yīng)用與軟件. 2016(06)
[2]基于圖像信息和排序?qū)W習(xí)技術(shù)的疾病預(yù)測方法[J]. 黃偉,曾舒如. 南昌工程學(xué)院學(xué)報(bào). 2015(03)
[3]基于用戶行為分析的本地搜索排序算法優(yōu)化[J]. 蔣宗禮,張婷. 計(jì)算機(jī)技術(shù)與發(fā)展. 2014(02)
[4]基于神經(jīng)網(wǎng)絡(luò)的Listwise排序?qū)W習(xí)方法的研究[J]. 林原,林鴻飛. 情報(bào)學(xué)報(bào). 2012 (01)
[5]基于Listwise的新型排序算法[J]. 程凡,李龍澍. 計(jì)算機(jī)工程. 2011(23)
碩士論文
[1]針對結(jié)構(gòu)化商品數(shù)據(jù)的多樣性搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 陳相如.上海交通大學(xué) 2013
[2]排序?qū)W習(xí)損失函數(shù)的研究[D]. 吳佳金.大連理工大學(xué) 2011
[3]電子商務(wù)系統(tǒng)中的全文檢索及排序優(yōu)化算法[D]. 孫文禮.浙江大學(xué) 2008
本文編號(hào):3671446
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3671446.html
最近更新
教材專著