天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向電子商務(wù)的垂直搜索引擎的研究和實(shí)現(xiàn)

發(fā)布時(shí)間:2017-09-16 23:17

  本文關(guān)鍵詞:面向電子商務(wù)的垂直搜索引擎的研究和實(shí)現(xiàn)


  更多相關(guān)文章: 電子商務(wù) 垂直搜索引擎 網(wǎng)絡(luò)蜘蛛 中文分詞 Heritrix Lucene


【摘要】:伴隨著電子商務(wù)的發(fā)展,電子商務(wù)網(wǎng)絡(luò)系統(tǒng)的通用搜索引擎已經(jīng)無法滿足對(duì)今天搜索的要求,電子商務(wù)網(wǎng)絡(luò)對(duì)搜索引擎要求更高了。需要針對(duì)用戶需求的商品供應(yīng)信息,同時(shí)要針對(duì)現(xiàn)有搜索引擎檢索的過于寬廣以及不能針對(duì)特定用戶需求等問題,面向電子商務(wù)的垂直搜索引擎逐漸發(fā)展并應(yīng)用。電子商務(wù)在互聯(lián)網(wǎng)領(lǐng)域扮演著舉足輕重的角色,越來越多的用戶和企業(yè)投身在電子商務(wù)當(dāng)中。以此,通用的搜索引擎并無法對(duì)當(dāng)今電子商務(wù)提供相對(duì)較好的信息查詢搜索服務(wù)。面向電子商務(wù)的垂直搜索引擎正在逐步取得用戶的喜愛,大大增加了用戶進(jìn)行購物的需求。盡管垂直搜索引擎已經(jīng)進(jìn)入各行各業(yè)當(dāng)中,但是面向電子商務(wù)的搜索引擎仍然存在著不足。在此,本文對(duì)面向電子商務(wù)的垂直搜索引擎展開了深入研究和分析。本文主要圍繞面向電子商務(wù)的垂直搜索引擎的設(shè)計(jì)和實(shí)現(xiàn)技術(shù)展開研究工作。本文研究了通用搜索引擎與垂直搜索引擎的設(shè)計(jì)架構(gòu)、工作原理并進(jìn)行比較其異同,介紹學(xué)習(xí)了相關(guān)關(guān)鍵技術(shù),包括了開源網(wǎng)絡(luò)蜘蛛、中文分詞、主題相關(guān)度、排序算法及Lucene等知識(shí),并重點(diǎn)研究了垂直搜索引擎的個(gè)性化推薦算法。在此基礎(chǔ)上,圍繞垂直搜索引擎的需求,提出了利用矩陣填充的算法進(jìn)行個(gè)性化推薦的方法,利用天貓數(shù)據(jù)對(duì)算法進(jìn)行了比較分析,研究其可行性。解決電子商務(wù)搜索引擎無法準(zhǔn)確推薦的問題。在此基礎(chǔ)上,圍繞電子商務(wù)搜索引擎的系統(tǒng)結(jié)構(gòu),設(shè)計(jì)實(shí)現(xiàn)了基于Heritrix+Lucene的面向電子商務(wù)的垂直搜索引擎的系統(tǒng)。對(duì)面向電子商務(wù)的垂直搜索引擎的發(fā)展具有十分現(xiàn)實(shí)的作用。
【關(guān)鍵詞】:電子商務(wù) 垂直搜索引擎 網(wǎng)絡(luò)蜘蛛 中文分詞 Heritrix Lucene
【學(xué)位授予單位】:云南師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【目錄】:
  • 摘要3-4
  • Abstract4-9
  • 第1章 緒論9-15
  • 1.1 研究的背景與意義9-11
  • 1.2 搜索引擎的分類11-12
  • 1.3 國內(nèi)外發(fā)展現(xiàn)狀12-14
  • 1.4 本章小結(jié)14-15
  • 第2章 搜索引擎的工作原理15-22
  • 2.1 通用搜索引擎15-17
  • 2.1.1 通用搜索引擎的概念15
  • 2.1.2 通用搜索引擎的工作原理15-16
  • 2.1.3 通用搜索引擎的局限性16-17
  • 2.2 垂直搜索引擎17-18
  • 2.2.1 垂直搜索引擎概念17-18
  • 2.2.2 垂直搜索引擎的特點(diǎn)18
  • 2.3 垂直搜索引擎與通用搜索引擎的比較18-21
  • 2.4 本章小結(jié)21-22
  • 第3章 垂直搜索引擎關(guān)鍵技術(shù)的研究22-42
  • 3.1 垂直網(wǎng)絡(luò)蜘蛛技術(shù)22-26
  • 3.1.1 網(wǎng)絡(luò)蜘蛛的基本原理22-23
  • 3.1.2 網(wǎng)絡(luò)蜘蛛的抓取策略23-25
  • 3.1.3 Robots協(xié)議25-26
  • 3.1.4 開源的網(wǎng)絡(luò)蜘蛛26
  • 3.2 中文分詞26-28
  • 3.3 主題相關(guān)度分析28-30
  • 3.3.1 布爾模型28-29
  • 3.3.2 向量模型29-30
  • 3.3.3 概率模型30
  • 3.4 網(wǎng)頁排名30-35
  • 3.4.1 詞頻統(tǒng)計(jì)法31
  • 3.4.2 基于鏈接的分析法31-35
  • 3.4.3 改進(jìn)的鏈接分析法35
  • 3.5 檢索與索引技術(shù)35-41
  • 3.5.1 Lucene概述36
  • 3.5.2 Lucene的系統(tǒng)結(jié)構(gòu)36-37
  • 3.5.3 Lucene的索引機(jī)制37-38
  • 3.5.4 Lucene的倒排索引38-40
  • 3.5.5 Lucene的檢索機(jī)制40
  • 3.5.6 Lucene的優(yōu)點(diǎn)40-41
  • 3.6 本章小結(jié)41-42
  • 第4章 電子商務(wù)垂直搜索引擎的個(gè)性化推薦42-55
  • 4.1 研究的目的42-43
  • 4.2 研究的方案43-46
  • 4.3 矩陣填充46-47
  • 4.3.1 矩陣填充的概念46-47
  • 4.3.2 矩陣填充的應(yīng)用47
  • 4.4 相關(guān)算法的研究47-52
  • 4.4.1 奇異值閾值(SVT)算法47-49
  • 4.4.2 加速近端梯度算法(accelerated proximal gradient,,APG)49-51
  • 4.4.3 非精確增廣拉格朗日乘子法(IALM)51-52
  • 4.5 結(jié)果分析52-54
  • 4.6 本章小結(jié)54-55
  • 第5章 面向電子商務(wù)的垂直搜索引擎的模塊設(shè)計(jì)與實(shí)現(xiàn)55-66
  • 5.1 系統(tǒng)環(huán)境55
  • 5.2 總體框架設(shè)計(jì)55
  • 5.3 網(wǎng)絡(luò)蜘蛛的結(jié)構(gòu)設(shè)計(jì)與實(shí)現(xiàn)55-60
  • 5.3.1 網(wǎng)絡(luò)蜘蛛總體流程55-57
  • 5.3.2 網(wǎng)絡(luò)蜘蛛的實(shí)現(xiàn)57-60
  • 5.4 網(wǎng)頁預(yù)處理60-61
  • 5.5 主題索引模塊61-63
  • 5.6 用戶接口及頁面設(shè)計(jì)63-65
  • 5.7 本章小結(jié)65-66
  • 第6章 總結(jié)和展望66-68
  • 6.1 總結(jié)66-67
  • 6.2 展望67-68
  • 參考文獻(xiàn)68-70
  • 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文70-71
  • 致謝71

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 楊堅(jiān)爭(zhēng);李朝平;;垂直搜索引擎及其應(yīng)用[J];電子商務(wù);2006年10期

2 羅麗姍;;垂直搜索引擎發(fā)展概述[J];圖書館學(xué)研究;2006年12期

3 嚴(yán)宏偉;何俊;;基于房源分析系統(tǒng)的垂直搜索引擎關(guān)鍵技術(shù)的探討[J];中國科技信息;2007年05期

4 胡華梁;何進(jìn);鐘元生;;圖書垂直搜索引擎的設(shè)計(jì)[J];計(jì)算機(jī)與現(xiàn)代化;2007年08期

5 鄭凱明;李義杰;;垂直搜索引擎及其應(yīng)用價(jià)值[J];信息技術(shù);2008年04期

6 畢建濤;霍云福;;垂直搜索引擎贏利模式探討[J];大連大學(xué)學(xué)報(bào);2008年03期

7 許鑫;黃仲清;;垂直搜索引擎應(yīng)用中的若干策略探討——以12580餐飲垂直搜索為例[J];現(xiàn)代圖書情報(bào)技術(shù);2009年02期

8 孔祥春;李義杰;鄭凱明;;垂直搜索引擎應(yīng)用研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2009年07期

9 楊皖蘇;閆冬;;垂直搜索引擎發(fā)展策略探討[J];商業(yè)時(shí)代;2009年23期

10 肖婷;;垂直搜索引擎與旅游行業(yè)探討[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2009年11期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前4條

1 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年

2 林歡歡;王文杰;史忠植;;移動(dòng)環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

3 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

4 毛華揚(yáng);劉衛(wèi);;會(huì)計(jì)信息搜索方法研究[A];第十屆全國會(huì)計(jì)信息化年會(huì)論文集[C];2011年

中國重要報(bào)紙全文數(shù)據(jù)庫 前10條

1 北大縱橫管理顧問公司高級(jí)顧問戴曉東;“商搜”變法 垂直搜索引擎的春天還遠(yuǎn)嗎?[N];中國經(jīng)營(yíng)報(bào);2006年

2 王艷;垂直搜索引擎市場(chǎng)看好[N];中國旅游報(bào);2000年

3 王靖;賽迪網(wǎng)推出垂直搜索引擎[N];人民日?qǐng)?bào)海外版;2000年

4 楊國民;國內(nèi)生物醫(yī)藥行業(yè) 垂直搜索引擎誕生[N];經(jīng)濟(jì)日?qǐng)?bào);2007年

5 本報(bào)記者 王曉雁;垂直搜索引擎著作權(quán)之爭(zhēng)未破題[N];法制日?qǐng)?bào);2009年

6 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;用開源軟件建垂直搜索引擎[N];計(jì)算機(jī)世界;2010年

7 中新;生意寶推“生意搜”攪局電子商務(wù)搜索市場(chǎng)[N];經(jīng)理日?qǐng)?bào);2008年

8 源訊 編譯;搜索巨頭的下一步[N];計(jì)算機(jī)世界;2006年

9 賽迪網(wǎng) 方剛;不只是網(wǎng)站才垂直[N];中國計(jì)算機(jī)報(bào);2000年

10 ;沱沱網(wǎng)“亮劍”國際消費(fèi)電子博覽會(huì) 專業(yè)服務(wù)帶來B2B差異化變革[N];中國貿(mào)易報(bào);2007年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條

1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年

2 吳羽;面向時(shí)間敏感對(duì)象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年

3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年

4 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年

5 王桂紅;農(nóng)產(chǎn)品市場(chǎng)價(jià)格web信息分析方法研究[D];沈陽農(nóng)業(yè)大學(xué);2013年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 韓冰;垂直搜索引擎?zhèn)性化推薦研究與應(yīng)用[D];大連理工大學(xué);2009年

2 關(guān)小敏;垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年

3 吳燕瑋;基于行業(yè)知識(shí)垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年

4 黃興財(cái);大學(xué)生職位垂直c\索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年

5 陳龍飛;垂直搜索引擎在煙草行業(yè)的研究與應(yīng)用[D];浙江理工大學(xué);2016年

6 林祖新;視頻垂直搜索引擎中信息抽取與存儲(chǔ)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年

7 張亞鳳;垂直搜索引擎中關(guān)鍵技術(shù)的研究[D];長(zhǎng)春工業(yè)大學(xué);2016年

8 桂佳;招聘信息垂直搜索引擎系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2014年

9 韓志強(qiáng);基于Hadoop的分布式藏文新聞網(wǎng)站垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[D];中央民族大學(xué);2016年

10 吳昊;垂直搜索引擎關(guān)鍵技術(shù)研究及分布式實(shí)現(xiàn)[D];東南大學(xué);2016年



本文編號(hào):865861

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/865861.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b7985***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com