天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向組織內(nèi)部搜索引擎的構(gòu)建策略

發(fā)布時間:2017-10-04 23:18

  本文關(guān)鍵詞:面向組織內(nèi)部搜索引擎的構(gòu)建策略


  更多相關(guān)文章: 信息集成 信息更新 TF-IDF 搜索排序


【摘要】:在大數(shù)據(jù)時代,互聯(lián)網(wǎng)產(chǎn)生的龐大的數(shù)據(jù)信息讓億萬用戶時刻享受著最新資訊。無論學(xué)習(xí)或者工作,對于用戶而言,及時掌握學(xué);蛘咂髽I(yè)的最新消息都是非常必要的,但是在內(nèi)部網(wǎng)中最新更新的信息很難被及時發(fā)現(xiàn)。并且網(wǎng)站中還存在著大量的可用資源,這些資源處于網(wǎng)站的深層中,用戶往往需要跳轉(zhuǎn)很多的鏈接才能找到。現(xiàn)有的企業(yè)內(nèi)部搜索工具不能有效地解決以上問題。本文通過對內(nèi)部網(wǎng)站信息更新特點(diǎn)的研究,提出了解決方法,本文主要貢獻(xiàn)如下:(1)提出了基于內(nèi)部搜索引擎的信息更新方法。信息集成是計算內(nèi)部網(wǎng)絡(luò)中信息更新周期的基礎(chǔ),它決定了企業(yè)門戶網(wǎng)站信息能否被全面檢索;谠搯栴},針對企業(yè)門戶網(wǎng)站的特點(diǎn),提出了企業(yè)信息集成方法。同時定義了企業(yè)web信息網(wǎng)絡(luò)、有效訪問、節(jié)點(diǎn)更新周期等相關(guān)概念;诖,進(jìn)一步提出了基于內(nèi)部搜索引擎的信息更新方法。并比較了傳統(tǒng)更新方法、基于更新周期的信息更新方法、自適應(yīng)的更新方法的優(yōu)點(diǎn)和不足。(2)提出了基于TF-IDF排序的優(yōu)化方法。對傳統(tǒng)的內(nèi)部搜索工具的搜索結(jié)果進(jìn)行對比,使用基于網(wǎng)頁全文的搜索方法,結(jié)合返回結(jié)果和搜索語句計算網(wǎng)頁的權(quán)重,并使用NDCG評分策略對優(yōu)化后的結(jié)果進(jìn)行評價,最終呈現(xiàn)一個用戶滿意的查詢結(jié)果。(3)對提出的方法進(jìn)行了系統(tǒng)實(shí)現(xiàn);谝陨戏椒,進(jìn)行了系統(tǒng)實(shí)現(xiàn),通過實(shí)際使用驗證了所提方法的有效性。
【關(guān)鍵詞】:信息集成 信息更新 TF-IDF 搜索排序
【學(xué)位授予單位】:天津理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【目錄】:
  • 摘要5-6
  • ABSTRACT6-9
  • 第一章 緒論9-12
  • 1.1 研究背景及意義9-10
  • 1.2 研究現(xiàn)狀10
  • 1.3 主要研究內(nèi)容10-11
  • 1.4 論文組織結(jié)構(gòu)11-12
  • 第二章 面向內(nèi)部搜索引擎的信息更新方法12-23
  • 2.1 引言12
  • 2.2 問題描述12
  • 2.3 相關(guān)工作12-13
  • 2.4 信息集成框架13-15
  • 2.4.1 相關(guān)概念13
  • 2.4.2 信息抽取方法13-14
  • 2.4.3 集成框架14-15
  • 2.5 信息更新方法15-20
  • 2.5.1 遍歷式更新方法15
  • 2.5.2 基于時間標(biāo)簽的信息更新方法15-19
  • 2.5.3 自適應(yīng)的更新方法19-20
  • 2.6 實(shí)驗評估20-22
  • 2.7 本章小結(jié)22-23
  • 第三章 基于TF-IDF的排序優(yōu)化方法23-38
  • 3.1 引言23
  • 3.2 問題描述23-24
  • 3.3 相關(guān)概念24-25
  • 3.3.1 查全率和查準(zhǔn)率24
  • 3.3.2 全文索引與Lucene簡介24-25
  • 3.4 基于TF-IDF的排序優(yōu)化方法25-34
  • 3.4.1 基于標(biāo)題的搜索方法25-26
  • 3.4.2 基于網(wǎng)頁全文的搜索方法26-29
  • 3.4.3 基于TF-IDF的綜合排序方法29-34
  • 3.5 評估34-37
  • 3.5.1 生成實(shí)驗數(shù)據(jù)集34
  • 3.5.2 基準(zhǔn)建立34-35
  • 3.5.3 評估策略35
  • 3.5.4 實(shí)驗結(jié)果35-37
  • 3.6 本章小結(jié)37-38
  • 第四章 原型系統(tǒng)實(shí)現(xiàn)38-43
  • 4.1 引言38
  • 4.2 設(shè)計思路38-39
  • 4.3 相關(guān)技術(shù)39
  • 4.4 系統(tǒng)功能39-40
  • 4.4.1 信息集成功能39
  • 4.4.2 信息搜索功能39-40
  • 4.5 系統(tǒng)評估40-42
  • 4.5.1 排序結(jié)果測試40-41
  • 4.5.2 功能測試41
  • 4.5.3 性能測試41-42
  • 4.6 本章小結(jié)42-43
  • 第五章 總結(jié)和展望43-44
  • 5.1 研究成果總結(jié)43
  • 5.2 未來工作展望43-44
  • 參考文獻(xiàn)44-47
  • 發(fā)表論文和科研情況說明47-48
  • 致謝48-49

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 優(yōu)利;公時;;信息更新大腦“芯片”[J];中國商界;1997年07期

2 任燕麗;信息與信息素質(zhì)[J];北京成人教育;1999年06期

3 吳家皋;余浩;張雪英;;基于鏈接回溯的地理信息更新主題爬蟲研究[J];計算機(jī)技術(shù)與發(fā)展;2014年07期

4 張令保;;“三統(tǒng)一”推進(jìn)政府信息公開——安徽省運(yùn)用信息化手段實(shí)踐《條例》[J];信息化建設(shè);2008年08期

5 曾祥興;王喜成;;需求信息更新下短生命周期產(chǎn)品的訂貨模型[J];桂林電子工業(yè)學(xué)院學(xué)報;2006年03期

6 ;《北京通V2.0》為你服務(wù)[J];科技潮;1998年02期

7 陳建;讓農(nóng)業(yè)駛?cè)胄畔⒒目燔嚨扩ぉば畔⒒脑靷鹘y(tǒng)農(nóng)業(yè)的實(shí)踐與思考[J];信息化建設(shè);2001年06期

8 鄭士貴;新信息的檢索[J];管理科學(xué)文摘;1997年11期

9 裘杭萍;王玲玲;權(quán)冀川;肖登海;;基于信息質(zhì)量的信息優(yōu)勢評估指標(biāo)研究[J];計算機(jī)技術(shù)與發(fā)展;2010年05期

10 王鵬展;孫曉鐘;周海華;;全面建設(shè)數(shù)字青島 著力打造信息強(qiáng)市[J];信息技術(shù)與信息化;2006年05期

中國重要會議論文全文數(shù)據(jù)庫 前2條

1 申成霖;張新鑫;;需求信息更新應(yīng)對策略性顧客行為的價值[A];第十四屆中國管理科學(xué)學(xué)術(shù)年會論文集(上冊)[C];2012年

2 羅迎;李勝;戴岱;劉陽;;供應(yīng)商主導(dǎo)下具有需求信息更新的二級供應(yīng)鏈數(shù)量彈性契約研究[A];第六屆(2011)中國管理學(xué)年會——運(yùn)作管理分會場論文集[C];2011年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 本報記者 黃穗誠;粵基礎(chǔ)地理信息更新與應(yīng)用研究通過評審[N];廣東建設(shè)報;2009年

2 記者 杜永剛;1∶1萬基礎(chǔ)地理信息更新與建庫有了技術(shù)綱要[N];中國測繪報;2001年

3 ;ICP升級信息集成凸現(xiàn)[N];科技日報;2000年

4 記者 王光耀;上;A(chǔ)地理信息更新全面提速[N];中國測繪報;2003年

5 福州大學(xué)副校長 “數(shù)字福建”專家委員會主任 王欽敏;數(shù)字化建設(shè)應(yīng)把握六大要點(diǎn)[N];通信信息報;2002年

6 本報記者 李繼學(xué);信息大整合,助力社保工作再上臺階[N];中國財經(jīng)報;2011年

7 韓韞超;“煎餅人”:游走在信息饑渴與追逐中[N];工人日報;2012年

8 實(shí)習(xí)記者 馮君;信息更新不及時將進(jìn)“黑名單”[N];政府采購信息報;2008年

9 記者 吳進(jìn)宇 通訊員 李海杰;北京貸款卡基本信息實(shí)現(xiàn)自動更新[N];金融時報;2011年

10 蘇州大學(xué)社會學(xué)院副院長兼電子政務(wù)系主任 周毅;檔案部門應(yīng)在網(wǎng)絡(luò)信息存檔行動中有所作為[N];中國檔案報;2011年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前7條

1 吳俊;基于需求信息更新的多產(chǎn)品雙源采購策略研究[D];南京理工大學(xué);2016年

2 卞智繁;面向組織內(nèi)部搜索引擎的構(gòu)建策略[D];天津理工大學(xué);2016年

3 邱梅;基于信息更新視角的不確定決策機(jī)理研究[D];浙江大學(xué);2012年

4 章長春;ASP海事信息服務(wù)平臺的研究與實(shí)現(xiàn)[D];大連海事大學(xué);2001年

5 高荃;我國政府信息公開途徑研究[D];南昌大學(xué);2012年

6 雷佩瑩;基于Web的新聞信息抽取系統(tǒng)設(shè)計與實(shí)現(xiàn)[D];西北大學(xué);2008年

7 師穎帥;學(xué)生公寓管理系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D];電子科技大學(xué);2013年

,

本文編號:973442

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/973442.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c489a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com