網(wǎng)絡(luò)文本信息過濾模型及優(yōu)化策略研究
發(fā)布時(shí)間:2023-04-17 04:43
網(wǎng)絡(luò)文本信息過濾屬于信息過濾的一個(gè)分支,它主要根據(jù)因特網(wǎng)上信息的表現(xiàn)形式大多為文本的方式,將信息過濾技術(shù)應(yīng)用于其上,依據(jù)用戶的信息需求模型,在動(dòng)態(tài)的文本信息流中,搜索用戶感興趣的文本。網(wǎng)絡(luò)文本信息過濾涉及的知識范圍非常廣泛,它綜合了知識論、人工智能、自然語言理解等領(lǐng)域的原理與技術(shù)。作為一個(gè)嶄新的研究領(lǐng)域,網(wǎng)絡(luò)文本信息過濾研究一直在逐漸深入,技術(shù)難度也在越來越大,其發(fā)展也在越來越模擬現(xiàn)實(shí)環(huán)境需求。隨著計(jì)算機(jī)應(yīng)用的發(fā)展,從設(shè)想變?yōu)楝F(xiàn)實(shí),并在因特網(wǎng)日益普及的今天有效解決了網(wǎng)絡(luò)信息迷航的問題,在信息服務(wù)與管理方面發(fā)揮著越來越大的作用。本文主要對網(wǎng)絡(luò)文本信息過濾模型進(jìn)行重點(diǎn)研究,主要就網(wǎng)絡(luò)文本過濾模型涉及的用戶建模和用戶匹配兩大技術(shù)進(jìn)行了初步探討,并在闡述信息過濾一般應(yīng)用模型的基礎(chǔ)上提出網(wǎng)絡(luò)文本信息過濾模型,分析網(wǎng)絡(luò)文本信息過濾模型的應(yīng)用特征及其重要組件比如用戶模板、文檔模型、用戶反饋等,并著重討論了常用的三大匹配模型技術(shù)即布爾邏輯模型、概率模型和向量空間模型,最后針對用戶模型和信息過濾算法中存在的主要問題設(shè)計(jì)了一種改進(jìn)的文本過濾模型。該改進(jìn)文本過濾模型是基于向量空間模型算法和語義詞典,在文本表...
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
1 緒論
1.1 選題意義
1.2 研究現(xiàn)狀
1.3 研究的主要內(nèi)容
1.4 研究方法與創(chuàng)新點(diǎn)
1.4.1 研究方法
1.4.2 創(chuàng)新點(diǎn)
2 網(wǎng)絡(luò)文本信息過濾概述
2.1 文本信息過濾的含義
2.2 文本信息過濾系統(tǒng)的分類
2.2.1 按初始化操作分類
2.2.2 按操作位置分類
2.2.3 按過濾方法分類
2.2.4 按用戶獲取信息的方法分類
2.3 文本信息過濾與文本信息檢索及文本信息分類的關(guān)系
2.3.1 文本信息過濾與文本信息分類
2.3.2 文本信息過濾與文本信息檢索
3 網(wǎng)絡(luò)文本信息過濾模型
3.1 信息過濾模型
3.2 網(wǎng)絡(luò)文本信息過濾模型
3.2.1 網(wǎng)絡(luò)文本信息過濾用戶模型
3.2.1.1 用戶模型構(gòu)造
3.2.1.2 用戶模型分類
3.2.1.3 用戶模型評價(jià)
3.2.2 網(wǎng)絡(luò)文本信息過濾算法
3.2.2.1 布爾模型
3.2.2.2 概率模型
3.2.2.3 向量空間模型
4 網(wǎng)絡(luò)文本信息過濾模型存在的問題
4.1 用戶模型存在的問題
4.1.1 過分依賴于用戶對信息需求的表達(dá)
4.1.2 單純依賴于通過關(guān)鍵詞或主題詞描述用戶需求
4.2 信息過濾算法
4.2.1 相關(guān)度過濾算法過于依賴文本統(tǒng)計(jì)分析方法
4.2.2 信息質(zhì)量過濾算法嚴(yán)重缺乏
4.2.3 信息過濾算法缺乏語義分析
5 網(wǎng)絡(luò)文本信息過濾評估
5.1 查準(zhǔn)率和查全率
5.2 基于數(shù)據(jù)集合的評估公式
5.3 統(tǒng)計(jì)性衡量標(biāo)準(zhǔn)
5.4 面向用戶的標(biāo)準(zhǔn)
6 網(wǎng)絡(luò)文本信息過濾模型的優(yōu)化
6.1 改進(jìn)的網(wǎng)絡(luò)文本過濾模型
6.2 基于概念擴(kuò)充的知網(wǎng)
6.3 用戶模型與文本處理中概念擴(kuò)充
6.3.1 利用知網(wǎng)進(jìn)行概念擴(kuò)充
6.3.2 概念擴(kuò)充流程
6.4 信息過濾算法改進(jìn)
6.4.1 根據(jù)信息來源進(jìn)行評價(jià)
6.4.2 根據(jù)信息資源被引用的情況進(jìn)行評價(jià)
6.4.3 根據(jù)用戶信息行為進(jìn)行評價(jià)
7 結(jié)束語
7.1 工作總結(jié)
7.2 進(jìn)一步的工作
參考文獻(xiàn)
在校期間發(fā)表的論文、科研成果等
致謝
本文編號:3792595
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
1 緒論
1.1 選題意義
1.2 研究現(xiàn)狀
1.3 研究的主要內(nèi)容
1.4 研究方法與創(chuàng)新點(diǎn)
1.4.1 研究方法
1.4.2 創(chuàng)新點(diǎn)
2 網(wǎng)絡(luò)文本信息過濾概述
2.1 文本信息過濾的含義
2.2 文本信息過濾系統(tǒng)的分類
2.2.1 按初始化操作分類
2.2.2 按操作位置分類
2.2.3 按過濾方法分類
2.2.4 按用戶獲取信息的方法分類
2.3 文本信息過濾與文本信息檢索及文本信息分類的關(guān)系
2.3.1 文本信息過濾與文本信息分類
2.3.2 文本信息過濾與文本信息檢索
3 網(wǎng)絡(luò)文本信息過濾模型
3.1 信息過濾模型
3.2 網(wǎng)絡(luò)文本信息過濾模型
3.2.1 網(wǎng)絡(luò)文本信息過濾用戶模型
3.2.1.1 用戶模型構(gòu)造
3.2.1.2 用戶模型分類
3.2.1.3 用戶模型評價(jià)
3.2.2 網(wǎng)絡(luò)文本信息過濾算法
3.2.2.1 布爾模型
3.2.2.2 概率模型
3.2.2.3 向量空間模型
4 網(wǎng)絡(luò)文本信息過濾模型存在的問題
4.1 用戶模型存在的問題
4.1.1 過分依賴于用戶對信息需求的表達(dá)
4.1.2 單純依賴于通過關(guān)鍵詞或主題詞描述用戶需求
4.2 信息過濾算法
4.2.1 相關(guān)度過濾算法過于依賴文本統(tǒng)計(jì)分析方法
4.2.2 信息質(zhì)量過濾算法嚴(yán)重缺乏
4.2.3 信息過濾算法缺乏語義分析
5 網(wǎng)絡(luò)文本信息過濾評估
5.1 查準(zhǔn)率和查全率
5.2 基于數(shù)據(jù)集合的評估公式
5.3 統(tǒng)計(jì)性衡量標(biāo)準(zhǔn)
5.4 面向用戶的標(biāo)準(zhǔn)
6 網(wǎng)絡(luò)文本信息過濾模型的優(yōu)化
6.1 改進(jìn)的網(wǎng)絡(luò)文本過濾模型
6.2 基于概念擴(kuò)充的知網(wǎng)
6.3 用戶模型與文本處理中概念擴(kuò)充
6.3.1 利用知網(wǎng)進(jìn)行概念擴(kuò)充
6.3.2 概念擴(kuò)充流程
6.4 信息過濾算法改進(jìn)
6.4.1 根據(jù)信息來源進(jìn)行評價(jià)
6.4.2 根據(jù)信息資源被引用的情況進(jìn)行評價(jià)
6.4.3 根據(jù)用戶信息行為進(jìn)行評價(jià)
7 結(jié)束語
7.1 工作總結(jié)
7.2 進(jìn)一步的工作
參考文獻(xiàn)
在校期間發(fā)表的論文、科研成果等
致謝
本文編號:3792595
本文鏈接:http://www.sikaile.net/tushudanganlunwen/3792595.html
最近更新
教材專著