基于大型數(shù)據(jù)庫的智能搜索與摘要提取技術(shù)研究
本文關(guān)鍵詞:基于大型數(shù)據(jù)庫的智能搜索與摘要提取技術(shù)研究
更多相關(guān)文章: 排序算法 摘要提取 全文檢索 智能搜索
【摘要】:數(shù)據(jù)庫全文檢索技術(shù)的出現(xiàn)大大提高了數(shù)據(jù)庫對于海量數(shù)據(jù)的檢索效率。但是,在中文應(yīng)用系統(tǒng)尤其是一些指揮信息系統(tǒng)中,采用全文檢索技術(shù)的并不多,主要是由于特殊原因這些系統(tǒng)不能與互聯(lián)網(wǎng)對接,無法針對多個(gè)數(shù)據(jù)庫表多個(gè)字段實(shí)現(xiàn)全局?jǐn)?shù)據(jù)聯(lián)合查找,也不能結(jié)合具體的作戰(zhàn)指揮和平時(shí)應(yīng)用靈活的展示給指揮員感興趣的內(nèi)容。因此,急需研究一種能夠完善支持中文應(yīng)用系統(tǒng)、采用全文檢索技術(shù)、并具備一定智能特性、可以進(jìn)行摘要提取的通用搜索引擎,能夠在相關(guān)指揮信息系統(tǒng)中加入全中文智能搜索和摘要提取功能,以便于用戶及時(shí)查找到所需要的內(nèi)容,以提高指揮的信息處理能力、快速反應(yīng)能力和輔助決策能力。以目前單位XX指揮系統(tǒng)的大型數(shù)據(jù)庫無法有效處理中文數(shù)據(jù)信息的問題為背景,針對中文數(shù)據(jù)庫應(yīng)用系統(tǒng)數(shù)據(jù)搜索不靈活的問題開展了深入研究,以大型數(shù)據(jù)庫的全文檢索技術(shù)為核心,構(gòu)建了一個(gè)全庫多表多字段的全局智能搜索引擎,在其實(shí)現(xiàn)流程和應(yīng)用方式上都作了改進(jìn)和創(chuàng)新,能夠真正幫助用戶從海量數(shù)據(jù)中快速的檢索有效的信息。針對目前多數(shù)數(shù)據(jù)庫在面對大量數(shù)據(jù)進(jìn)行檢索時(shí)出現(xiàn)的信息表現(xiàn)力差的問題,對大型數(shù)據(jù)庫的全文檢索機(jī)制進(jìn)行了研究,提出了全局智能搜索的技術(shù),設(shè)計(jì)了搜索引擎的工作流程;研究了文檔去格式化技術(shù)和基于XML的文本聯(lián)結(jié)技術(shù),實(shí)現(xiàn)了多表多字段的聯(lián)合數(shù)據(jù)查詢;提出基于正則表達(dá)式的摘要提取方法和改進(jìn)的基于Oracle Text的排序算法,有效地提高了全文檢索結(jié)果的質(zhì)量;對搜索結(jié)果的展現(xiàn)技術(shù)進(jìn)行了研究,結(jié)合用戶的具體應(yīng)用需求,智能搜索引擎能對查詢結(jié)果做出不同的處理,以最合適的方式展現(xiàn)給用戶,體現(xiàn)全局智能搜索引擎的智能化。在單位XX指揮系統(tǒng)中設(shè)計(jì)了智能搜索與摘要提取工具,建立了全文索引,開發(fā)了良好的人機(jī)界面,解決了目前大型數(shù)據(jù)庫應(yīng)用中用戶或開發(fā)者必須知道數(shù)據(jù)存放位置才能實(shí)現(xiàn)數(shù)據(jù)搜索的問題,實(shí)現(xiàn)了通用的全數(shù)據(jù)庫多表多字段的全局智能聯(lián)合數(shù)據(jù)搜索,并進(jìn)一步實(shí)現(xiàn)了結(jié)果自動排序、關(guān)鍵詞突顯、摘要顯示等功能,同時(shí)在數(shù)據(jù)的展現(xiàn)上能有效地針對數(shù)據(jù)的類型和特點(diǎn),將搜索結(jié)果以最直觀、最合適的方式展現(xiàn)給用戶,使數(shù)據(jù)庫的檢索功能能夠真正結(jié)合具體應(yīng)用,以滿足XX指揮系統(tǒng)的作戰(zhàn)指揮、訓(xùn)練演習(xí)和平時(shí)辦公等多項(xiàng)需求。
【關(guān)鍵詞】:排序算法 摘要提取 全文檢索 智能搜索
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.3;TP311.13
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 緒論10-18
- 1.1 基于數(shù)據(jù)庫的檢索技術(shù)發(fā)展現(xiàn)狀10-14
- 1.2 數(shù)據(jù)庫全文檢索技術(shù)面臨的挑戰(zhàn)14-15
- 1.3 本文研究的主要內(nèi)容15-17
- 1.4 文章的結(jié)構(gòu)17-18
- 第二章 大型數(shù)據(jù)庫的全文檢索機(jī)制研究18-27
- 2.1 ORACLE TEXT全文檢索18-21
- 2.1.1 Oracle Text的體系結(jié)構(gòu)18-19
- 2.1.2 Oracle Text的分詞技術(shù)19-20
- 2.1.3 Oracle Text的排序算法20
- 2.1.4 Oracle Text的索引類型20-21
- 2.2 SQL SERVER全文檢索21-25
- 2.2.1 SQL Server全文檢索體系結(jié)構(gòu)21-23
- 2.2.2 SQL Server全文檢索分詞技術(shù)23-24
- 2.2.3 SQL Server全文檢索排序算法24-25
- 2.3 MYSQL全文檢索機(jī)制25-26
- 2.4 小結(jié)26-27
- 第三章 全局智能搜索工具的關(guān)鍵技術(shù)27-40
- 3.1 全局智能搜索工具流程27-30
- 3.1.1 需求分析27
- 3.1.2 功能設(shè)計(jì)27-30
- 3.2 文本處理30-33
- 3.2.1 文本去格式化30-32
- 3.2.2 索引文本XML處理32-33
- 3.3 排序算法33-36
- 3.3.1 智能搜索引擎排序算法33-34
- 3.3.2 Oracle Text排序算法34-35
- 3.3.3 改進(jìn)的基于Oracle Text的排序算法35-36
- 3.4 摘要提取技術(shù)36-39
- 3.4.1 句子提取37-38
- 3.4.2 計(jì)算句子的權(quán)值38
- 3.4.3 計(jì)算句子之間的相似度38-39
- 3.5 小結(jié)39-40
- 第四章 智能搜索與摘要提取工具的實(shí)現(xiàn)40-53
- 4.1 搜索工具的實(shí)現(xiàn)40-49
- 4.1.1 文本聯(lián)結(jié)的實(shí)現(xiàn)41-42
- 4.1.2 排序算法的實(shí)現(xiàn)42
- 4.1.3 摘要顯示的實(shí)現(xiàn)42-43
- 4.1.4 全文索引的建立43-44
- 4.1.5 全文索引的同步與優(yōu)化44-45
- 4.1.6 索引配置工具的實(shí)現(xiàn)45-48
- 4.1.7 人機(jī)界面的開發(fā)48-49
- 4.2 通用性設(shè)計(jì)49
- 4.3 表現(xiàn)方式和檢索效率49-50
- 4.4 展現(xiàn)方式設(shè)計(jì)——與用戶的具體應(yīng)用相結(jié)合50-52
- 4.5 小結(jié)52-53
- 第五章 結(jié)束語53-55
- 5.1 研究工作的總結(jié)53
- 5.2 下一步需要解決的問題53-55
- 致謝55-56
- 參考文獻(xiàn)56-59
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 侯大銀;;智能搜索:夢想照進(jìn)現(xiàn)實(shí)[J];互聯(lián)網(wǎng)周刊;2009年03期
2 黃昆;;聰明萬事通,智能搜索引路[J];中國計(jì)算機(jī)用戶;2006年47期
3 ;智能搜索:學(xué)習(xí)型組織的推動力[J];計(jì)算機(jī)與網(wǎng)絡(luò);2006年10期
4 ;企業(yè)級市場:智能搜索的獨(dú)角戲?[J];計(jì)算機(jī)與網(wǎng)絡(luò);2006年11期
5 王淑英;張明;劉云;;移動Agent在智能搜索中的應(yīng)用[J];中小企業(yè)管理與科技(下旬刊);2011年04期
6 朱貴憲;蘆艷芳;;用于智能搜索的無線通信系統(tǒng)設(shè)計(jì)[J];煤炭技術(shù);2011年09期
7 翁代云;楊莉;;基于語義Web的智能搜索的研究[J];科技風(fēng);2013年06期
8 葉慶衛(wèi),陳濤;企業(yè)信息智能搜索的研究與應(yīng)用[J];管理信息系統(tǒng);1998年09期
9 晏俊德,李雪蓮,胡慶倫;基于個(gè)人定制的智能搜索助手的研究[J];沈陽工業(yè)大學(xué)學(xué)報(bào);2000年01期
10 楊明莉;陳義輝;;基于概念的語義智能搜索模型體系結(jié)構(gòu)的研究[J];商場現(xiàn)代化;2009年05期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 何盈捷;馮月利;王珊;;Peer-to-Peer環(huán)境下基于內(nèi)容的智能搜索[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2004年
2 王雪萍;楊青;黃祖鋒;;P2P網(wǎng)絡(luò)中基于蟻群算法的智能搜索研究[A];2006全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會議論文集[C];2006年
3 丁曉安;徐伯夏;;基于智能搜索功能的Android平臺手機(jī)拼車系統(tǒng)設(shè)計(jì)[A];全國第五屆信號和智能信息處理與應(yīng)用學(xué)術(shù)會議?(第一冊)[C];2011年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 ;智能搜索:結(jié)果最優(yōu)化 價(jià)值最大化[N];中國計(jì)算機(jī)報(bào);2006年
2 鄧健;智能搜索為信息共享提速[N];計(jì)算機(jī)世界;2006年
3 記者 莫小松 常鑫 通訊員 郝晉薇;廣西交通網(wǎng)設(shè)交管問答智能搜索[N];法制日報(bào);2010年
4 中國電信上海研究院 邢青;移動智能搜索 所需即所得[N];人民郵電;2011年
5 潘z,
本文編號:900884
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/900884.html