天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于數(shù)學(xué)表達(dá)式特征的科技文檔檢索模型

發(fā)布時(shí)間:2020-02-27 18:40
【摘要】:數(shù)學(xué)表達(dá)式是科技信息交流的重要載體和科技文獻(xiàn)中的重要成分,但由于數(shù)學(xué)表達(dá)式有別于普通文本的特殊屬性,導(dǎo)致目前面向普通文本的檢索技術(shù)和搜索引擎難以實(shí)現(xiàn)以數(shù)學(xué)表達(dá)式為特征的科技文獻(xiàn)檢索,影響了科技信息的傳播與交流,是目前信息檢索與人工智能領(lǐng)域亟待解決的關(guān)鍵問題之一。針對上述問題,本文通過對科技文檔構(gòu)成元素與結(jié)構(gòu)的分析,研究、設(shè)計(jì)基于數(shù)學(xué)表達(dá)式特征的科技文檔檢索模型,實(shí)現(xiàn)以數(shù)學(xué)表達(dá)式為查詢語言的科技文檔檢索。首先,在科技文檔檢索特征的選擇與提取階段,提取科技文檔的重要信息并組織成文檔信息表及公式信息表;其次,在科技文檔索引階段,利用文檔特征信息和文檔內(nèi)公式特征信息以及利用數(shù)學(xué)公式解析算法得到的數(shù)學(xué)表達(dá)式的子式信息,采用分層索引思想構(gòu)建科技文檔索引表與子式索引表;然后,在檢索階段,根據(jù)數(shù)學(xué)查詢表達(dá)式的特征信息構(gòu)建特征向量,設(shè)計(jì)了精確匹配、包含匹配和相似匹配等匹配模式檢索出符合要求的科技文檔結(jié)果集;最后,根據(jù)查詢項(xiàng)出現(xiàn)在文檔不同區(qū)域的重要程度以及與查詢式的匹配程度,結(jié)合tf-idf加權(quán)方法,采用余弦相似度進(jìn)行科技文檔的相似度計(jì)算,得到有序的科技文檔檢索結(jié)果。實(shí)驗(yàn)結(jié)果表明,該模型實(shí)現(xiàn)了以數(shù)學(xué)表達(dá)式為特征對科技文檔進(jìn)行檢索的目標(biāo)。
【圖文】:

文檔,向量圖,析取范式,檢索模型


2( ) 2mathQ a b n p q;成析取范式(1,0,1) (0,1,1) (1,1,1)mathQDNF ;文檔 A 和文檔 B 的三元組分別對應(yīng)的是(1,1,0)和(1,1,1其匹配成功,作為結(jié)果集。間模型型[3,4]是上世紀(jì) 70 年代 Salton 等人提出來的檢索效果較檢索模型。檔1d 、2d 以及3d 含有索引項(xiàng)公式1T 、2T 以及3T ,查詢,其中文檔1d 、2d 以及3d 的權(quán)重分別為(2,3,5),(3,73d 可以表示為1 1 2 3D 2T 3T 5T,2 1 2 3D 3T 7T T,2 D

檢索模型,數(shù)學(xué)表達(dá)式,格式描述


圖 2 科技文檔檢索模型圖文檔特征的提取的資源信息的存儲形式可以分為兩類:第一類,將資源信息手動(dòng)或自動(dòng)的方式對其進(jìn)行組織和管理;第二類,將資源信上,可以采用網(wǎng)絡(luò)爬蟲技術(shù)將資源站點(diǎn)上科技文檔的資源信進(jìn)行組織和管理。學(xué)表達(dá)式解析式解析的目標(biāo)是對數(shù)學(xué)表達(dá)式的特征信息進(jìn)行提取。特征提準(zhǔn)確地描述一個(gè)大型的數(shù)據(jù)集[45]。針對 LaTex 格式描述的數(shù)維文本形式的數(shù)學(xué)表達(dá)式進(jìn)行分析和提取,得到數(shù)學(xué)表達(dá)式構(gòu)。針對 MathML 格式描述的數(shù)學(xué)表達(dá)式解析的目標(biāo)是對 X進(jìn)行分析和提取,得到數(shù)學(xué)表達(dá)式的各種成分以及二維運(yùn)算技文檔索引的構(gòu)建
【學(xué)位授予單位】:河北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 張明寶;米傳民;;一種改進(jìn)的基于文檔結(jié)構(gòu)的信息檢索方法[J];情報(bào)理論與實(shí)踐;2009年08期

2 盧托;于俊清;廖兆存;聶江;;基于Web的數(shù)學(xué)公式檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];微處理機(jī);2008年02期

相關(guān)碩士學(xué)位論文 前10條

1 劉惠叢;基于互關(guān)聯(lián)后繼樹的數(shù)學(xué)表達(dá)式檢索模型[D];河北大學(xué);2017年

2 李彬;基于SFE的LaTeX表達(dá)式檢索系統(tǒng)[D];河北大學(xué);2017年

3 周南;基于層次結(jié)構(gòu)特征的數(shù)學(xué)表達(dá)式檢索模型[D];河北大學(xué);2016年

4 徐月霞;面向語義的數(shù)學(xué)公式N-grams索引結(jié)構(gòu)研究[D];蘭州大學(xué);2015年

5 李遠(yuǎn)輝;數(shù)學(xué)表達(dá)式檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];重慶大學(xué);2014年

6 陶啟立;基于語義的科技文檔信息資源檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西北大學(xué);2011年

7 劉志偉;數(shù)學(xué)搜索引擎研究[D];蘭州大學(xué);2011年

8 劉東閣;基于MathML的公式檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];東北大學(xué);2009年

9 景珂;網(wǎng)絡(luò)數(shù)學(xué)搜索中的數(shù)學(xué)查詢語言與索引的研究[D];蘭州大學(xué);2009年

10 盧托;科技文檔中數(shù)學(xué)公式的描述與檢索[D];華中科技大學(xué);2007年

,

本文編號:2583351

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2583351.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7ee15***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com