基于猶豫模糊權(quán)重的數(shù)學(xué)表達(dá)式檢索
發(fā)布時(shí)間:2022-01-09 20:57
【目的】從大量數(shù)學(xué)表達(dá)式中檢索出與查詢表達(dá)式相似的表達(dá)式,并對檢索結(jié)果排序。【方法】提取單個(gè)數(shù)學(xué)表達(dá)式的特征子式,利用猶豫模糊集理論計(jì)算每個(gè)特征子式的權(quán)重值;將屬于同一表達(dá)式的子式權(quán)重值進(jìn)行累加,計(jì)算表達(dá)式間的相似度得分,按照分?jǐn)?shù)從高到低的順序排列檢索結(jié)果。【結(jié)果】從時(shí)間和相似度的角度進(jìn)行分析,本文方法檢索效率較高,檢索結(jié)果較準(zhǔn)確,本文排序方法的NDCG值最高為0.88,表明該排序方法較合理。【局限】本文排序方法并非完全面向數(shù)學(xué)表達(dá)式語義檢索。【結(jié)論】引入猶豫模糊集計(jì)算子式權(quán)重能夠更準(zhǔn)確地檢索出具有相同結(jié)構(gòu)特征的數(shù)學(xué)表達(dá)式。
【文章來源】:數(shù)據(jù)分析與知識發(fā)現(xiàn). 2020,4(07)北大核心CSSCICSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
數(shù)學(xué)表達(dá)式檢索總體流程
除倒排表以外,還有數(shù)學(xué)表達(dá)式索引表,設(shè)置三個(gè)字段,分別記錄表達(dá)式編號、表達(dá)式LaTeX碼、所有子式特征碼及權(quán)重值。該表采用順序索引方式構(gòu)建,在此不再贅述。3.3 猶豫模糊權(quán)重子式檢索與相似度計(jì)算方法
以一個(gè)包含兩個(gè)子式的數(shù)學(xué)表達(dá)式f(md5-subf1,md5-subf2)為例,展示檢索過程,如圖3所示。表達(dá)式l和m均包含兩個(gè)子式,表達(dá)式n只包含第二個(gè)子式,則score(l)和score(m)均為兩個(gè)加權(quán)權(quán)重值的累加,score(n)僅等于第二個(gè)子式的加權(quán)權(quán)重值。4 實(shí)驗(yàn)與分析
【參考文獻(xiàn)】:
期刊論文
[1]基于文本和公式的科技文檔相似度計(jì)算[J]. 徐建民,許彩云. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(10)
[2]基于消息摘要算法第五版和IDEA的混合加密算法[J]. 李夏夢,潘廣貞. 科學(xué)技術(shù)與工程. 2017(09)
[3]LaTeX數(shù)學(xué)表達(dá)式解析與索引方法[J]. 周南,田學(xué)東. 計(jì)算機(jī)應(yīng)用. 2016(03)
碩士論文
[1]基于猶豫模糊集的數(shù)學(xué)檢索結(jié)果排序研究[D]. 張凱歌.河北大學(xué) 2017
[2]基于層次結(jié)構(gòu)特征的數(shù)學(xué)表達(dá)式檢索模型[D]. 周南.河北大學(xué) 2016
[3]面向語義的數(shù)學(xué)公式N-grams索引結(jié)構(gòu)研究[D]. 徐月霞.蘭州大學(xué) 2015
[4]基于本體的數(shù)學(xué)表達(dá)式檢索技術(shù)研究[D]. 王小龍.重慶大學(xué) 2014
[5]網(wǎng)絡(luò)數(shù)學(xué)搜索中的數(shù)學(xué)查詢語言與索引的研究[D]. 景珂.蘭州大學(xué) 2009
本文編號:3579430
【文章來源】:數(shù)據(jù)分析與知識發(fā)現(xiàn). 2020,4(07)北大核心CSSCICSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
數(shù)學(xué)表達(dá)式檢索總體流程
除倒排表以外,還有數(shù)學(xué)表達(dá)式索引表,設(shè)置三個(gè)字段,分別記錄表達(dá)式編號、表達(dá)式LaTeX碼、所有子式特征碼及權(quán)重值。該表采用順序索引方式構(gòu)建,在此不再贅述。3.3 猶豫模糊權(quán)重子式檢索與相似度計(jì)算方法
以一個(gè)包含兩個(gè)子式的數(shù)學(xué)表達(dá)式f(md5-subf1,md5-subf2)為例,展示檢索過程,如圖3所示。表達(dá)式l和m均包含兩個(gè)子式,表達(dá)式n只包含第二個(gè)子式,則score(l)和score(m)均為兩個(gè)加權(quán)權(quán)重值的累加,score(n)僅等于第二個(gè)子式的加權(quán)權(quán)重值。4 實(shí)驗(yàn)與分析
【參考文獻(xiàn)】:
期刊論文
[1]基于文本和公式的科技文檔相似度計(jì)算[J]. 徐建民,許彩云. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(10)
[2]基于消息摘要算法第五版和IDEA的混合加密算法[J]. 李夏夢,潘廣貞. 科學(xué)技術(shù)與工程. 2017(09)
[3]LaTeX數(shù)學(xué)表達(dá)式解析與索引方法[J]. 周南,田學(xué)東. 計(jì)算機(jī)應(yīng)用. 2016(03)
碩士論文
[1]基于猶豫模糊集的數(shù)學(xué)檢索結(jié)果排序研究[D]. 張凱歌.河北大學(xué) 2017
[2]基于層次結(jié)構(gòu)特征的數(shù)學(xué)表達(dá)式檢索模型[D]. 周南.河北大學(xué) 2016
[3]面向語義的數(shù)學(xué)公式N-grams索引結(jié)構(gòu)研究[D]. 徐月霞.蘭州大學(xué) 2015
[4]基于本體的數(shù)學(xué)表達(dá)式檢索技術(shù)研究[D]. 王小龍.重慶大學(xué) 2014
[5]網(wǎng)絡(luò)數(shù)學(xué)搜索中的數(shù)學(xué)查詢語言與索引的研究[D]. 景珂.蘭州大學(xué) 2009
本文編號:3579430
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/3579430.html
最近更新
教材專著