天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

模糊XML文檔與模糊DTD相似性研究

發(fā)布時(shí)間:2019-08-15 12:10
【摘要】:在模糊XML數(shù)據(jù)管理中,模糊XML文檔和模糊DTD的相似性是模糊XML數(shù)據(jù)整合、模糊XML文檔聚類的關(guān)鍵步驟.為了研究模糊XML文檔和模糊DTD的相似性,對(duì)模糊DTD樹(shù)進(jìn)行了規(guī)則變換,主要解決元素和屬性的析取約束和基數(shù)約束問(wèn)題,即由析取范式轉(zhuǎn)化為合取范式,將元素或?qū)傩缘闹貜?fù)次數(shù)確定化,然后利用樹(shù)編輯距離算法對(duì)模糊XML文檔樹(shù)和轉(zhuǎn)化后的模糊DTD樹(shù)集合進(jìn)行相似性對(duì)比.通過(guò)實(shí)驗(yàn)驗(yàn)證了所提方法的性能優(yōu)勢(shì).
【圖文】:

實(shí)例圖,XML文檔,實(shí)例


用基于“隸屬度和可能性分布”的模糊XML文檔的表示模型[8].在這個(gè)模型中,一個(gè)元素可以有相關(guān)的隸屬度.元素的隸屬度意味著成為其父親的孩子節(jié)點(diǎn)的可能性.而元素的屬性值可以用概率分布來(lái)表示,并且這些值可以是析取的,也可以是合取的.下面給出一個(gè)模糊XML文檔片段,如圖1所示.模糊XML文檔可以用樹(shù)形結(jié)構(gòu)來(lái)表示.按照DOM[9]模型,一個(gè)模糊XML文檔也可以表示為一個(gè)單根的有序標(biāo)簽樹(shù),其中的節(jié)點(diǎn)對(duì)應(yīng)文檔中的元素和屬性.本文只比較樹(shù)的結(jié)構(gòu)相似性,所以省略元素和屬性的值.圖1中文檔的樹(shù)結(jié)構(gòu)如圖2所示.1.2模糊DTD及樹(shù)形表示模糊DTD作為模糊XML文檔的語(yǔ)法結(jié)構(gòu),描述了模糊XML文檔的結(jié)構(gòu)框架.與非模糊DTD不同的是,模糊DTD引入了模糊構(gòu)造子Dist,Val,Poss,Type.下面給出圖1中模糊XML文檔對(duì)應(yīng)的模糊DTD,如圖3所示.<collegeCName=“NEU”><ValPoss=0.8><departmentDName=“IST”><studentSID=“20130425”><age><DistType=“disjunctive”><ValPoss=0.8>26</Val><ValPoss=0.9>28</Val><ValPoss=0.8>29</Val></Dist></age><email><DistType=“conjunctive”><ValPoss=0.6>John@yahoo.com</Val><ValPoss=0.8>John@qq.com</Val><ValPoss=0.5>john@sina.com</Val></Dist></email></student></department></Val></college>圖1模糊XML文檔實(shí)例Fig.1SampleofafuzzyXMLdocument圖2模糊XML文檔樹(shù)實(shí)例Fig.2SampleofafuzzyXMLdocumenttree<!ELEMENTcollege(Val+)><!ATTLISTcollegeCNameIDREF#REQUIRED><!ELEMENTVal(department*)><!ATTLISTValPossCDATA“1.0”><!ELEMENTdepartment(student*)><!

實(shí)例圖,實(shí)例,析取,基數(shù)


與模糊XML文檔一樣,模糊DTD也可以用樹(shù)形結(jié)構(gòu)來(lái)表示.圖3中模糊DTD的樹(shù)結(jié)構(gòu)如圖4所示.圖4模糊DTD樹(shù)實(shí)例Fig.4SampleofafuzzyDTDtree2模糊DTD樹(shù)的轉(zhuǎn)換規(guī)則由于模糊DTD中包含基數(shù)約束和析取約束,所以無(wú)法將其直接與模糊XML文檔樹(shù)進(jìn)行相似性比較,需要對(duì)這些約束條件進(jìn)行轉(zhuǎn)換處理.2.1析取約束的轉(zhuǎn)換析取約束“|”,表示該符號(hào)前后元素或?qū)傩圆荒芡瑫r(shí)出現(xiàn),“|”即OR運(yùn)算符.如果模糊DTD中包含“|”運(yùn)算符,需要將其轉(zhuǎn)換為多個(gè)不包含“|”的DTD集合.例如:表達(dá)式<!ELEMENTa(b,(c|d))>可以分解為<!ELEMENTa(b,c))>和<!ELEMENTa(b,d)>兩個(gè)表達(dá)式,分別對(duì)應(yīng)兩個(gè)DTD.這一過(guò)程稱為析取分解過(guò)程.用規(guī)則1來(lái)表示.規(guī)則1:處理D中析取約束“|”,對(duì)“|”兩邊的元素或?qū)傩赃M(jìn)行選擇,形成多個(gè)不包含“|”符號(hào)表達(dá)式的d,從而構(gòu)成DTD集合Dset,d為Dset中的DTD.特殊地,對(duì)于模糊構(gòu)造子Val,若該Val的父節(jié)點(diǎn)Dist下Type值為disjunctive,,表示Dist下的Val子樹(shù)是不能同時(shí)出現(xiàn)的,相當(dāng)于析取約束,即需要根據(jù)Type下的值判斷Dist下的Val子樹(shù)的個(gè)數(shù).因?yàn)閂al下子樹(shù)表示的是屬性和它的值,一般地,各個(gè)子樹(shù)結(jié)構(gòu)是相同的.為了不增加將來(lái)相似性比較的復(fù)雜度,本文選擇只保留一個(gè)Val子樹(shù).2.2基數(shù)約束的轉(zhuǎn)換規(guī)則模糊DTD中元素和屬性的基數(shù)約束“*”,“+”,“?”是用來(lái)說(shuō)明所約束元素或?qū)傩缘目芍貜?fù)次數(shù).如果用e來(lái)表示元素或?qū)傩裕瑒te*表示e可以重復(fù)0到無(wú)限次,e+表示e可重復(fù)1次到無(wú)限次,e?表示e可重復(fù)0或1次.對(duì)于基數(shù)約束組合,可以用下面的原則來(lái)轉(zhuǎn)換,以達(dá)到簡(jiǎn)化的目的.e++→e+,e**→e*,e*+→e*,e*?→e*,e?+→e*,e??→e?.也就是說(shuō),所有的基數(shù)約束組合最終都可以轉(zhuǎn)化為e*,e+,e?.需要
【作者單位】: 東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院;渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61370075) 教育部新世紀(jì)優(yōu)秀人才支持計(jì)劃項(xiàng)目(NCET-05-0288)
【分類號(hào)】:TP311.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳曉鵬;XML讓辦公軟件更兼容[J];中國(guó)計(jì)算機(jī)用戶;2003年29期

2 張正強(qiáng);論XML置標(biāo)語(yǔ)言在電子文件管理中的功能與作用[J];檔案學(xué)通訊;2004年04期

3 張昌宏;王曄;丁晟春;;基于XML的企業(yè)應(yīng)用集成方法研究[J];艦船電子工程;2005年06期

4 李瑞敏;陸化普;史其信;;基于XML的交通綜合信息平臺(tái)研究[J];交通與計(jì)算機(jī);2006年03期

5 羅霜梅;姚躍華;;基于XML的分布式異構(gòu)數(shù)據(jù)庫(kù)“主存”實(shí)現(xiàn)[J];計(jì)算機(jī)與數(shù)字工程;2007年03期

6 王紅華;徐成杰;;基于XML技術(shù)的網(wǎng)絡(luò)實(shí)驗(yàn)教學(xué)系統(tǒng)[J];大慶師范學(xué)院學(xué)報(bào);2007年02期

7 孟偉東;;基于XML的企業(yè)管理信息系統(tǒng)[J];銅陵學(xué)院學(xué)報(bào);2011年02期

8 趙金鈴;譚獻(xiàn)海;王亞蘭;何磊;;基于XML的分布式異構(gòu)數(shù)據(jù)庫(kù)變化捕捉及動(dòng)態(tài)同步系統(tǒng)實(shí)現(xiàn)[J];鐵路計(jì)算機(jī)應(yīng)用;2013年10期

9 呂騰,閆萍,王真星;XML函數(shù)依賴及其與鍵的關(guān)系[J];小型微型計(jì)算機(jī)系統(tǒng);2005年09期

10 殷麗鳳;趙碩;;XML局部函數(shù)依賴[J];齊齊哈爾大學(xué)學(xué)報(bào);2005年04期

相關(guān)會(huì)議論文 前10條

1 孫韶杰;李國(guó)輝;趙薇;王偉;;基于XML和多媒體的交互式電子技術(shù)手冊(cè)的設(shè)計(jì)和實(shí)現(xiàn)[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年

2 劉德喜;萬(wàn)常選;劉喜平;焦賢沛;;XML檢索中的標(biāo)簽權(quán)重設(shè)置模型[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年

3 蘇召;劉國(guó)華;;XML弱函數(shù)依賴及其可加性問(wèn)題的研究[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)——通信與信息技術(shù)會(huì)議論文集(下)[C];2006年

4 唐敏;李昭原;;基于XML的Web數(shù)據(jù)庫(kù)工具的設(shè)計(jì)與實(shí)現(xiàn)[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

5 羅道峰;孟小峰;;一種面向XML文檔的基于角色的擴(kuò)展訪問(wèn)控制方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

6 周進(jìn)剛;趙大哲;紀(jì)勇;;一種XML規(guī)則語(yǔ)言及其實(shí)現(xiàn)[A];全國(guó)第19屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2008年

7 金峰;陶曉鵬;胡運(yùn)發(fā);;XML函數(shù)約束規(guī)則的自動(dòng)挖掘[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2003年

8 李東;張靜玲;王亮明;;一種XML集成索引結(jié)構(gòu)[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年

9 胡華全;吳玲達(dá);鄧?yán)颦?;基于XML的交互式動(dòng)畫劇本生成系統(tǒng)[A];第18屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2009)、第5屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2009)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2009)論文集[C];2009年

10 韓哲;王宏志;高宏;李建中;駱吉洲;;基于聚簇的XML文檔近似連接方法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

相關(guān)重要報(bào)紙文章 前3條

1 ;解密XML安全標(biāo)準(zhǔn)(上)[N];網(wǎng)絡(luò)世界;2007年

2 郝崢嶸;XML服務(wù)數(shù)據(jù)深度利用[N];中國(guó)計(jì)算機(jī)報(bào);2006年

3 李建華 周榮 李麗華;XML與數(shù)據(jù)庫(kù)[N];計(jì)算機(jī)世界;2003年

相關(guān)博士學(xué)位論文 前4條

1 簡(jiǎn)(王爭(zhēng))峰;基于XML的異構(gòu)產(chǎn)品信息網(wǎng)上交換、檢索技術(shù)研究與應(yīng)用[D];浙江大學(xué);2002年

2 樸勇;基于XML的文本結(jié)構(gòu)信息抽取與聚類研究[D];大連理工大學(xué);2014年

3 王桐;XML內(nèi)容路由關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2006年

4 向桂林;XML引擎研究[D];中國(guó)科學(xué)院研究生院(文獻(xiàn)情報(bào)中心);2004年

相關(guān)碩士學(xué)位論文 前10條

1 王海平;XML集成方法的研究[D];東北大學(xué);2013年

2 佟玲;基于XML的任務(wù)流編輯器的設(shè)計(jì)與實(shí)現(xiàn)[D];沈陽(yáng)師范大學(xué);2016年

3 郭玉珂;XML面向?qū)ο髷?shù)據(jù)模型研究及應(yīng)用[D];中南大學(xué);2005年

4 朱治國(guó);基于XML的異構(gòu)構(gòu)件庫(kù)群協(xié)同檢索中間層模型[D];哈爾濱工程大學(xué);2007年

5 邱朋;XML函數(shù)依賴的傳播與保持的研究[D];山東大學(xué);2008年

6 張憶;基于XML的頻繁模式發(fā)現(xiàn)研究[D];合肥工業(yè)大學(xué);2006年

7 蘇召;XML弱函數(shù)依賴與單依賴集合的研究[D];燕山大學(xué);2007年

8 呂慧;基于開(kāi)源平臺(tái)和XML技術(shù)的網(wǎng)絡(luò)考試系統(tǒng)的研究[D];西南交通大學(xué);2002年

9 楊悅欣;基于XML技術(shù)的設(shè)施農(nóng)業(yè)信息平臺(tái)的研究[D];陜西科技大學(xué);2006年

10 徐凱;基于XML用戶界面管理系統(tǒng)的研究及應(yīng)用[D];遼寧師范大學(xué);2008年



本文編號(hào):2526985

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2526985.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶18510***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com