【摘要】:地球系統(tǒng)科學(xué)是典型的數(shù)據(jù)密集型學(xué)科,主要研究地球各圈層和子系統(tǒng)間相互作用中的規(guī)律和機(jī)理,學(xué)科相關(guān)研究需要使用交叉學(xué)科、跨區(qū)域、多尺度的綜合數(shù)據(jù),在地球系統(tǒng)科學(xué)領(lǐng)域開展數(shù)據(jù)共享可以對(duì)數(shù)據(jù)進(jìn)行有效挖掘利用,促進(jìn)學(xué)術(shù)交流與合作。隨著地學(xué)大數(shù)據(jù)時(shí)代和新地理信息時(shí)代的來臨,信息獲取技術(shù)的發(fā)展使得學(xué)科相關(guān)的研究數(shù)據(jù)呈現(xiàn)出爆炸性增長的趨勢(shì),同時(shí)互聯(lián)網(wǎng)技術(shù)的發(fā)展使得越來越多的互聯(lián)網(wǎng)用戶能夠參與到地球系統(tǒng)科學(xué)數(shù)據(jù)共享等地學(xué)相關(guān)的網(wǎng)絡(luò)空間信息服務(wù)中。數(shù)據(jù)量的增加和用戶群體的擴(kuò)大,導(dǎo)致了地球系統(tǒng)科學(xué)共享過程中過量的數(shù)據(jù)量超出了用戶可以接受的程度,用戶難以在海量數(shù)據(jù)中尋找自己所需要的信息與數(shù)據(jù),出現(xiàn)“數(shù)據(jù)過載”問題。因此在地球系統(tǒng)科學(xué)數(shù)據(jù)共享過程中,研究如何準(zhǔn)確高效地獲取數(shù)據(jù),并設(shè)計(jì)數(shù)據(jù)推薦方法,無論是對(duì)于專業(yè)研究人員還是普通大眾都具有重要意義。針對(duì)地球系統(tǒng)科學(xué)數(shù)據(jù)進(jìn)行推薦方法的設(shè)計(jì),需要解決以下關(guān)鍵問題:首先,地球系統(tǒng)科學(xué)數(shù)據(jù)具有數(shù)據(jù)量大、結(jié)構(gòu)異構(gòu)、信息多元復(fù)雜的特點(diǎn),使用傳統(tǒng)的推薦方式進(jìn)行數(shù)據(jù)推薦時(shí)需要對(duì)待推薦對(duì)象的特征進(jìn)行統(tǒng)一描述,使用在結(jié)構(gòu)上同構(gòu)的方式對(duì)地球系統(tǒng)科學(xué)數(shù)據(jù)進(jìn)行描述時(shí)存在困難。其次,地球系統(tǒng)科學(xué)數(shù)據(jù)間關(guān)系復(fù)雜,用戶的需求多樣,基于數(shù)據(jù)屬性或用戶行為的單一推薦方法難以滿足用戶對(duì)數(shù)據(jù)的具體需求,需要從多角度設(shè)計(jì)推薦方法。最后,地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)用戶數(shù)量多,包含的數(shù)據(jù)量龐大,用戶反饋信息絕大多數(shù)為隱性反饋,不包含用戶對(duì)數(shù)據(jù)的具體態(tài)度,基于這些反饋信息建立的用戶-數(shù)據(jù)關(guān)系表中呈現(xiàn)出高維、稀疏、異構(gòu)且包含冗余信息和噪聲的特點(diǎn),需要結(jié)合學(xué)科特點(diǎn)研究如何利用這些用戶反饋信息開展數(shù)據(jù)推薦研究;谏鲜鰡栴},本文從數(shù)據(jù)特征和用戶需求兩個(gè)方面著手,在地球系統(tǒng)科學(xué)數(shù)據(jù)共享過程中開展推數(shù)據(jù)薦研究,取得了如下主要成果:1.面向數(shù)據(jù)推薦對(duì)地球系統(tǒng)科學(xué)數(shù)據(jù)的特征進(jìn)行描述。地球系統(tǒng)科學(xué)數(shù)據(jù)海量、異構(gòu)、繁雜,不適合使用單一同構(gòu)的方式進(jìn)行特征描述。本文通過分析地球系統(tǒng)科學(xué)數(shù)據(jù)的特點(diǎn)以及用戶在研究過程中對(duì)數(shù)據(jù)的具體需求,基于元數(shù)據(jù)標(biāo)準(zhǔn)從共享數(shù)據(jù)的元數(shù)據(jù)中提取了描述數(shù)據(jù)特征的關(guān)鍵信息,并進(jìn)行層次化表達(dá),從數(shù)據(jù)本身角度描述地球系統(tǒng)科學(xué)數(shù)據(jù)特征,為基于內(nèi)容的推薦方法的設(shè)計(jì)提供必要支撐。2.使用用戶的隱性反饋對(duì)數(shù)據(jù)進(jìn)行聚類。在用戶歷史行為數(shù)據(jù)的基礎(chǔ)上,引入復(fù)雜網(wǎng)絡(luò)概念分析數(shù)據(jù)共享網(wǎng)絡(luò)的特點(diǎn),設(shè)計(jì)使用隱性反饋信息得出數(shù)據(jù)間的相似性的方法,并在此基礎(chǔ)上對(duì)研究數(shù)據(jù)按照研究專題進(jìn)行聚類,從用戶的角度描述地球系統(tǒng)科學(xué)數(shù)據(jù)特征,為基于研究專題的推薦方法設(shè)計(jì)提供數(shù)據(jù)基礎(chǔ)。3.使用數(shù)據(jù)本身的特征和用戶反饋中歸納的研究專題共同進(jìn)行推薦。通過對(duì)比地球系統(tǒng)科學(xué)數(shù)據(jù)推薦與電子商務(wù)領(lǐng)域推薦的異同點(diǎn),在基于數(shù)據(jù)內(nèi)容進(jìn)行特征提取和基于用戶反饋信息進(jìn)行研究專題聚類的基礎(chǔ)上,設(shè)計(jì)基于數(shù)據(jù)特征以及基于研究專題的推薦方法,并比較兩種方法的性能,實(shí)現(xiàn)兩種方法的結(jié)合;谏鲜鲅芯砍晒,選擇國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)——長三角科學(xué)數(shù)據(jù)中心的數(shù)據(jù)為研究對(duì)象,提出推薦結(jié)果檢驗(yàn)標(biāo)準(zhǔn),開展數(shù)據(jù)推薦試驗(yàn)。試驗(yàn)結(jié)果證明了地球系統(tǒng)科學(xué)數(shù)據(jù)個(gè)性化推薦系統(tǒng)的可行性,證明本文提出的地球系統(tǒng)科學(xué)數(shù)據(jù)個(gè)性化推薦算法能夠較為有效地在地球系統(tǒng)科學(xué)數(shù)據(jù)共享過程中根據(jù)用戶的偏好進(jìn)行數(shù)據(jù)推薦,在一定程度上緩解地球系統(tǒng)科學(xué)數(shù)據(jù)共享中存在的“數(shù)據(jù)過載”問題,并為其他相關(guān)研究提供借鑒。
【學(xué)位授予單位】:南京師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:P208
【圖文】:
圖2-2地理信息元數(shù)據(jù)專用標(biāo)準(zhǔn)構(gòu)成[39]逡逑

圖24地球系統(tǒng)科學(xué)數(shù)據(jù)共享元數(shù)據(jù)內(nèi)容信息模塊逡逑數(shù)據(jù)從屬學(xué)科和主題分類,記錄在元數(shù)據(jù)內(nèi)容信息模塊中的數(shù)據(jù)集分類學(xué)科按照《中華人民共和國學(xué)科分類與代碼國家標(biāo)準(zhǔn)》(GB/T邋13745-199

?邋Tt邋TemperalExtensionType邋?;逡逑0二邋QD逡逑圖24地球系統(tǒng)科學(xué)數(shù)據(jù)共享元數(shù)據(jù)內(nèi)容信息模塊逡逑數(shù)據(jù)從屬學(xué)科和主題分類,記錄在元數(shù)據(jù)內(nèi)容信息模塊中的數(shù)據(jù)集分類信息逡逑內(nèi),學(xué)科按照《中華人民共和國學(xué)科分類與代碼國家標(biāo)準(zhǔn)》(GB/T邋13745-1992)逡逑劃分,使用58個(gè)一級(jí)學(xué)科中的地球科學(xué)、生物學(xué)、農(nóng)學(xué)、林學(xué)、畜牧學(xué)、測繪逡逑科學(xué)技術(shù)、水利工程、環(huán)境科學(xué)技術(shù)、社會(huì)學(xué)等九個(gè)一級(jí)學(xué)科中的33個(gè)二級(jí)學(xué)逡逑科,構(gòu)成了地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)的學(xué)科分類。數(shù)據(jù)主題分類標(biāo)準(zhǔn)按照逡逑GCMD標(biāo)準(zhǔn)中的科學(xué)關(guān)鍵詞層次體系修改改編而來,分為大氣圈、陸地表層、逡逑自然環(huán)境、日地空間環(huán)境與天文、陸地水圈、海洋、古環(huán)境、極地、冰凍圈、固逡逑體地球和基礎(chǔ)數(shù)據(jù)(遙感數(shù)據(jù)與遙感產(chǎn)品,專題地圖,野外臺(tái)站觀測數(shù)據(jù))II逡逑個(gè)類別。數(shù)據(jù)主題分類模式的主要建立目的是實(shí)現(xiàn)數(shù)據(jù)快速檢索,通過規(guī)范的主逡逑題分類詞表
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 侯志偉;諸云強(qiáng);高星;潘鵬;羅侃;王東旭;;時(shí)間本體及其在地學(xué)數(shù)據(jù)檢索中的應(yīng)用[J];地球信息科學(xué)學(xué)報(bào);2015年04期
2 諸云強(qiáng);孫九林;王卷樂;楊雅萍;;論地球數(shù)據(jù)科學(xué)與共享[J];國土資源信息化;2015年01期
3 周敏;汪新慶;;基于非規(guī)范化和數(shù)據(jù)字典的地學(xué)元數(shù)據(jù)管理[J];計(jì)算機(jī)技術(shù)與發(fā)展;2015年03期
4 程學(xué)旗;靳小龍;王元卓;郭嘉豐;張鐵贏;李國杰;;大數(shù)據(jù)系統(tǒng)和分析技術(shù)綜述[J];軟件學(xué)報(bào);2014年09期
5 郭華東;王力哲;陳方;梁棟;;科學(xué)大數(shù)據(jù)與數(shù)字地球[J];科學(xué)通報(bào);2014年12期
6 何清;李寧;羅文娟;史忠植;;大數(shù)據(jù)下的機(jī)器學(xué)習(xí)算法綜述[J];模式識(shí)別與人工智能;2014年04期
7 孟祥武;王凡;史艷翠;張玉潔;;移動(dòng)用戶需求獲取技術(shù)及其應(yīng)用[J];軟件學(xué)報(bào);2014年03期
8 游毅;成全;;基于關(guān)聯(lián)數(shù)據(jù)的科研數(shù)據(jù)資源共享[J];情報(bào)雜志;2012年10期
9 苗立志;李振龍;李晶;楊超偉;;基于OPeNDAP的地球科學(xué)數(shù)據(jù)共享原型系統(tǒng)與應(yīng)用[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年01期
10 韓冰;路來君;;地學(xué)G~4I系統(tǒng)中空間元數(shù)據(jù)的設(shè)計(jì)技術(shù)[J];世界地質(zhì);2011年02期
相關(guān)博士學(xué)位論文 前1條
1 陳苗;海量地學(xué)數(shù)據(jù)查詢優(yōu)化關(guān)鍵技術(shù)的研究[D];吉林大學(xué);2008年
相關(guān)碩士學(xué)位論文 前1條
1 邴欣;機(jī)器學(xué)習(xí)在推薦系統(tǒng)中的應(yīng)用[D];山東大學(xué);2016年
本文編號(hào):
2791202
本文鏈接:http://www.sikaile.net/kejilunwen/dizhicehuilunwen/2791202.html