在線重復(fù)數(shù)據(jù)刪除技術(shù)的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-04-26 10:20
【摘要】:隨著信息化建設(shè)的不斷深入,企業(yè)數(shù)據(jù)信息量呈幾何級(jí)數(shù)增長(zhǎng)。信息量的不斷擴(kuò)張帶來(lái)以下兩個(gè)問(wèn)題:一是存在著大量的重復(fù)數(shù)據(jù),導(dǎo)致存儲(chǔ)空間的大量浪費(fèi),企業(yè)的存儲(chǔ)成本提高;二是高訪問(wèn)量使得磁盤存儲(chǔ)設(shè)備逐漸成為數(shù)據(jù)中心的訪問(wèn)性能瓶。針對(duì)上述問(wèn)題,通過(guò)對(duì)重復(fù)數(shù)據(jù)刪除技術(shù)的研究,以及對(duì)固態(tài)硬盤性能和特性的調(diào)研,提出了一種基于iSCSI平臺(tái)的分級(jí)存儲(chǔ)技術(shù)與重復(fù)數(shù)據(jù)刪除技術(shù)相結(jié)合的存儲(chǔ)系統(tǒng)。 首先,深入研究了重復(fù)數(shù)據(jù)刪除技術(shù),采用了基于散列的重復(fù)數(shù)據(jù)刪除方式,實(shí)現(xiàn)了以下基本功能:指紋計(jì)算、指紋檢索、指紋索引表管理;為了彌補(bǔ)重復(fù)數(shù)據(jù)刪除對(duì)系統(tǒng)帶來(lái)的性能損失,提出了“內(nèi)存—固態(tài)盤—磁盤”分級(jí)存儲(chǔ)系統(tǒng),用固態(tài)盤充當(dāng)二級(jí)緩存,利用其讀寫(xiě)性能好、容量大、非易失性等特點(diǎn),提高系統(tǒng)整體性能;通過(guò)虛擬空間映射功能,將服務(wù)器物理磁盤虛擬為一個(gè)較大的虛擬盤,然后按分區(qū)映射給多個(gè)客戶端,實(shí)現(xiàn)單服務(wù)器---多客戶端功能。 然后針對(duì)重復(fù)數(shù)據(jù)刪除功能中指紋檢索性能瓶頸,進(jìn)行了專門的算法優(yōu)化。首先提出了基于布隆過(guò)濾的檢索過(guò)濾算法,過(guò)濾掉大量不必要的指紋檢索請(qǐng)求;然后實(shí)現(xiàn)了指紋索引表“內(nèi)存—固態(tài)盤”分級(jí)存儲(chǔ)策略,充分利用固態(tài)盤較好的讀性能,避免索引表存儲(chǔ)到磁盤,產(chǎn)生磁盤訪問(wèn)性能瓶頸。 最后,對(duì)分級(jí)重復(fù)數(shù)據(jù)刪除系統(tǒng)進(jìn)行了相關(guān)測(cè)試。首先對(duì)系統(tǒng)進(jìn)行了性能對(duì)比測(cè)試,結(jié)果表明,重復(fù)數(shù)據(jù)刪除功能由于計(jì)算量較大,會(huì)帶來(lái)一定的性能損失,但與分級(jí)存儲(chǔ)技術(shù)相結(jié)合之后,整體性能反而有一定的提升;然后對(duì)重復(fù)數(shù)據(jù)刪除的壓縮比進(jìn)行了測(cè)試,結(jié)果表明,重復(fù)數(shù)據(jù)刪除技術(shù)對(duì)于信息重復(fù)度較高的應(yīng)用環(huán)境,如文檔應(yīng)用,具有較好的壓縮效果;最后對(duì)指紋檢索過(guò)濾算法進(jìn)行了測(cè)試,其過(guò)濾率和誤判率都達(dá)到了預(yù)期效果。
【圖文】:
紹了 iSCSI 存儲(chǔ)平臺(tái),然后介紹了基于 iSCSI 平臺(tái)撲結(jié)構(gòu),最后講述了系統(tǒng)中所用到的關(guān)鍵技術(shù),存儲(chǔ)技術(shù)。臺(tái)介紹nternet SCSI, 是一種應(yīng)用較為廣泛的存儲(chǔ)協(xié)議[11]。CSI)和 IP 網(wǎng)絡(luò)的特點(diǎn),使得存儲(chǔ)服務(wù)器可以通存儲(chǔ)設(shè)備相比,其性價(jià)比更高。SI 七層協(xié)議中屬于端到端的會(huì)話層協(xié)議,InitiatorSI 協(xié)議數(shù)據(jù)單元[11],經(jīng)由 TCP 層,IP 層,鏈路層arget 端。然后 Target 端再通過(guò)解包操作還原 SCS備。iSCSI 協(xié)議整合了 SCSI 和 TCP/IP 協(xié)議棧,實(shí)協(xié)議棧如圖 2.1 所示:
包裝和解析仍然由軟件來(lái)完。硬件方式是以 iSCSI HBA 卡的形式,HBA 卡實(shí)現(xiàn)了協(xié)議,不需要主機(jī)再來(lái)完成任何事情。三種方式可以看出,純軟件方式由于不需要任何專用硬會(huì)占用主機(jī)的 CPU 等資源,所以性能最差;半軟件方式占用主機(jī)網(wǎng)絡(luò)帶寬,性能稍好,但成本稍高;純硬件方成所有的 iSCSI 相關(guān)操作,性能最好,,但硬件成本最高用第一種以太網(wǎng)卡+軟件方式來(lái)實(shí)現(xiàn),成本最低,也最為用 Linux 操作系統(tǒng)平臺(tái),同時(shí)采用了開(kāi)源的 iSCSI Ente數(shù)據(jù)刪除的功能就在此開(kāi)源 iSCSI Target 軟件平臺(tái)上實(shí)現(xiàn)臺(tái),也可采用 Windows 平臺(tái),都有相應(yīng)的 iSCSI Initiato圖 2.2 所示:
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2011
【分類號(hào)】:TP333
本文編號(hào):2641395
【圖文】:
紹了 iSCSI 存儲(chǔ)平臺(tái),然后介紹了基于 iSCSI 平臺(tái)撲結(jié)構(gòu),最后講述了系統(tǒng)中所用到的關(guān)鍵技術(shù),存儲(chǔ)技術(shù)。臺(tái)介紹nternet SCSI, 是一種應(yīng)用較為廣泛的存儲(chǔ)協(xié)議[11]。CSI)和 IP 網(wǎng)絡(luò)的特點(diǎn),使得存儲(chǔ)服務(wù)器可以通存儲(chǔ)設(shè)備相比,其性價(jià)比更高。SI 七層協(xié)議中屬于端到端的會(huì)話層協(xié)議,InitiatorSI 協(xié)議數(shù)據(jù)單元[11],經(jīng)由 TCP 層,IP 層,鏈路層arget 端。然后 Target 端再通過(guò)解包操作還原 SCS備。iSCSI 協(xié)議整合了 SCSI 和 TCP/IP 協(xié)議棧,實(shí)協(xié)議棧如圖 2.1 所示:
包裝和解析仍然由軟件來(lái)完。硬件方式是以 iSCSI HBA 卡的形式,HBA 卡實(shí)現(xiàn)了協(xié)議,不需要主機(jī)再來(lái)完成任何事情。三種方式可以看出,純軟件方式由于不需要任何專用硬會(huì)占用主機(jī)的 CPU 等資源,所以性能最差;半軟件方式占用主機(jī)網(wǎng)絡(luò)帶寬,性能稍好,但成本稍高;純硬件方成所有的 iSCSI 相關(guān)操作,性能最好,,但硬件成本最高用第一種以太網(wǎng)卡+軟件方式來(lái)實(shí)現(xiàn),成本最低,也最為用 Linux 操作系統(tǒng)平臺(tái),同時(shí)采用了開(kāi)源的 iSCSI Ente數(shù)據(jù)刪除的功能就在此開(kāi)源 iSCSI Target 軟件平臺(tái)上實(shí)現(xiàn)臺(tái),也可采用 Windows 平臺(tái),都有相應(yīng)的 iSCSI Initiato圖 2.2 所示:
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2011
【分類號(hào)】:TP333
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 韓茜,羅豐,吳順君;高速大容量固態(tài)存儲(chǔ)系統(tǒng)的設(shè)計(jì)[J];雷達(dá)科學(xué)與技術(shù);2005年02期
本文編號(hào):2641395
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2641395.html
最近更新
教材專著