基于等價多路徑的數據中心短流加速技術研究
發(fā)布時間:2017-04-24 16:01
本文關鍵詞:基于等價多路徑的數據中心短流加速技術研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,隨著云計算的發(fā)展,大量交互式應用,如零售推薦、網頁搜索和社交網絡等,部署于數據中心。這些應用對時延有極高的要求,時延的增加對用戶體驗和服務提供商的收益產生重大影響。在數據中心,這些交互式應用大多采用劃分/聚集(Partition/Aggregate)的工作模式,聚集服務器把用戶的請求分割成小任務,并通過短TCP連接(短流)交由計算節(jié)點完成,然后從這些節(jié)點收集結果并組合成最后的內容返回給用戶。交互式的短流的完成時間大大影響了用戶體驗。然而,數據中心網絡中存在一些為了完成數據備份、數據挖掘等任務的吞吐量巨大的TCP流,這些大流的發(fā)送窗口巨大,能夠迅速改變交換機隊列的大小。正是因為這些流的存在,數據中心網絡中的排隊時延波動巨大,導致短流的完成時間甚至超過理想值十倍以上。為了降低數據中心中的短流完成時間,學術界提出很多方案。這些方案中有的使用交換機的顯式擁塞通知機制(ECN, Explicit Congestion Notification)通知主機端網絡的擁塞程度,然后調整報文的發(fā)送速率,降低隊列長度;有的通過模擬傳統的集中式資源調度算法,為短流賦予更高的調度優(yōu)先級;有的把流在多條等價路徑之間進行負載均衡;還有的使用冗余技術針對一個任務使用兩條流獨立分別完成,取最快的流的結果。作為一種典型的基于冗余的短流加速技術,RepFlow對于原本由一條短流傳輸的數據,使用兩條短流同時獨立傳輸,當其中任一條短流的完成數據傳輸時,接收端即成功接收所有數據。由于數據中心中存在多條等價路徑,當兩條短流通過不同的路徑到達接收端時,數據傳輸被鏈路擁塞阻礙的可能性大大降低,傳輸效率增加,F有的短流加速方案取得了不錯的效果,但是大部分方案需要修改交換機或者主機TCP協議棧,這使得它們很難在數據中心中部署。盡管RepFlow能夠實現于應用層,但是它存在兩個不足:一是當今數據中心使用的等價多路徑協議有可能把兩條短流路由到同一條路徑(路徑哈希沖突),導致RepFlow的短流加速效果降低;二是RepFlow在所有的流量分布和網絡負載下都為短流創(chuàng)建一條復制流,在網絡負載較高和短流流量很大時,產生巨大的帶寬開銷。為了解決這些問題,我們嘗試利用數據中心中存在的多條等價路徑,提出容易部署的短流加速機制?偟膩碚f,我們的工作可以分為下面兩部分:·提出了一種基于冗余的新型數據中心短流加速機制SmartRep。在設計SmartRep的過程中,我們完成了三方面工作:-首先,我們深入研究了現有的基于冗余技術的短流加速方案的不足。針對哈希路徑沖突對短流加速效果的負面影響,以及冗余流流量對冗余技術的帶寬開銷的影響,我們給出了詳細的理論分析。-其次,我們設計了路徑哈希沖突避免機制HCA。HCA根據數據中心中的等價多路徑協議的原理,利用類似于traceroute的方法,提前發(fā)送具有指定TCP/IP五元組的報文探測該五元組對應的路徑。利用這種方法探知指定五元組對應的路徑之后,通過嘗試不同的源端口號,為冗余流選擇合適的源端口,使得它們通過不同的路徑,避免路徑沖突,降低短流完成時間。-最后,我們設計了冗余流數量分配機制RepNumAssigno RepNumAssign是一個能夠感知數據中心網絡負載和流量分布的冗余流數量分配算法,它根據網絡的流量分布和當前負載,調整冗余流的總流量、限制帶寬開銷以避免產生負面影響,在總流量被限制下,給對流完成時間貢獻大的短流分配更多的冗余流流量,以最小化流的完成時間。SmartRep的實現不需要交換機和主機端的修改,能夠最大限度地簡化部署。大量的NS2仿真實驗表明,SmartRep能夠在產生很低的帶寬開銷的前提下有效降低短流的平均和尾完成時間,并且能夠和DCTCP協同工作!榱诉M一步降低現有短流加速方案的帶寬開銷和部署難度,提出了基于路徑時延探測的短流加速方案PDP。該方案首先設計了基于等價多路徑協議的主機端路徑控制機制,它采用HCA的思想,通過修改TCP流的源端口改變其路徑。該機制的實現對TCP層完全透明,不需要修改主機端協議棧;然后,提出了主動路徑時延探測機制,也就是在TCP的握手階段在所有的等價路徑上請求建立TCP連接,但是只在最先收到回復的路徑上建立連接;最后,在流的生存期內,實施被動的路徑時延探測,也就是隨機重路由:一條流的報文不能在預設的時限內被確認,更換其路徑。這些機制在所有流的前100Kb流量內實施,不需要應用程序提供流的大小信息。同時,PDP的實現也不需要修改交換機、主機協議棧,所以它更加容易部署。大量的NS2仿真實驗表明,相比于現有的基于冗余技術的短流加速方案,PDP的短流加速效果接近甚至更好,并且?guī)掗_銷更低。
【關鍵詞】:數據中心網絡 流完成時間 復制技術 路徑時延探測
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP308
【目錄】:
- 摘要4-7
- Abstract7-14
- 第一章 緒論14-18
- 1.1 研究背景14-15
- 1.2 問題分析15-16
- 1.3 本文主要的工作16-17
- 1.4 本文的組織結構17-18
- 第二章 相關工作18-24
- 2.1 數據中心網絡18-20
- 2.1.1 數據中心網絡拓撲18-19
- 2.1.2 等價多路徑協議19-20
- 2.1.3 路徑控制20
- 2.2 數據中心流加速方案20-24
- 2.2.1 速率控制20-21
- 2.2.2 流調度21
- 2.2.3 負載均衡21-22
- 2.2.4 冗余技術22-23
- 2.2.5 綜合方案23-24
- 第三章 基于冗余的數據中心短流加速機制24-49
- 3.1 背景24-25
- 3.2 動機25-29
- 3.2.1 流的路徑沖突對時延造成的影響25-28
- 3.2.2 創(chuàng)建多條復制流的利與弊28-29
- 3.3 系統設計概覽29-32
- 3.4 冗余流路徑沖突避免機制HCA32-36
- 3.4.1 算法設計32-34
- 3.4.2 路徑沖突避免機制的開銷34-36
- 3.5 冗余流數量分配機制RepNumAssign36-41
- 3.5.1 冗余流對大流的影響36-37
- 3.5.2 復制流技術的適用范圍37-38
- 3.5.3 冗余流數量分配算法38-40
- 3.5.4 冗余流數量分配機制的調用時機40-41
- 3.6 仿真實驗41-49
- 3.6.1 實驗設置41-42
- 3.6.2 實驗結果42-49
- 第四章 基于路徑時延探測的短流加速機制49-59
- 4.1 動機49-51
- 4.2 基于路徑時延探測的短流加速機制51-55
- 4.2.1 機端路徑控制51-52
- 4.2.2 路徑時延探測52-53
- 4.2.3 短流加速原理53
- 4.2.4 實現細節(jié)與開銷53-55
- 4.3 仿真實驗55-59
- 4.3.1 實驗設置55
- 4.3.2 實驗結果55-59
- 第五章 總結與展望59-61
- 5.1 本文總結59-60
- 5.2 前景展望60-61
- 參考文獻61-67
- 簡歷與科研成果67-68
- 致謝68-69
【相似文獻】
中國期刊全文數據庫 前10條
1 江南;數據中心如何應付管理挑戰(zhàn)[J];互聯網周刊;2001年40期
2 ;簡化管理挑戰(zhàn)——惠普推實用數據中心解決方案[J];每周電腦報;2001年67期
3 李慶莉;去數據中心看一看——中國銀行華北信息中心計劃處處長云恩善談數據中心運行、管理[J];中國金融電腦;2002年12期
4 馬天蔚;;數據中心按需造[J];每周電腦報;2002年25期
5 戚麗,蔣東興,武海平,馮珂;校園數據中心建設與管理方法的探索[J];教育信息化;2002年S1期
6 何俊山;您企業(yè)的數據中心2003了嗎?[J];微電腦世界;2003年17期
7 ;挖潛數據中心[J];金融電子化;2004年07期
8 王琨月;;數據中心業(yè)務就緒[J];每周電腦報;2004年21期
9 包東智;新熱點:創(chuàng)建下一代數據中心[J];上海信息化;2005年10期
10 ;把握數據中心建設五大看點[J];中國計算機用戶;2005年10期
中國重要會議論文全文數據庫 前10條
1 姚
本文編號:324491
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/324491.html