數(shù)據(jù)中心要做備份系統(tǒng)是老生常談了,重要性不言而喻。數(shù)據(jù)中心是由成千上萬臺電子設備組成的,這些設備難免運行中出現(xiàn)這樣那樣的問題,系統(tǒng)具備冗余備份非常重要。比如一個擁有上萬臺服務器的數(shù)據(jù),幾乎每天可能都有服務器損壞,要保證系統(tǒng)的運行不受影響,必須做備份,當一臺服務器故障時,其它服務器可以自動接管,業(yè)務不受任何影響。
不過,要將數(shù)據(jù)中心從頭到腳整個系統(tǒng)都做好備份談何容易,不僅僅是要投入大量資金,還要投入人力去維護,耗費的精力往往讓絕大部分的數(shù)據(jù)中心望而卻步,所以數(shù)據(jù)中心往往在部分設備、部分系統(tǒng)上實現(xiàn)了冗余備份,故障時業(yè)務能平滑切換。
就在上個月底,阿里云發(fā)生了一次較大規(guī)模、較長時間的故障,很快在網(wǎng)上引發(fā)了熱議,很多的云用戶業(yè)務全部中斷一小時,帶來了很大損失。且不論原因如何,至少阿里云業(yè)務自身并未做好備份。當發(fā)現(xiàn)故障后,并沒有及時將業(yè)務切換到備份系統(tǒng)中,或者備份系統(tǒng)就是缺失的?,F(xiàn)在的云全天候都有業(yè)務,時刻不能停歇,這給數(shù)據(jù)中心提出了極大挑戰(zhàn),讓成千上萬臺設備上跑的業(yè)務一直正常,異常的時候還可以自動自愈,這需要大量的技術來保障,如果系統(tǒng)設計的不夠好,往往就會出問題。
要保證數(shù)據(jù)中心業(yè)務不中斷,只有采用冗余備份技術一條路可走,并將備份技術滲透到數(shù)據(jù)中心的每個環(huán)節(jié)才行,確保任何一個環(huán)節(jié)故障,系統(tǒng)業(yè)務都能正常運轉。這就好比一架飛機,飛機的發(fā)動機、機翼、通風系統(tǒng)等等都有備份,以便在發(fā)生故障時,飛機使用備用系統(tǒng),也能夠保持繼續(xù)正常飛行,這樣的設計使得飛機成為世界上最安全的設備,是冗余備份做的最好的系統(tǒng)。與飛機相比,數(shù)據(jù)中心的復雜性更高,零部件和設備數(shù)量更多,要做好整個系統(tǒng)的冗余備份就更加困難。
做數(shù)據(jù)中心備份對資金的需求量很大,最簡單的冗余備份就是再建一個災備數(shù)據(jù)中心或者重要設備都有冗余備份,顯然這樣會使得數(shù)據(jù)中心的支出大幅增加,原來需要10個億,考慮到各個環(huán)節(jié)甚至整個數(shù)據(jù)中心做備份,就需要20個億甚至更多,但這樣的投入并不能將收入提升一倍,這也是很多數(shù)據(jù)中心投入過多的原因。
災備數(shù)據(jù)中心往往都是一些金融銀行這些完全不差錢的金主才會去建設,災備數(shù)據(jù)中心可以在一個數(shù)據(jù)中心發(fā)生故障時,將業(yè)務整體切換到災備數(shù)據(jù)中心,平時災備數(shù)據(jù)中心完全是陪太子讀書,不去承載任何業(yè)務,但還是要正常維護。所以,這樣建設和后期運維投入資金都是蠻大的。如果做不到數(shù)據(jù)中心的備份,那就對核心設備和業(yè)務做備份,當核心設備故障時,可以直接將業(yè)務切換到備份設備來繼續(xù)運行,保證數(shù)據(jù)中心業(yè)務不受影響。這就要根據(jù)數(shù)據(jù)中心的資金情況,有選擇地去選擇冗余備份的設備和系統(tǒng),盡可能用最少的錢做更加完備的冗余。
除了資金,引入冗余備份的技術亦十分重要。當主用設備或系統(tǒng)故障時,能否感知到并平滑切換到備用系統(tǒng),這也是需要很多技術保證的,否則備份設備和系統(tǒng)依然形同虛設。如果不能自動檢測和切換,采用手工切換也是一種辦法,總之要保證主用系統(tǒng)出故障時,業(yè)務能平滑切換到備份系統(tǒng)上,這樣的冗余備份才是有效的。
還有除了設備備份,從技術角度出發(fā),也可以達到冗余備份的效果,比如網(wǎng)絡層面部署等價路由,服務器部署集群和虛擬機,當路由出問題時,流量可以切換到其它網(wǎng)絡鏈路上,當虛擬機出問題時,可以自動遷移到正常的服務器上運行,通過引入備份技術來減少設備資金上的投入。不過,也要注意,不要引入過多的冗余技術,這樣會使得整個系統(tǒng)運行低效,而且設計過于復雜后,非常不便于運維,出了問題排查起來非常困難,一旦主用系統(tǒng)故障后無法切換到備用系統(tǒng),排查和恢復業(yè)務可能會無從下手,反而造成業(yè)務更長時間的中斷,如此得不償失。
所以,部署一些冗余備份技術是必要的,但不要過于復雜,不需要那些看著高大上的技術,要簡單有效,主備自動切換自如?,F(xiàn)在的數(shù)據(jù)中心,云計算、軟件定義等新技術盛行,這極大地增加了系統(tǒng)復雜度,若引入過多備份技術,系統(tǒng)復雜度將呈幾何指數(shù)型增加,反倒不利于數(shù)據(jù)中心業(yè)務穩(wěn)定。
當然并不能因為困難,就不做備份。現(xiàn)在的數(shù)據(jù)中心,如果不做任何的業(yè)務備份,是無法承載任何重要業(yè)務的,尤其是互聯(lián)網(wǎng)業(yè)務,已經(jīng)不由地我們?nèi)ゾ芙^,如果數(shù)據(jù)中心反復頻繁出現(xiàn)業(yè)務中斷,給客戶的業(yè)務帶來損失,在如今信息傳遞高度發(fā)達的今天,負面影響會迅速擴散,很快會讓數(shù)據(jù)中心流失大量客戶,最終無法繼續(xù)運營下去。現(xiàn)在的數(shù)據(jù)中心,需要全天候24小時都在運轉,一刻也不能停歇,不允許有半點中斷。比如像阿里云、騰訊云都要和客戶簽訂協(xié)議,一旦由于故障引發(fā)的業(yè)務中斷,要做出相應賠償,若總是中斷,賠償都賠不起了。
我們一定要重視數(shù)據(jù)中心的業(yè)務冗余備份,從設備、網(wǎng)絡、業(yè)務、系統(tǒng)等方方面面都要考慮冗余,以便在遇到故障時,從容應對,在用戶無感知的情況下,處理掉故障。誰也無法預知未來在什么時刻會發(fā)生什么樣的故障,也許當我們建好備份數(shù)據(jù)中心后,主用數(shù)據(jù)中心一次也沒有出過大型故障,但也可能在我們沒有做備份數(shù)據(jù)中心時,數(shù)據(jù)中心發(fā)生了致命的無法修復故障,又有誰敢去賭呢?還是乖乖地將冗余備份系統(tǒng)做好吧,雖然要多花費些資金和人力,但值得。
有動力環(huán)境監(jiān)控系統(tǒng)項目,需要動環(huán)?找斯必得科技就對了,我們有案例,幫助您更加輕松運作項目。請致電:4006-020-248 或在線咨詢!我們免費為你提供動環(huán)監(jiān)控系統(tǒng)方案與產(chǎn)品報價。