![]() |
新聞中心
當前位置:網站首頁 > 新聞中心
用云存儲進行歸檔:改善數據保護能力
當歸檔工作意味著把磁帶上的數據轉移至遠程設施中供長期保存時,這項技術已與其早期形式之間產生了巨大的變化。如今的歸檔技術,既可以如同自動歸檔電子郵件信息一樣輕松,又可以如同在一個外場存儲站點中放置傳統(tǒng)物理存儲磁帶一樣負擔沉重。
其中,云歸檔是一個特別具有吸引力的選擇,因為這項技術提供了可訪問功能和數據保護功能,而其成本僅為構建一個現場歸檔基礎設施的一小部分。我們將討論評估基于云計算技術歸檔時需考慮的關鍵因素,其中包括:價格與性能、云計算歸檔的優(yōu)缺點、服務等級、可訪問性、災難恢復選項、合規(guī)性等等。
雖然“歸檔”一詞意味著數據將被存儲很長一段時間,但是其具體的時限卻是隨行業(yè)不同而各有差異。例如,大多數的財務數據要求的歸檔時間為七年,藥品研究數據則要求二十年,而那些醫(yī)療記錄和核記錄數據則必須保存長達五十年之久。一般來說,在磁盤上保存數據長達十年甚至更長時間的的成本是非常昂貴的。同樣,我們也很難預測哪一種歸檔技術將存在十年之久,因此,本文中用于云歸檔的“長時間”一詞是指一年至七年的時間。價格與性能
云歸檔恰恰實現了成本與可訪問性之間一個“恰到好處”的平衡。存儲磁帶一直以來都是,甚至仍將是長時間存儲數據方法中成本最低的一種。一個典型的LTO存儲磁帶存儲數據的成本約為35美元/TB每月。即使是最便宜的云計算存儲也無法在這個價格方面體現其競爭優(yōu)勢。而其不利的一面在于,存儲磁帶歸檔的正常檢索時間為次日交付加上安裝和恢復所需的時間。這就意味著用戶在能夠訪問所要求信息之前必須等待不少于一個工作日。
歸檔與備份
雖然眾多IT公司仍然考慮采用他們傳統(tǒng)的備份磁帶進行“歸檔”工作,但也有一些具有不同于歸檔、用于數據備份的特殊用例和訪問需求。執(zhí)行備份可保護目前正在被使用的數據;如果必須把數據從備份中恢復出來,那么該操作必然發(fā)生在完成備份工作之后不久。一般來說,備份數據的保存時間相對較短。
歸檔數據是一組出于合規(guī)性、公司管理或知識產權等目的而將被保存相對較長一段時間的數據集合。歸檔數據可被不定期訪問,但具有較高的易搜索性,因此可相對較快和較容易地恢復特定數據。
存儲網絡行業(yè)協會為云備份和云歸檔服務的區(qū)別給出了一個定義:“對于云計算備份來說,云計算是一種備份數據的簡單存儲,而對于云計算歸檔和存儲來說,云計算是執(zhí)行具體操作的所在,以便于確保數據的長期存儲、保存以及存在?!?
另一方面,云存儲的價格為10美分/GB美元及以上(根據容量不同而不同)。當涉及數以百計TB時其成本就相當可觀了,但是它往往仍然要比在一個中央數據中心中采購、部署和管理陣列低。而存儲磁帶的檢索時間要以工作日為單位,而訪問在基于云計算技術存儲中托管的數據,其單位則是以秒來計算的。對于某些應用程序,這可能是價格與性能之間最為理想的平衡點。
云歸檔的優(yōu)缺點
但是在真正實施云歸檔之前,IT人員需要權衡云歸檔和內部歸檔兩者各自的優(yōu)點。從技術角度講,云服務商無法實現那些在內部也無法部署的系統(tǒng)。例如,一家公司可能會選擇一個具有三層高容量SATA磁盤的層存儲基礎設施來實現一個更低的平均成本(每GB)。通常情況下,如果組織無法承受與遠程場所連接中斷的風險,那么他們往往會傾向于實施一個內部實現的解決方案,這個解決方案有監(jiān)管要求,要求具備嚴格的數據安全監(jiān)督或數據檢索需求,而其中是無法接受遠程延遲的。這是一個相當嚴格的列表,但是仍然還有眾多的應用程序適用基于云計算技術的歸檔。
即便IT組織可以把遷移至云計算的物流工作量進行量化,但是他們卻不應忽視這樣一個可預測而不可預見的調整:從以技術為中心的角度到一個服務等級管理角度的心態(tài)轉變。之前已習慣于進行技術決策和部署的IT人員們需要更深入地了解云計算供應商的架構和“建議”產品或特定技術的實施。當供應商完全承擔管理云計算基礎設施的全部責任時,很少有這樣保證的請求。如果合同中規(guī)定的服務等級已得到滿足,那么IT部門確實不應該關心底層技術。隨著經驗的進一步積累,工作人員的注意力應逐漸從底層細節(jié)轉移至高層次的管理。服務是關鍵要素
因此,服務水平管理是是否使用云歸檔還是原本也運營模式的關鍵要素。在從云歸檔供應商采購服務時,你需要考慮以下服務水平方面的問題:
在線時間。對于絕大多數應用,3個9或4個9的可用性就已足夠應對業(yè)務所需。假如你需要5個9的高可用性,這種數據訪問性的要求可能無法使用在歸檔層上。存儲在歸檔層上的數據通常會定義為非關鍵性的。關于在線時間的要求在很大程度上決定了供應商應當具備多少基礎架構,因此這會對托管的成本造成重大影響。毋庸置疑的是,需要明確數據存取的實際時間、訪問模式以及宕機所會造成的損失。這些計算結論可以和各種保障系統(tǒng)在線所需的成本進行比較,基于這種比較可以很容易地調整或拒絕是否采用云環(huán)境。供應商通常在無法滿足服務水平協議(SLA)時退回托管費用的部分款項或給予其它形式的補償。但是,相關附加說明常以小字形式顯示,所以請仔細找到并認真閱讀。
可訪問性。可訪問性和正常工作時間并不一定相同。存儲可能是忙碌的,但是子組件會導致一個應用程序無法使用。例如,如果你需要實現數據鏈接的冗余或多個冗余,那么你必須為它們支付額外費用,但是不這么做可能帶來的后果就是無法接受的應用程序中斷。請確定服務等級能夠確保數據的可用性。
性能。量化你的應用所需的IOPS并且將其納入到SLA之中。IOPS可以通過平均或者峰值活動狀態(tài)加以測算。假如你要求峰值時刻的IOPS保障,你可能要為此支付給供應商更多的費用。有些供應商可能會提供計量計費,但是很多企業(yè)組織并不希望采用這種方式,因為其中存在著潛在的不確定性。絕大多數企業(yè)可以接受一定數量上的約束操作(尤其是針對歸檔層的存儲)以獲取成本優(yōu)勢。在這種情況下,SLA只保證一定的IOPS而非最終用戶的性能體驗。假如應用要求超過了合約規(guī)定的IOPS量,這就絕對是企業(yè)IT部門的問題了;當然可以通過購買額外IOPS的方式來滿足。
數據恢復。正如他們?yōu)閮炔繎贸绦蛩龅哪菢?,IT組織需要為云計算歸檔指定恢復點對象(RPO)和恢復時間對象要求。這關系到正常運行時間,而且還覆蓋諸如數據損壞這樣的意外事故或不影響整體正常運行時間但有些個別應用程序的組件故障。供應商一般都有默認的RPO和RTO,對于歸檔層而來一般都是足夠的。此外,毋庸置疑的是,需要明確業(yè)務單元所能容忍的各類的數據丟失或應用故障。在很多時候,這會比你認為的要長。
災難恢復(DR)。如果云歸檔是用于離線復制存儲來滿足數據冗余的要求,你可以不考慮該層災難恢復的策略。不過用戶仍然需要注意:絕大多數的托管存儲并不包含任何災難恢復事故的防護。如果托管數據屬于混合云存儲中的活動數據,災難恢復規(guī)劃是完全必要的。托管服務供應商可能定期備份所有數據,不過他們通常不會循環(huán)備份離線站點中的數據,即便做的話也是以很少的頻率(比如每月一次)。雖然在數據中心中做到SAS-70合規(guī)中的災難恢復非常困難,但也絕非不可能的事。托管企業(yè)提供的災難恢復通常要顯著地增加額外的成本,并且會快速改變托管業(yè)務的經濟情況。請確保數據不會遺留在具有風險的地方。
備份和恢復。即便托管服務供應商定期備份數據并且頻繁地循環(huán)離線存儲數據,IT部門也并非完全沒有風險。托管企業(yè)通常只有有限的備份軟件和磁帶技術。這意味著其備份形式(硬件、軟件或者兩者兼?zhèn)洌┛赡芎湍愕腎T系統(tǒng)并不兼容。假設IT部門嘗試從供應商的磁帶中進行恢復,可能由于沒有足夠的基礎架構支持而造成嚴重的延誤。請考慮好在最壞的情況下的解決方案。
合規(guī)性。要求特殊合規(guī)性對待的歸檔數據可能仍然是云計算托管應用的一個理想對象。如果有必要的話,你將需要確定數據是否保存在永久存儲介質上。你可能還需要確保,遵循和審計嚴格的訪問指引;SAS-70 供應商就已具備了這樣的程序。
固定成本和可變成本。歸檔較之于使用自有的基礎架構,其核心收益之一就是你只需支付你使用的存儲。這一指標會受你使用的多少的影響,但其也有最小的固定成本。從磁帶轉向云歸檔
很顯然,對于擁有大量存儲在相對昂貴內部基礎設施中歷史數據的公司來說, 基于云計算技術的歸檔是具有相當吸引力的。更多的質疑在于,將基于存儲磁帶的歸檔轉變?yōu)樵朴嬎銡w檔是否真的有意義。大型企業(yè)可能通過數以百計的離線磁帶實現歸檔操作。將所有這些磁帶取出,讀取數據并遷移到云歸檔基礎架構的工作讓人望而卻步。這里還有一個前提,供應商需擁有必要的硬件以讀取所有的存儲磁帶,而其中部分的數據格式可能已經過時。此外,沒有哪家云供應商可以在托管這樣龐大的數據的同時,接受和大型磁帶庫相同的成本。磁盤壓縮和數據重復刪除技術可能會非常有用,不過成本上的差異仍然是一個問題。
即使從存儲磁帶歸檔到云計算歸檔的轉變難度極大,云歸檔仍不失為一種可以考慮的方式。超過7年以上的磁帶在保存上代價高昂,并且可能有各種問題。最佳實踐顯示,企業(yè)需要在每五年讀取并重新寫入磁帶,來確保格式準確以及數據可以被讀取,而這是一項不容小覷的任務。例如,如果一個公司擁有10,000個磁帶歸檔,更新周期為五年,那么它就必須每年更新2000個磁帶。也就是說,每個工作日更新近7個磁帶,這雖然可行,但這屬于年復一年而又不會帶來生產效益的工作。此外,問題的關鍵在于檢索的概率。一些企業(yè)考慮到恢復操作可能非常麻煩,允許磁帶被廢棄,但是需要修復的概率已低至可承受由其產生的風險本身。另一方面,如果你知道恢復是不可避免的,現在就可以考慮選擇時間,預留經費來從磁帶遷移到云端,這可以在以后節(jié)省下大量的時間和精力,甚至應對一些突發(fā)情況。
當然,并不是說存儲磁帶已在歸檔應用中失去其地位和意義,在絕大多數情況下,它依然是最低成本的解決方案。此外,LTO線性磁帶文件系統(tǒng)可使磁帶在四層存儲中承擔新的角色,在云(或者數據中心)中作為額外的一層提供給存儲的0、1、2、3層。在云歸檔環(huán)境中,這可以有效地生成混合云并為少量數據提供相對高速的訪問(分鐘級),但其成本卻和磁帶類似。磁帶也會有內置的壓縮技術,并支持加密和一次寫入多次讀出(WORM)。使用自動化的分層軟件,數據可以自動化地遷移至歸檔層。
考慮到不可避免的意外事件
到目前為止,我們已描繪了云計算歸檔服務的一個相當正面積極的輪廓。通常,只需努力就能夠實現預期的效果,但事實并不總是如此。組織應當考慮到,他們把數十TB的數據遷移至供應商所帶來的可能后果,因為有可能會發(fā)生不希望發(fā)生的事件或合同違約事件。 當然,賠償可能有所心理安慰,但是小額的經濟賠償完全不能彌補對企業(yè)組織的交付聲譽所帶來的實際成本、惡化或損害。一旦發(fā)生意外事故,如果無法滿足特定的性能等級,合同可能就會終止且無任何賠償。因此規(guī)劃中還應當包含備選的托管功能,無論是內部的備用系統(tǒng)或者另一家供應商。云歸檔并不屬于高風險的方案,不過聰明的企業(yè)凡事都會準備在前。
|