冷儲存是什麼?與冷備份一樣嗎?一篇了解何為冷儲存
“如何妥善管理數位資料成為現代企業的一大挑戰。良好的資料管理,可協助企業更有效作出恰當的營運決策、落實法規遵循、改善作業流程、降低資安風險及提升企業形象和品牌信任度。
而管理巨量資料首要之務便是將企業存有的數據分門別類整理,依照存取頻率區分為冷資料(Cold Data)、暖資料(Warm Data)和熱資料(Hot Data),再以適當的方式分別儲存。冷儲存(Cold Storage)即是為因應冷資料保存而誕生的儲存解決方案。遠傳將在本文介紹冷儲存的優勢與實際應用範例,以及其雲端解決方案。
”
伴隨企業的商業成長,內部累積資料量也是持續累績,如何妥善管理數位資料成為現代企業的一大挑戰。良好的資料管理,可協助企業更有效作出恰當的營運決策、落實法規遵循、改善作業流程、降低資安風險及提升企業形象和品牌信任度。
而管理巨量資料首要之務便是將企業存有的數據分門別類整理,依照存取頻率區分為冷資料(Cold Data)、暖資料(Warm Data)和熱資料(Hot Data),再以適當的方式分別儲存。冷儲存(Cold Storage)即是為因應冷資料保存而誕生的儲存解決方案。遠傳將在本文介紹冷儲存的優勢與實際應用範例,以及其雲端解決方案。
精選內容
如何定義冷儲存?
冷儲存,也稱作冷資料儲存(Cold Data Storage),為極少存取、使用、分享的冷資料提供高效經濟的保存方式。由於儲存的資料訪問頻率極低,冷儲存毋須備有即時存取或其他較複雜功能,因此存取資料相較困難費時,但成本也就相對較低,適用於長期保存備份和歸檔資料。
冷資料與企業當前業務無直接關係,但因法規要求、合規性、長期策略價值等因素而需長期保留。冷資料的具體定義因企業營運而異,有些企業認為未使用超過 90 天的資料即為冷資料,而有些則定義為未訪問超過 180 天的資料。冷資料可以是多種形式,包括結構化(有標準格式的數據)、半結構化和非結構化資料(如文字、圖片、影片檔案等等)。
冷儲存、暖儲存、熱儲存的3者介紹
|
冷儲存 |
暖儲存 |
熱儲存 |
適合資料種類 |
極少訪問的冷資料 |
訪問頻率中等的暖資料 |
經常需要訪問的熱資料 |
存取速度 |
最慢 |
中等 |
最快 |
需求功能 |
基本功能 |
介於中間 |
複雜功能 |
資料儲存成本 |
最低 |
中等 |
最高 |
實例 |
● 外接硬碟 ● 磁帶硬碟機 ● AWS S3 Glacier ● Azure Storage Cold Tier ● GCP Coldline |
● 外接硬碟 ● Amazon S3 Standard-Infrequent Access ● Azure Storage Cool Tier ● GCP Nearline |
● 本機硬碟 ● Microsoft OneDrive ● Google Drive |
除了冷儲存以外,另有熱儲存(Hot Storage)和暖儲存(Warm Storage)。熱儲存和冷儲存恰恰相反,是用來保存需要經常存取的資料,因此儲存系統需要可以即時存取,並提供低延遲和擴充性高的服務,熱儲存成本也就相對高昂。而暖儲存無論是在資料重要性、存取頻率、儲存系統的性能表現,或是在成本花費上,都介在冷儲存和熱儲存之間。
我們生活中常見的熱儲存像是電腦本機的硬碟、Google Drive 和 Microsoft OneDrive,隨時可存入和下載資料;暖儲存像是外接硬碟、Amazon S3 Standard-Infrequent Access 等等;冷儲存的儲存媒介則是從外接硬碟、磁帶硬碟機和雲端儲存解決方案都有,下面的段落將詳細介紹。
冷儲存與冷備份是一樣的嗎?
冷備份和冷儲存雖然名稱相近,但實際上是兩種不同的東西。冷儲存為功能簡單,相對經濟實惠的資料儲存技術;而「冷備份(Cold Backup)」,也叫做「離線備份(Offline Backup)」指的是 IT 系統/資料庫於停機或是維護狀態下,建立的備份檔案。也因為建立副本時,系統處於離線中的狀態,因此冷備份的檔案內容會和系統當下的資料完全一致。
也就是說冷備份的「冷」指的是建立資料副本的當下,系統屬於離線的狀態;而冷儲存的「冷」指資料的使用頻率。但兩者並非毫無關聯,冷備份的檔案若無需經常存取,可以透過冷儲存的方式保存。
冷儲存的優勢與風險
企業發展同時,會持續收集到各式資料,例如客戶、公司社群媒體、上游供應商等等都是企業數據的來源。長期下來,累積的資料量相當可觀。冷儲存透過以經濟高效的方式,保存龐大的資料,協助企業有效節省營運成本。而除了可以節省成本以外,冷儲存也可以幫助企業遵循資料留存的法規和相關內部政策。或是用來儲存長期的系統備份檔案,建立完善的災難復原機制,強化企業資安措施。
另一方面,冷儲存可能因為選擇的媒介不同,而有不同的風險。下一段落將介紹三種主要的冷儲存媒介,以及個別特色與風險。
有哪些冷儲存的方式呢?
由於冷儲存技術多用在需要長期保存的大量資料,冷儲存的媒體通常包含以下特性:成本低、高耐用性、可擴展性和高安全性,這四點特性。企業常用來儲存冷資料的媒介有:
●實體硬碟:實體硬碟使用簡便、容易取得,且種類眾多,包含傳統硬碟(HHD)、固態硬碟(SSD),甚至 USB 隨身硬碟企業都可以用來進行冷儲存。但實體硬碟的壽命有限,在 4~10 年之間,企業需要注意更新硬體設備。
●磁帶硬碟機:磁帶價格低廉,且可長久存放重要資料,使用年限約 30 年。但磁帶需要特殊設備才能讀寫資料,且用來讀寫磁帶資料的機器在未來可能因科技進步而消失,有資料無法讀取的風險。
●雲端儲存:公有雲服務供應商也有推出不同的儲存方式,讓企業將資料儲存業務外包,並以按照使用量付費。除了公有雲,私有雲中亦可規劃為冷儲存使用。雲端儲存的彈性高,使用方便不受地理位置限制,擴充性高,企業可即刻擴充儲存空間。並有享有雲端平台的安全措施。但企業需要長期支付租用雲端儲存服務的費用。
企業雲端服務與冷儲存的結合
雲端平台的冷儲存方案,除了提供高可擴性的儲存空間以外,還可以搭配監控存取系統,自動根據存取的頻率將資料移動至最符合企業經濟效益的資料儲存等級,減輕企業管理資料的工作負擔。另外,雲端服務供應商也會將資料分別儲存至多個不同的可用區,以進行跨區備份,提高資料可用性。
全球三大雲端平台 AWS、Azure、和 GCP 都有冷儲存服務,以下將服務內容整理成表格提供參考。
雲端平台及服務 |
AWS S3 Glacier Instant Retrieval |
AWS S3 Glacier Flexible Retrieval |
AWS S3 Glacier Deep Archive |
Azure Storage Cold Tier |
Azure Storage Archive Tier |
GCP Coldline storage |
GCP Archive storage |
可用性 |
99% |
99.9% |
99.9% |
99% |
99% |
99.95% |
99.95% |
最短儲存時間 |
90 天 |
90 天 |
180 天 |
90 天 |
180 天 |
90 天 |
365 天 |
資料擷取費用* |
有 |
有 |
有 |
有 |
有 |
有 |
有 |
第一組位元延遲(Time to First Byte) |
毫秒 |
分鐘~小時 |
小時 |
毫秒 |
小時 |
毫秒 |
毫秒 |
企業冷儲存應用場景
實際上,企業可以在哪些地方運用冷儲存呢?以下介紹 3 種應用場景。
●合規性:特定產業中,如醫療、保險和法律等相關領域,法律規範要求企業長期保存客戶個資和檔案紀錄。這些資料可能需要長期保留,並定期審核,以符合法規。除了法規之外,有些企業內部資料政策也有資料留存備查的規範。冷儲存系統能夠以高效益的方式,提升資料合規性。
●數據分析:大數據分析或機器學習皆需要使用巨量資料,冷儲存提供了一種成本效益高、可擴展且安全的方式來將待分析或已分析的資料留存。
●災難備援:無需經常存取的備份檔案以冷儲存方式儲存,確保意外發生時,備份檔案的可用性。雖然冷儲存的資料存取速度相較暖儲存和熱儲存慢,但還是可以協助企業在災難情況下快速恢復,應對各式緊急事件。
遠傳在冷儲存上的優勢
國際公有雲專業證照
遠傳和多家國際領導雲端平台合作,提供專業雲端冷儲存服務。同時備有多雲監控平台,讓您一站式整合不同雲端產品與服務,輕鬆掌握雲端 IT 資源。此外,遠傳技術團隊有多家雲端平台服務經驗,以及超過 300 張 AWS、Azure、VMware 等國際雲端平台認可的證照,更是微軟授權解決方案資格的合作夥伴(Licensing Solution Partner,LSP)。
國際級私有雲機房
遠傳有 20 年以上的私有雲服務經驗,可協助企業部署私有雲,建立專屬的雲端儲存空間,進行數據搬遷,並依照不同資料類別規劃私有雲冷儲存、暖儲存和熱儲存。企業亦可選擇遠傳國際認證的 IDC 雲端機房,建立資料中心,實現雙資料中心的配置,更加靈活管理數據、儲存重要的冷資料。
跨產業服務經驗
遠傳技術團隊服務過各式產業類別,包含醫療、服務、餐飲、零售業等,協助其進行數位轉型和資料搬遷。熟諳各產業 IT 需求與合規性規範,也能依照各別企業的特殊需求制定雲端冷儲存策略。
結論
總體而言,冷儲存由於其低成本、長期保存能力和適合大量資料的特性,在多個領域都能廣泛應用,且重要性更是不可言喻。想進一步了解遠傳可以如何幫助企業找到最佳資料儲存策略,請點選「我有興趣」,讓企業輕鬆落實資料管理。
延伸閱讀: