挑戰
東南亞一家領先的雲端服務供應商需要升級其儲存基礎架構,以支援不斷增長的 AI 訓練工作負載。現有配置依賴較舊的 RAID 控制器,無法跟上現代 NVMe 硬碟和 GPU 加速運算節點的吞吐量需求。
解決方案
騰群在 120 個儲存節點上部署 Broadcom MegaRAID 9560-16i 控制器,每個搭配 CacheVault CVPM05 快閃記憶體寫入快取模組,確保斷電時資料保護。所有節點使用 SFF-8643 SAS 連接線 互連,以確保最高可靠性。部署包含完整的散熱驗證、韌體調校,以及與客戶現有 Ceph 儲存叢集的整合測試。
成果
部署後順序讀取吞吐量較前代控制器提升 2.4 倍。混合工作負載下寫入延遲降低 35%。CacheVault 模組在運營首季成功保護了 3 次非計劃性斷電事件,零資料遺失。透過整合,整體儲存 TCO 降低約 20%。
使用產品
Broadcom MegaRAID 9560-16i、CacheVault CVPM05 快閃記憶體寫入快取、SFF-8643 SAS 連接線
分享此文章