台灣戴爾科技集團技術副總經理李百飛表示:數據如企業的血液,流動得愈順暢,企業營運體質愈健壯。戴爾科技提出的數據資本化(DIGI-DATA)藍圖,具備數據收集、保存、分析與保護所需之端到端軟硬體基礎設施。此架構擁有極大擴充性,能讓企業伴隨營運規模成長,一路穩定承載其數據資產。
近年盛行於產業界的頭號顯學,無疑正是數位轉型;但這股浪潮滾動至今,主旋律已出現變化,從原本的「數位技術」轉向「數據驅動」。許多嗅到風向球轉變的企業,都急欲擴建數據收集、儲存與分析架構,希望竭盡所能網羅更大的資料部位,加速洞察智勝先機,催生多樣化創新應用場景。
上述願景萬般美好,卻不易實現。台灣戴爾科技集團(Dell Technologies)技術副總經理李百飛表示,數位轉型2.0的關鍵在於「以數據為本」,企業要想在此競局中成為贏家,必須落實數據資本化,盡可能收集愈多數據、即便現在還未看出用途也不錯放,先有雄厚資產,才可望變現出巨大商業價值;但「數據資本化」對各種規模的企業而言,通通都是艱難任務。
李百飛說,眾所皆知大數據有四個V,前三個意指「Volume」量大、「Variety」種類多、「Velocity」速度快,隨著數位轉型2.0時代來臨,量更多、種類更雜且速度要求更快,使這三個V變成更加燙手的難題;因此企業需要建構一個能突破三大難關的架構,才有機會落實最後一個V、也就是「Value」價值。
重點來了,這個必須兼具龐大儲存容量、收納多元數據、優異處理效能的架構,投資成本必須控制在合理範圍內。以分子分母的數學式來看,建置成本等於分母,唯有控制分母、才能避免價值遭到稀釋。又要馬兒好,又不讓牠吃草,真的很難。
為此,戴爾科技近期推出數據資本化(DIGI-DATA) 藍圖,要讓企業能以合理的支出,建造一個涵蓋數據收集、數據保存、數據分析及數據防護等全方位機能的架構,從容化解容量大、種類雜、性能高等三V難題,加速推動以數據為本的智慧轉型。
藉由DIGI-DATA技術藍圖,加速催化創新應用
李百飛指出,戴爾科技提出的DIGI-DATA技術藍圖,具備數據收集、保存、分析與保護所需之端到端軟硬體基礎設施,且處理範圍涵括結構性、非結構性、串流、批次等各類型數據及處理模式。此架構擁有極大擴充性,從TB、PB直到EB等級數據皆可支援,從小規模到極大規模部署並不需半途打掉重練,讓企業能伴隨營運規模成長,一路穩定承載其數據資產。
其次DIGI-DATA架構可透過「MAKE」或「BUY」兩種模式提供予客戶。若企業擁有強大IT團隊,能自行駕馭安裝、客製化等作業,確保各項組件整合運作無虞,即可選擇「MAKE」,引進架構所需之軟硬體產品與管理套件;假使企業缺乏整合能力,或難以為此投入足夠人力工時,便適合選用「BUY」模式,引進打包好的Ready Solutions。
藉由此架構的成形,企業將能獲得完善發展基礎,加速建構大(Big Data)、人(AI)、物(IoT)等各類創新應用場景;在此同時,企業可進一步善用5G的低延遲、高頻寬特性,打通從邊際、核心到雲端的整條鏈路,讓數據資產能安全順暢地流動,支撐各項創新應用的高效運行。
獨特技術加持,成就極致擴充性與性價比
在DIGI-DATA架構藍圖中,有幾項蘊藏獨特技術的解決方案,堪稱是支撐數據資本化的關鍵要角。首先是PowerScale,為構成數據湖的基礎組件,也是業界唯一完整支援NFS、SMB/CIFS、S3/SWIFT、FTP乃至HDFS等所有標準協定的儲存設備,不管任何型態的數據流入,都一定可被讀出,完全沒有Data Silo顧慮,企業更毋須為了維持數據流的銜接與轉換,耗擲時間與資源佈建大量伺服器、儲存設備和網路設備。李百飛強調,數據如企業的血液,流動得愈順暢,企業營運體質就愈健壯;PowerScale可支援4~252台節點的叢集組態,擴展能力堪稱業界最強。
其次是Greenplum資料倉儲,採用網格式大量平行運算架構,彷彿2個「工頭」 (Master)搭配2、4、…上千「工人」(Slave)一起幹活,運算效能可隨Slave數量增加而線性成長,且僅需立足在經濟實惠的x86伺服器、不需昂貴的一體機。Greenplum為開源軟體,也提供商業授權版,企業即使選用後者,軟體授權成本也僅有傳統資料倉儲的20~30%,還可輕易串聯開源世界的BI、DL/ML、高階演算法等眾多資源,有助企業打造高CP值、無Vendor Locking顧慮的強大分析平台。
再來談到數據防護,最大亮點在於戴爾科技的PowerProtect Cyber Recovery解決方案-是業界唯一通過「避風港計畫」認證的數據保護庫(Data Vaulting)方案。許多企業藉由主中心、備援中心組成災難復原架構,但以近年猖獗的勒索軟體為例,已被證實有遠程擴散能力,主中心遭到Lockdown,備援中心也難逃一劫;反觀避風港計畫,意在幫助企業建立第三個中心,它屬於邏輯性質,可建在中心端或異地端,企業每天只需開通1~2小時,讓主中心(或備援中心)將資料輸送到PowerProtect保護庫,傳送完成便關閉鏈路,即能建立不受駭客連線侵擾的數據備份。
不僅如此,Cyber Recovery解決方案內含AI引擎、可辨識眾多的先進攻擊樣態,會針對流入的數據執行掃瞄,確保所有留存在Vault的數據屬於乾淨無害;而此Vault只准讀取、不許寫入,就算駭客技高一籌闖入此禁地,也無法加密其中數據。
李百飛進一步分享幾個DIGI-DATA架構衍生的成功案例。某製造大廠為維持生產良率,藉由500台x86主機建構兩個互為備援的Hadoop叢集,承載4PB資料量;幾年後因製程精進,資料量爆增至20PB,需擴增至2,500台主機、7,500個網路埠、5,000條電源線規模,該廠驚覺擴建成本已大到難以承受地步,於是引進PowerScale架構,結果只動用252台節點、750個網路埠、500條電源線的1/10規模,便撐起可處理20PB數據的Hadoop叢集,且新舊架構所需負擔的Hadoop軟體授權支出,差距高達數十倍。
另外某企業原採用他牌資料倉儲,發現隨著分析需求攀升,即使不計成本強化主機規格、增購軟體授權,也無法換得預期效能,因而決定採用Greenplum,建立兩個Master節點、四個Slave節點。經過轉換,一項原本需執行4小時的資料庫應用,如今57秒便可完成,且硬體從原本Unix轉為相對平價的x86主機,軟體授權僅有原先20~30%,堪稱運算速度極快且C/P值極高的投資。
展望未來,戴爾科技集團將整合內外部資源,並攜手數據優先聯盟夥伴深化在大數據、人工智慧、物聯網、雲端、AR/VR與5G的能量,共同擘劃以數據驅動的企業完整解決方案,建構台灣數位生態系,提供符合產業需求的數據驅動轉型服務,大幅提升在地產業的市場競爭力與獲利能力,真正落實數位未來。