2025 金融科技高峰會秋季場
在數位轉型與 AI 技術加速推進下,金融業積極導入創新以提升營運效能;但在 AI 算力平台建置與維運上,仍面臨架構複雜、資源分配困難與資安風險等挑戰。為此精誠資訊推出 RE:FORM 平台,提供雲地整合的自動化方案,協助金融機構更簡潔高效地部署與管理 AI 生產環境。
文/明雲青
AI 技術日新月異,企業對算力的需求持續攀升。精誠資訊解決方案架構師林宗翰觀察到,八至九成企業傾向導入開放性大型語言模型 API,而非自行訓練模型,以快速滿足業務需求並降低技術門檻。但即便如此,資源分配與環境管理仍是 IT 團隊的重大挑戰。
現行 IT 架構高度異質,涵蓋虛擬機、Kubernetes(K8s)/容器平台與各式公有雲,導致部署流程分散、腳本零碎且缺乏標準入口。使資安與治理部門難以掌握風險,AI 開發與業務單位則苦於申請 GPU 環境耗時、算力運用不靈活,溝通成本居高不下。
為解決上述痛點,精誠資訊導入平台工程(Platform Engineering)理念,期盼提供客戶能與複雜基礎設施互動的統一平台,並將常用環境「服務化」,轉化為可自助申請的生產資源。
精誠積極推廣的 RE:FORM 平台正是這一願景的具體實踐。使用者只需簡單操作,即可快速部署如向量資料庫、Jupyter、vLLM 或 Ollama 等 AI 環境。此平台整合企業內部多元基礎設施為統一資源池,支援在公有雲或地端 K8s 叢集彈性部署,並將 IaC 或自動化腳本,從以往艱澀難懂的 Item Schema 轉為直覺式 UI Schema,讓使用者可細緻選擇 CPU、記憶體與 GPU 等資源配置,甚至精細到經由 MIG(Multi-Instance GPU)切分後的 GPU 片數。
[ 加入 CIO Taiwan 官方 LINE 、 Facebook 與 IG,與全球CIO同步獲取精華見解 ]
林宗翰強調,RE:FORM 不僅提升部署效率,更強化治理與成本控管。平台內建部署軌跡與審核機制,能避免錯誤配置造成資安風險。而 RE:FORM 的 RATE 模組則協助企業精準追蹤雲端與地端資源用量,進行 Rightsizing(資源優化),有效控管 IT 預算。林宗翰指出,隨著雲端服務可能帶來的成本失控問題;RATE 模組透過視覺化成本地圖與異常偵測,可即時識別低效用資源、閒置快照與冗餘執行個體,並提供關閉建議與排程設定,協助企業在不影響效能之下,大幅降低雲端支出,實現 FinOps 精準治理。此外該平台亦支援 NVIDIA GPU MIG 切分,確保算力彈性與高效利用。
透過 RE:FORM,原本需耗時數週的環境申請流程,現已縮短至平均 0.7個工作天。企業得以在 AI 時代,以敏捷、安全且成本可控的方式,打造並運用私有 AI 與 GPU 算力平台,全面升級金融營運效率。
(本文授權非營利轉載,請註明出處:CIO Taiwan)















