• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 新聞速寫

Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

2025-10-20
分類 : 新聞速寫
0
A A
0
Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

Red Hat 的混合雲端原生 AI 平台能簡化 AI 工作流程、提供強大且新穎的推論功能,不僅能為大規模代理式 AI 奠定基礎,更協助 IT 團隊與 AI 工程師加速創新、提升效率

文/Red Hat

世界領先開放原始碼軟體解決方案供應商 Red Hat 近日宣布推出 Red Hat AI 3,是 Red Hat 企業級 AI 平台的一大進展。此平台匯集 Red Hat AI Inference Server、Red Hat Enterprise Linux AI(RHEL AI)與 Red Hat OpenShift AI 的最新創新成果,不僅能簡化大規模高效能 AI 推論的複雜流程,更賦能企業得以將工作負載更順暢地從概念驗證(PoC)推向生產環境,同時改善 AI 驅動應用程式的協作。

企業將 AI 從實驗階段推向實際應用時,往往面臨資料隱私、成本控管及多樣化模型管理等重大挑戰。根據麻省理工學院 NANDA 計畫的《The GenAI Divide: State of AI in Business》報告指出,生產環境 AI 的現實情況是,儘管企業投資金額高達 400 億美元,仍有約 95% 的企業未能從中獲得可衡量的財務報酬。

為應對上述挑戰,Red Hat 推出 Red Hat AI 3,專為資訊長和 IT 主管提供一致且統一的體驗,協助他們最大化加速運算技術的投資效益。企業不僅能於跨混合式或多供應商的環境中快速擴展與部署 AI 工作負載,還能透過單一通用平台,提升團隊在新一代 AI 代理等專案上的協作效率。Red Hat AI 3 以開放標準為基礎,能滿足企業在 AI 發展過程中各階段的需求,支援任何硬體加速器上的任何模型且適用於各種環境,包含資料中心、公有雲、主權 AI 環境,抑或是最遙遠的邊緣端。

Red Hat 副總裁暨 AI 事業部總經理 Joe Fernandes 表示:「當企業將 AI 的應用規模從實驗階段擴展至生產環境時,將會面臨複雜性、成本與控管上新一波的挑戰。Red Hat AI 3 作為企業級開放原始碼平台,正是為了將上述障礙降至最低。我們藉由 llm-d 的分散式推論等創新功能為代理式 AI 奠定基石,IT 團隊得以更有自信地在任何基礎架構上,以自己的方式將新一代 AI 投入實際營運。」

從訓練到「執行」:企業 AI 推論的轉變

企業將 AI 舉措推向生產環境後,其重心將從模型的訓練與調校移轉至推論,亦即企業 AI 的「執行」階段。Red Hat AI 3 著重於可擴展且符合成本效益的推論能力,奠基於廣受好評的 vLLM 與 llm-d 社群專案,並結合 Red Hat 自身卓越的模型最佳化技術,為大型語言模型(LLM)提供生產環境級的服務。

為協助資訊長充分利用高價值硬體加速資源,Red Hat OpenShift AI 3.0 正式推出 llm-d,重新定義 LLM 在 Kubernetes 上的原生執行方式。llm-d 巧妙結合經驗證的 Kubernetes 調度價值與 vLLM 的卓越效能,實現智慧分散式推論,並結合多項關鍵開源技術,包括 Kubernetes Gateway API Inference Extension、NVIDIA Dynamo 低延遲資料傳輸函式庫(NIXL),以及 DeepEP Mixture of Experts(MoE)通訊函式庫,賦予企業:

  • 利用分散式服務降低成本、提升效率,實現更高的每美元效能。
  • 採用專為 AI 工作負載的多變特性而設計的智慧推論感知(inference-aware)負載平衡器,有效改善回應時間與延遲。
  • 藉由預定的「Well-lit Paths」簡化於 Kubernetes 上大規模部署模型的流程,實現簡易營運與最高可靠性。
  • 透過跨平台支援,在不同的硬體加速器(包括 NVIDIA 與 AMD)上部署 LLM 推論,最大化靈活性。

llm-d 以 vLLM 為基礎擴展,將其從單節點的高效能推論引擎,進化為分散式、一致且可擴展的服務系統,專門協助企業達成可預測的效能、可衡量的投資報酬率(ROI),並規劃更有效的基礎架構。所有強化功能皆為因應處理高度變動的 LLM 工作負載,以及如混合專家模型(Mixture-of-Experts,MoE)等巨型模型的挑戰而設計。

統一平台,實現協作式 AI

Red Hat AI 3 提供統一彈性體驗,專為生產環境中生成式 AI 解決方案的協作需求打造。其設計旨在透過促進團隊協作與統一工作流程,並為企業創造實質價值。平台工程師和 AI 工程師可藉由 Red Hat AI 3 這個單一平台執行 AI 策略。新功能著重於提升從概念驗證擴展至生產環境所需的生產力與效率。

  • 模型即服務(Model as a Service,MaaS)功能奠基於分散式推論之上,IT 團隊能作為企業自己的 MaaS 供應商,集中管理常用模型並為 AI 開發者與 AI 應用程式提供依據需求(on-demand)存取服務。上述功能不僅有助於成本控管,亦能應對因隱私權或資料安全顧慮而無法在公有 AI 服務上執行的應用情境。
  • 平台工程師可透過 AI 中心(AI Hub)探索、部署與管理基礎 AI 資產,其提供內含模型精選目錄(curated catalog)的集中式管理中心,涵蓋經驗證與最佳化的生成式 AI 模型、模型生命週期管理登錄檔,以及可配置與監控運行於 OpenShift AI 上所有 AI 資產的部署環境。
  • 生成式 AI 工作室(gen AI Studio)為 AI 工程師打造動手實作的環境,在此能與模型互動並加速生成式 AI 應用程式的原型開發。透過 AI assets endpoint 功能,工程師能輕鬆探索與使用可用的模型與 MCP 伺服器(用以簡化模型與外部工具的整合流程)。內建的 playground 則提供互動式且無狀態(stateless)的環境,可用於模型實驗、提示詞(prompts)測試與參數微調,支援如對話(chat)與檢索增強生成(RAG)等應用場景。
  • Red Hat AI 3 亦同步整合全新且經 Red Hat 驗證與最佳化的模型以簡化開發流程。精選內容包括如 OpenAI 的 gpt-oss、DeepSeek-R1 等受歡迎的開源模型,以及 Whisper(語音轉文字)和 Voxtral Mini(用於語音代理)等專業模型。

為新一代 AI 代理(AI agents)奠定基石

AI 代理即將顛覆應用程式的建構方式,其複雜的自動化工作流程將對推論能力帶來嚴苛的要求。Red Hat OpenShift AI 3.0 版本不僅強化推論能力,更帶來專注於代理管理的新版或強化功能,持續為可擴展的代理式 AI 系統奠定穩固基礎。

為加速代理的建立與部署,Red Hat 推出基於 Llama Stack 的統一應用程式介面層,助力讓開發流程與 OpenAI 等業界標準保持一致。此外,為提倡更開放、更具互通性的生態系,Red Hat 已率先採用模型上下文協定(Model Context Protocol,MCP),此強大的新興標準能簡化 AI 模型與外部工具的互動方式,是現代 AI 代理不可或缺的基礎功能。

Red Hat AI 3 引入以既有的 InstructLab 功能所打造、模組化且可擴充的全新模型客製化工具組。開發者可藉由專用的 Python 函式庫獲得更大的靈活性及掌控度。此工具組是由多項開源專案驅動,其中包括用於資料處理的 Docling,可將非結構化文件轉換為 AI 模型可讀取的格式,大幅簡化資料匯入流程。此外,該工具組亦支援用於合成資料生成的彈性框架,以及用於 LLM 微調的訓練中心。AI 工程師可透過整合的評估中心(evaluation hub)監測並驗證訓練成果,協助企業有自信地運用專有資料,以獲得更準確且更具相關性的 AI 成果。

標籤: AI創新RedHatRedHatAI3分散式AI混合雲AI生成式AI
上一篇文章

思科AI調查:AI 就緒企業領先同業實現價值

下一篇文章

HPE Discover More AI Taipei 2025:以AI、混合雲與網路技術加速台灣企業轉型

相關文章

台達亮相2025台北國際自動化工業大展
新聞速寫

趨勢科技與緯創數技投資攜手 打造全價值鏈企業級AI轉型工廠

2025-10-20
PTC 推出全新服務生命週期管理 AI 解決方案加速現場服務與服務供應鏈智慧化                 
新聞速寫

PTC 推出全新服務生命週期管理 AI 解決方案加速現場服務與服務供應鏈智慧化                 

2025-10-20
微軟以新一波 Copilot 更新,讓每台 Windows 11 PC 都成為 AI PC。
新聞速寫

讓每台 Windows 11 PC 都成為 AI PC

2025-10-20
下一篇文章
HPE舉辦HPE Discover More AI Taipei 2025,HPE台灣暨香港董事長王嘉昇在主題演講中,深入闡述AI、雲端、邊緣運算與資料的整合發展趨勢。

HPE Discover More AI Taipei 2025:以AI、混合雲與網路技術加速台灣企業轉型

追蹤我們的 Facebook

近期文章

  • 趨勢科技與緯創數技投資攜手 打造全價值鏈企業級AI轉型工廠
  • PTC 推出全新服務生命週期管理 AI 解決方案加速現場服務與服務供應鏈智慧化                 
  • 讓每台 Windows 11 PC 都成為 AI PC
  • HPE Discover More AI Taipei 2025:以AI、混合雲與網路技術加速台灣企業轉型
  • Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

📈 CIO點閱文章週排行

  • 透過 ISO 42001 規範進行 AI 與 Data 治理

    透過 ISO 42001 規範進行 AI 與 Data 治理

    0 分享
    分享 0 Tweet 0
  • 歐美 AI 法規陸續底定,導入 ISO 42001 將事半功倍

    0 分享
    分享 0 Tweet 0
  • 【專訪】櫻花集團總經理李惠恂

    0 分享
    分享 0 Tweet 0
  • 經濟部 6 年投 442 億發展無人機 鎖定國防與產業雙軸升級

    0 分享
    分享 0 Tweet 0
  • 生成式 AI 標準化根因分析

    0 分享
    分享 0 Tweet 0
  • L.K.C. Lab 與 Progress Software 攜手合作 驗證資安防護能力

    0 分享
    分享 0 Tweet 0
  • 重視企業 AI 使用流暢度

    0 分享
    分享 0 Tweet 0
  • 跨越 AI 鴻溝:影子 AI 與超級使用者

    0 分享
    分享 0 Tweet 0
  • 英特爾公布Panther Lake架構 首款採用18A製程打造的AI PC平台

    0 分享
    分享 0 Tweet 0
  • AI 預算規劃:定義與衡量 AI 策略的價值

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

120063010163

2025 TIE 聚焦 AI 跨域創新 展現產業智慧升級新動能

文/鄭宜芬 2025 台灣創新技術博覽會(TIE)16 日登場,以「AI 跨域創

I171s04

CEO、CIO 迎接 AI 浪潮

文/張瑞雄(資訊系教授、台北商業大學前校長) 在當今的數位經濟中,人工智慧(AI

12006300926

臺美攜手推動資安防禦合作 成亞太地區示範基地

文/鄭宜芬 身處數位轉型與資安威脅日益加劇的時代,臺灣與美國的合作不僅是產業發展

120063009232

從 AI 影像到飛控模組 臺灣無人機建構自主技術鏈

文/鄭宜芬 無人機近期成為軍工產業的焦點,為加強臺灣在全球無人機產業中的競爭力,

I171d04

CQL 系列報導 ─ CQL 應用與推廣策略解析

口述/孫培然·彙整/CIO編輯室 隨著醫療資訊的發展,臨床邏輯與品質衡量的需求日

I171d08

將營業秘密保護內化為企業 DNA

文/蕭奕弘 台積電近期爆發的員工洩密案,再次突顯營業秘密保護的重要性。對於 CI

1200630 10172

經濟部 6 年投 442 億發展無人機 鎖定國防與產業雙軸升級

文/鄭宜芬 為打造無人機非紅供應鏈,行政院院會 16 日通過「無人載具產業發展統

I172s06

阿聯酋全球鋁業在 AI 與混合雲的實踐

本篇文章源自麥肯錫顧問公司對於阿聯酋全球鋁業(Emirates Global A

12006301008

中國數位監控技術跨境輸出 資安院提企業四大防禦建議

文/鄭宜芬 近期中國外洩相關監控資料檔案約 600GB,涉及中國網路監控防火牆技

Ciotaiwan logo 600 white

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音