• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 新聞速寫

Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

2025-10-20
分類 : 新聞速寫
0
A A
0
Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

Red Hat 的混合雲端原生 AI 平台能簡化 AI 工作流程、提供強大且新穎的推論功能,不僅能為大規模代理式 AI 奠定基礎,更協助 IT 團隊與 AI 工程師加速創新、提升效率

文/Red Hat

世界領先開放原始碼軟體解決方案供應商 Red Hat 近日宣布推出 Red Hat AI 3,是 Red Hat 企業級 AI 平台的一大進展。此平台匯集 Red Hat AI Inference Server、Red Hat Enterprise Linux AI(RHEL AI)與 Red Hat OpenShift AI 的最新創新成果,不僅能簡化大規模高效能 AI 推論的複雜流程,更賦能企業得以將工作負載更順暢地從概念驗證(PoC)推向生產環境,同時改善 AI 驅動應用程式的協作。

企業將 AI 從實驗階段推向實際應用時,往往面臨資料隱私、成本控管及多樣化模型管理等重大挑戰。根據麻省理工學院 NANDA 計畫的《The GenAI Divide: State of AI in Business》報告指出,生產環境 AI 的現實情況是,儘管企業投資金額高達 400 億美元,仍有約 95% 的企業未能從中獲得可衡量的財務報酬。

為應對上述挑戰,Red Hat 推出 Red Hat AI 3,專為資訊長和 IT 主管提供一致且統一的體驗,協助他們最大化加速運算技術的投資效益。企業不僅能於跨混合式或多供應商的環境中快速擴展與部署 AI 工作負載,還能透過單一通用平台,提升團隊在新一代 AI 代理等專案上的協作效率。Red Hat AI 3 以開放標準為基礎,能滿足企業在 AI 發展過程中各階段的需求,支援任何硬體加速器上的任何模型且適用於各種環境,包含資料中心、公有雲、主權 AI 環境,抑或是最遙遠的邊緣端。

Red Hat 副總裁暨 AI 事業部總經理 Joe Fernandes 表示:「當企業將 AI 的應用規模從實驗階段擴展至生產環境時,將會面臨複雜性、成本與控管上新一波的挑戰。Red Hat AI 3 作為企業級開放原始碼平台,正是為了將上述障礙降至最低。我們藉由 llm-d 的分散式推論等創新功能為代理式 AI 奠定基石,IT 團隊得以更有自信地在任何基礎架構上,以自己的方式將新一代 AI 投入實際營運。」

從訓練到「執行」:企業 AI 推論的轉變

企業將 AI 舉措推向生產環境後,其重心將從模型的訓練與調校移轉至推論,亦即企業 AI 的「執行」階段。Red Hat AI 3 著重於可擴展且符合成本效益的推論能力,奠基於廣受好評的 vLLM 與 llm-d 社群專案,並結合 Red Hat 自身卓越的模型最佳化技術,為大型語言模型(LLM)提供生產環境級的服務。

為協助資訊長充分利用高價值硬體加速資源,Red Hat OpenShift AI 3.0 正式推出 llm-d,重新定義 LLM 在 Kubernetes 上的原生執行方式。llm-d 巧妙結合經驗證的 Kubernetes 調度價值與 vLLM 的卓越效能,實現智慧分散式推論,並結合多項關鍵開源技術,包括 Kubernetes Gateway API Inference Extension、NVIDIA Dynamo 低延遲資料傳輸函式庫(NIXL),以及 DeepEP Mixture of Experts(MoE)通訊函式庫,賦予企業:

  • 利用分散式服務降低成本、提升效率,實現更高的每美元效能。
  • 採用專為 AI 工作負載的多變特性而設計的智慧推論感知(inference-aware)負載平衡器,有效改善回應時間與延遲。
  • 藉由預定的「Well-lit Paths」簡化於 Kubernetes 上大規模部署模型的流程,實現簡易營運與最高可靠性。
  • 透過跨平台支援,在不同的硬體加速器(包括 NVIDIA 與 AMD)上部署 LLM 推論,最大化靈活性。

llm-d 以 vLLM 為基礎擴展,將其從單節點的高效能推論引擎,進化為分散式、一致且可擴展的服務系統,專門協助企業達成可預測的效能、可衡量的投資報酬率(ROI),並規劃更有效的基礎架構。所有強化功能皆為因應處理高度變動的 LLM 工作負載,以及如混合專家模型(Mixture-of-Experts,MoE)等巨型模型的挑戰而設計。

統一平台,實現協作式 AI

Red Hat AI 3 提供統一彈性體驗,專為生產環境中生成式 AI 解決方案的協作需求打造。其設計旨在透過促進團隊協作與統一工作流程,並為企業創造實質價值。平台工程師和 AI 工程師可藉由 Red Hat AI 3 這個單一平台執行 AI 策略。新功能著重於提升從概念驗證擴展至生產環境所需的生產力與效率。

  • 模型即服務(Model as a Service,MaaS)功能奠基於分散式推論之上,IT 團隊能作為企業自己的 MaaS 供應商,集中管理常用模型並為 AI 開發者與 AI 應用程式提供依據需求(on-demand)存取服務。上述功能不僅有助於成本控管,亦能應對因隱私權或資料安全顧慮而無法在公有 AI 服務上執行的應用情境。
  • 平台工程師可透過 AI 中心(AI Hub)探索、部署與管理基礎 AI 資產,其提供內含模型精選目錄(curated catalog)的集中式管理中心,涵蓋經驗證與最佳化的生成式 AI 模型、模型生命週期管理登錄檔,以及可配置與監控運行於 OpenShift AI 上所有 AI 資產的部署環境。
  • 生成式 AI 工作室(gen AI Studio)為 AI 工程師打造動手實作的環境,在此能與模型互動並加速生成式 AI 應用程式的原型開發。透過 AI assets endpoint 功能,工程師能輕鬆探索與使用可用的模型與 MCP 伺服器(用以簡化模型與外部工具的整合流程)。內建的 playground 則提供互動式且無狀態(stateless)的環境,可用於模型實驗、提示詞(prompts)測試與參數微調,支援如對話(chat)與檢索增強生成(RAG)等應用場景。
  • Red Hat AI 3 亦同步整合全新且經 Red Hat 驗證與最佳化的模型以簡化開發流程。精選內容包括如 OpenAI 的 gpt-oss、DeepSeek-R1 等受歡迎的開源模型,以及 Whisper(語音轉文字)和 Voxtral Mini(用於語音代理)等專業模型。

為新一代 AI 代理(AI agents)奠定基石

AI 代理即將顛覆應用程式的建構方式,其複雜的自動化工作流程將對推論能力帶來嚴苛的要求。Red Hat OpenShift AI 3.0 版本不僅強化推論能力,更帶來專注於代理管理的新版或強化功能,持續為可擴展的代理式 AI 系統奠定穩固基礎。

為加速代理的建立與部署,Red Hat 推出基於 Llama Stack 的統一應用程式介面層,助力讓開發流程與 OpenAI 等業界標準保持一致。此外,為提倡更開放、更具互通性的生態系,Red Hat 已率先採用模型上下文協定(Model Context Protocol,MCP),此強大的新興標準能簡化 AI 模型與外部工具的互動方式,是現代 AI 代理不可或缺的基礎功能。

Red Hat AI 3 引入以既有的 InstructLab 功能所打造、模組化且可擴充的全新模型客製化工具組。開發者可藉由專用的 Python 函式庫獲得更大的靈活性及掌控度。此工具組是由多項開源專案驅動,其中包括用於資料處理的 Docling,可將非結構化文件轉換為 AI 模型可讀取的格式,大幅簡化資料匯入流程。此外,該工具組亦支援用於合成資料生成的彈性框架,以及用於 LLM 微調的訓練中心。AI 工程師可透過整合的評估中心(evaluation hub)監測並驗證訓練成果,協助企業有自信地運用專有資料,以獲得更準確且更具相關性的 AI 成果。

標籤: AI創新RedHatRedHatAI3分散式AI混合雲AI生成式AI
上一篇文章

思科AI調查:AI 就緒企業領先同業實現價值

下一篇文章

HPE Discover More AI Taipei 2025:以AI、混合雲與網路技術加速台灣企業轉型

相關文章

新聞速寫

Arm Flexible Access 擴大升級 驅動更多企業加速晶片開發

2026-02-05
4534534535
新聞速寫

洛克威爾自動化以前瞻自主化發展五階段 助在地企業掌握製造新動能

2026-02-05
446348
新聞速寫

華碩號召百家 ISV 夥伴結盟 強化一站式商用解決方案布局

2026-02-05
下一篇文章
HPE舉辦HPE Discover More AI Taipei 2025,HPE台灣暨香港董事長王嘉昇在主題演講中,深入闡述AI、雲端、邊緣運算與資料的整合發展趨勢。

HPE Discover More AI Taipei 2025:以AI、混合雲與網路技術加速台灣企業轉型

2026 Elite Vendor

追蹤我們的 Facebook

近期文章

  • Arm Flexible Access 擴大升級 驅動更多企業加速晶片開發
  • 洛克威爾自動化以前瞻自主化發展五階段 助在地企業掌握製造新動能
  • 華碩號召百家 ISV 夥伴結盟 強化一站式商用解決方案布局
  • AI 需求擴大 聯發科持續布局資料中心 ASIC、Wi-Fi 8 與車用
  • 精誠資訊攜手輔大發表全台首創 AI 智能選課推薦系統

📈 CIO點閱文章週排行

  • 3413351

    【專訪】秀傳醫療體系副資訊長鐘苡菱

    0 分享
    分享 0 Tweet 0
  • AI 基本法通過後應知道的要事

    0 分享
    分享 0 Tweet 0
  • 北醫與勤業眾信布局 BioBridge+ 支持生醫新創成果轉譯

    0 分享
    分享 0 Tweet 0
  • CIO Taiwan 揭曉 2026 Elite Vendor 台灣企業最信賴的科技夥伴名單公布

    0 分享
    分享 0 Tweet 0
  • Lightmatter 發表 Guide 光源引擎 以 VLSP 技術升級 AI CPO 雷射架構

    0 分享
    分享 0 Tweet 0
  • 【專訪】和碩聯合科技新產品發展事業處暨人工智慧發展處副總經理蕭安助

    0 分享
    分享 0 Tweet 0
  • 以提示工程生成策略執行戰術(平衡計分卡使用)

    0 分享
    分享 0 Tweet 0
  • 強化資安、數位監理與創新 金管會 2026 年金融數位治理布局

    0 分享
    分享 0 Tweet 0
  • 屏科大打造全台首座 AI 畜牧場 以企業級運算平台開啟養殖經驗數位傳承新模式

    0 分享
    分享 0 Tweet 0
  • IT 治理真空的四種致命陷阱

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

36416463

守護數位 DNA 衛福部公布主權雲八大方針

文/鄭宜芬 資安威脅日益嚴峻,導入全球先進雲端技術的同時,必須守護國民數據資產的

1200630645

【專訪】弈樂科技研發經理吳梓煊

雲原生玩家 數據驅動轉型 隨著遊戲體驗要求提升、資安威脅加劇與 AI 產業化的興

5643645

北醫與勤業眾信布局 BioBridge+ 支持生醫新創成果轉譯

文/鄭宜芬 為呼應政府加速布局台灣大健康產業,臺北醫學大學攜手勤業眾信聯合會計師

846836

AI 需求擴大 聯發科持續布局資料中心 ASIC、Wi-Fi 8 與車用

文/鄭宜芬 隨著「無所不在的 AI」持續推動高效運算需求,市場正快速擴大資料中心

1200x630i163s11

台灣健康網路平台揭牌,啟動「主權 AI」與 DaaS 新紀元

從硬體代工邁向數據強國 2026年1月9日,台灣科技與醫療產業迎來了數位轉型的關

以提示工程生成策略執行戰術(平衡計分卡使用)

策略黑客術 Part 2 本次 GenAI 實戰,將以生成符合企業的平衡計分卡。

565

2026 CES 四大重點:筆電轉型 AI 代理平台、視覺模型成主流

文/鄭宜芬 CES 2026 展示了國際對 AI 基礎建設與技術投資的熱潮,催生

3651365

勤業眾信 Future Talk 聚焦韌性競爭力 《2026 CxO 前瞻展望》提出 TOGETHER 策略方針

文/鄭宜芬 在全球供應鏈重組加速、科技競爭升溫與政策環境高度不確定的情勢下,企業

AI 基本法通過後應知道的要事

~風險分級與治理七原則 文/蕭奕弘 2025 年 12 月 23 日,立法院三讀

Ciotaiwan logo 600 white

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音