• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 新聞速寫

Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

2025-10-20
分類 : 新聞速寫
0
A A
0
Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

Red Hat 推出 Red Hat AI 3,助生產環境的 AI 工作負載實現分散式 AI 推論

Red Hat 的混合雲端原生 AI 平台能簡化 AI 工作流程、提供強大且新穎的推論功能,不僅能為大規模代理式 AI 奠定基礎,更協助 IT 團隊與 AI 工程師加速創新、提升效率

文/Red Hat

世界領先開放原始碼軟體解決方案供應商 Red Hat 近日宣布推出 Red Hat AI 3,是 Red Hat 企業級 AI 平台的一大進展。此平台匯集 Red Hat AI Inference Server、Red Hat Enterprise Linux AI(RHEL AI)與 Red Hat OpenShift AI 的最新創新成果,不僅能簡化大規模高效能 AI 推論的複雜流程,更賦能企業得以將工作負載更順暢地從概念驗證(PoC)推向生產環境,同時改善 AI 驅動應用程式的協作。

企業將 AI 從實驗階段推向實際應用時,往往面臨資料隱私、成本控管及多樣化模型管理等重大挑戰。根據麻省理工學院 NANDA 計畫的《The GenAI Divide: State of AI in Business》報告指出,生產環境 AI 的現實情況是,儘管企業投資金額高達 400 億美元,仍有約 95% 的企業未能從中獲得可衡量的財務報酬。

為應對上述挑戰,Red Hat 推出 Red Hat AI 3,專為資訊長和 IT 主管提供一致且統一的體驗,協助他們最大化加速運算技術的投資效益。企業不僅能於跨混合式或多供應商的環境中快速擴展與部署 AI 工作負載,還能透過單一通用平台,提升團隊在新一代 AI 代理等專案上的協作效率。Red Hat AI 3 以開放標準為基礎,能滿足企業在 AI 發展過程中各階段的需求,支援任何硬體加速器上的任何模型且適用於各種環境,包含資料中心、公有雲、主權 AI 環境,抑或是最遙遠的邊緣端。

Red Hat 副總裁暨 AI 事業部總經理 Joe Fernandes 表示:「當企業將 AI 的應用規模從實驗階段擴展至生產環境時,將會面臨複雜性、成本與控管上新一波的挑戰。Red Hat AI 3 作為企業級開放原始碼平台,正是為了將上述障礙降至最低。我們藉由 llm-d 的分散式推論等創新功能為代理式 AI 奠定基石,IT 團隊得以更有自信地在任何基礎架構上,以自己的方式將新一代 AI 投入實際營運。」

從訓練到「執行」:企業 AI 推論的轉變

企業將 AI 舉措推向生產環境後,其重心將從模型的訓練與調校移轉至推論,亦即企業 AI 的「執行」階段。Red Hat AI 3 著重於可擴展且符合成本效益的推論能力,奠基於廣受好評的 vLLM 與 llm-d 社群專案,並結合 Red Hat 自身卓越的模型最佳化技術,為大型語言模型(LLM)提供生產環境級的服務。

為協助資訊長充分利用高價值硬體加速資源,Red Hat OpenShift AI 3.0 正式推出 llm-d,重新定義 LLM 在 Kubernetes 上的原生執行方式。llm-d 巧妙結合經驗證的 Kubernetes 調度價值與 vLLM 的卓越效能,實現智慧分散式推論,並結合多項關鍵開源技術,包括 Kubernetes Gateway API Inference Extension、NVIDIA Dynamo 低延遲資料傳輸函式庫(NIXL),以及 DeepEP Mixture of Experts(MoE)通訊函式庫,賦予企業:

  • 利用分散式服務降低成本、提升效率,實現更高的每美元效能。
  • 採用專為 AI 工作負載的多變特性而設計的智慧推論感知(inference-aware)負載平衡器,有效改善回應時間與延遲。
  • 藉由預定的「Well-lit Paths」簡化於 Kubernetes 上大規模部署模型的流程,實現簡易營運與最高可靠性。
  • 透過跨平台支援,在不同的硬體加速器(包括 NVIDIA 與 AMD)上部署 LLM 推論,最大化靈活性。

llm-d 以 vLLM 為基礎擴展,將其從單節點的高效能推論引擎,進化為分散式、一致且可擴展的服務系統,專門協助企業達成可預測的效能、可衡量的投資報酬率(ROI),並規劃更有效的基礎架構。所有強化功能皆為因應處理高度變動的 LLM 工作負載,以及如混合專家模型(Mixture-of-Experts,MoE)等巨型模型的挑戰而設計。

統一平台,實現協作式 AI

Red Hat AI 3 提供統一彈性體驗,專為生產環境中生成式 AI 解決方案的協作需求打造。其設計旨在透過促進團隊協作與統一工作流程,並為企業創造實質價值。平台工程師和 AI 工程師可藉由 Red Hat AI 3 這個單一平台執行 AI 策略。新功能著重於提升從概念驗證擴展至生產環境所需的生產力與效率。

  • 模型即服務(Model as a Service,MaaS)功能奠基於分散式推論之上,IT 團隊能作為企業自己的 MaaS 供應商,集中管理常用模型並為 AI 開發者與 AI 應用程式提供依據需求(on-demand)存取服務。上述功能不僅有助於成本控管,亦能應對因隱私權或資料安全顧慮而無法在公有 AI 服務上執行的應用情境。
  • 平台工程師可透過 AI 中心(AI Hub)探索、部署與管理基礎 AI 資產,其提供內含模型精選目錄(curated catalog)的集中式管理中心,涵蓋經驗證與最佳化的生成式 AI 模型、模型生命週期管理登錄檔,以及可配置與監控運行於 OpenShift AI 上所有 AI 資產的部署環境。
  • 生成式 AI 工作室(gen AI Studio)為 AI 工程師打造動手實作的環境,在此能與模型互動並加速生成式 AI 應用程式的原型開發。透過 AI assets endpoint 功能,工程師能輕鬆探索與使用可用的模型與 MCP 伺服器(用以簡化模型與外部工具的整合流程)。內建的 playground 則提供互動式且無狀態(stateless)的環境,可用於模型實驗、提示詞(prompts)測試與參數微調,支援如對話(chat)與檢索增強生成(RAG)等應用場景。
  • Red Hat AI 3 亦同步整合全新且經 Red Hat 驗證與最佳化的模型以簡化開發流程。精選內容包括如 OpenAI 的 gpt-oss、DeepSeek-R1 等受歡迎的開源模型,以及 Whisper(語音轉文字)和 Voxtral Mini(用於語音代理)等專業模型。

為新一代 AI 代理(AI agents)奠定基石

AI 代理即將顛覆應用程式的建構方式,其複雜的自動化工作流程將對推論能力帶來嚴苛的要求。Red Hat OpenShift AI 3.0 版本不僅強化推論能力,更帶來專注於代理管理的新版或強化功能,持續為可擴展的代理式 AI 系統奠定穩固基礎。

為加速代理的建立與部署,Red Hat 推出基於 Llama Stack 的統一應用程式介面層,助力讓開發流程與 OpenAI 等業界標準保持一致。此外,為提倡更開放、更具互通性的生態系,Red Hat 已率先採用模型上下文協定(Model Context Protocol,MCP),此強大的新興標準能簡化 AI 模型與外部工具的互動方式,是現代 AI 代理不可或缺的基礎功能。

Red Hat AI 3 引入以既有的 InstructLab 功能所打造、模組化且可擴充的全新模型客製化工具組。開發者可藉由專用的 Python 函式庫獲得更大的靈活性及掌控度。此工具組是由多項開源專案驅動,其中包括用於資料處理的 Docling,可將非結構化文件轉換為 AI 模型可讀取的格式,大幅簡化資料匯入流程。此外,該工具組亦支援用於合成資料生成的彈性框架,以及用於 LLM 微調的訓練中心。AI 工程師可透過整合的評估中心(evaluation hub)監測並驗證訓練成果,協助企業有自信地運用專有資料,以獲得更準確且更具相關性的 AI 成果。

標籤: AI創新RedHatRedHatAI3分散式AI混合雲AI生成式AI
上一篇文章

思科AI調查:AI 就緒企業領先同業實現價值

下一篇文章

HPE Discover More AI Taipei 2025:以AI、混合雲與網路技術加速台灣企業轉型

相關文章

Akamai 宣布併購 WebAssembly Serverless 技術公司 Fermyon
新聞速寫

Akamai 宣布併購 WebAssembly Serverless 技術公司 Fermyon

2025-12-04
AIHPCcon超算年會延續「以算力驅動AI發展」的主軸,下午場由台智雲與臺南市政府主辦,以「AI City」為題,呈現城市級AI布局。
新聞速寫

擘劃永續AI City!台智雲與臺南市府共創智慧城市新典範

2025-12-04
Openfind ai 落地企業實務,網擎資訊協助客戶效率與安全雙升級
新聞速寫

AI 落地企業實務,網擎資訊協助客戶效率與安全雙升級

2025-12-04
下一篇文章
HPE舉辦HPE Discover More AI Taipei 2025,HPE台灣暨香港董事長王嘉昇在主題演講中,深入闡述AI、雲端、邊緣運算與資料的整合發展趨勢。

HPE Discover More AI Taipei 2025:以AI、混合雲與網路技術加速台灣企業轉型

追蹤我們的 Facebook

近期文章

  • 2025 醫療科技展秀 AI 四大應用領域與多元機器人
  • 安碁資訊導入 Agentic AI 應戰資安「秒級」攻擊
  • AI 攻防與量子倒數  Secure-by-Design 成全球供應鏈新門檻
  • 2025 駭客手法升級五大趨勢
  • Akamai 宣布併購 WebAssembly Serverless 技術公司 Fermyon

📈 CIO點閱文章週排行

  • ◤ 慧榮科技為迎接AI時代的長期挑戰,斥資四十億元打造竹北高鐵營運總部,全新機房升級計畫首度曝光。

    慧榮科技攜手擎普打造混合散熱新機房 卡位未來十年AI決戰力 

    0 分享
    分享 0 Tweet 0
  • AI 促成記憶體大漲,台灣可以抓那些機會?

    0 分享
    分享 0 Tweet 0
  • 2025-2026 CISO Insight 資安調查報告

    0 分享
    分享 0 Tweet 0
  • 啟動大型主機現代化 首選 Rocket Enterprise Solutions

    0 分享
    分享 0 Tweet 0
  • 資安雙面刃 生成式 AI 三大風險與機會

    0 分享
    分享 0 Tweet 0
  • 國防預算轉型:實現軍民深度整合的策略

    0 分享
    分享 0 Tweet 0
  • 【全支付盜刷事件】你需要知道:偽冒釣魚如何發生、該如何判斷與應對

    0 分享
    分享 0 Tweet 0
  • 台積電頒發 30 家優良供應商 建廠安全首列獨立獎項

    0 分享
    分享 0 Tweet 0
  • 【影】量子×超算成全球趨勢  IT 架構面臨下一波典範轉移

    0 分享
    分享 0 Tweet 0
  • AI 時代的永續發展指南:企業部署 AI 應考量的五大關鍵思維

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

12006301201

南市府與台智雲打造 AI City 深化智慧治理與賦能產業數位

文/鄭宜芬 臺南市政府、數發部數產署與華碩集團旗下台智雲 2 日共同主辦「202

12006301120

先試用後採購 數發部 TryAI 平台明年將本土 AI 上架共契

文/鄭宜芬 為協助公務機關導入 AI 時面臨「不敢用、成本高、應用少」的三大痛點

I173d11 1

【專訪】勤業眾信資深執行副總經理簡宏偉

CISO 角色升級 強化韌性重要推手 然面對日益複雜的外部環境,數位轉型已成為不

文章至頂圖 02

迎戰 AI 與量子風險 預算是主力配置

2025-2026 CISO Insight 資安調查解析-2 AI 武器化掀起

Club Med 的人本 AI 賦能員工

透過「Happy Digital」策略,這家全包式旅遊巨頭如何讓 AI 成為營收

文章至頂圖 01 1

資安雙面刃 生成式 AI 三大風險與機會

2025-2026 CISO Insight資安調查解析-1 生成式 AI 正改

12006301127

台積電頒發 30 家優良供應商 建廠安全首列獨立獎項

文/鄭宜芬 台積電 25 日舉辦 2025 年供應鏈管理論壇,公布 30 家優良

120063010241

2025 醫療科技展秀 AI 四大應用領域與多元機器人

文/鄭宜芬 台灣醫療科技展 12 月 4 日在臺北登場,集結全臺指標醫院、科技、

1200630

生成式 AI 重塑金融服務 邁向自主決策

生成式 AI、區塊鏈與 AI 代理改寫金融營運模式,從保險核保、資產管理到風控防

Ciotaiwan logo 600 white

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音