• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 新聞速寫

Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

2025-05-27
分類 : 新聞速寫
0
A A
0
Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

文/Red Hat

世界領先開放原始碼軟體解決方案供應商 Red Hat 今日宣布推出 Red Hat AI Inference Server,邁出生成式 AI(gen AI)普及至混合雲的重要一步。作為 Red Hat AI 的全新企業級推論伺服器,此解決方案不僅源自於強大的 vLLM 社群專案,更透過 Red Hat 整合 Neural Magic 技術加以強化,提供更快的速度、更高的加速器效率與更佳的成本效益,促進實現 Red Hat 的願景,亦即能於任何雲端環境、任何 AI 加速器上執行各種生成式 AI 模型。無論是獨立部署,或是作為 Red Hat Enterprise Linux AI(RHEL AI)及 Red Hat OpenShift AI 的整合元件,此突破性平台賦能企業能更自信地在生產環境中部署與擴展生成式 AI。

推論(Inference)是 AI 的關鍵執行引擎,預先訓練模型得以借助此步驟將資料轉化為實際影響的結果。推論作為使用者互動的樞紐,需要迅速且準確的回應。隨著生成式 AI 模型日益複雜,加上生產環境部署規模擴增,推論可能成為一大瓶頸,不僅會消耗大量硬體資源,更可能導致回應速度遲緩並提升營運成本。為了大規模釋放 AI 真正的潛力,並且更從容地應對其潛在的複雜性,強大的推論伺服器已不再是奢侈品,而是必要條件。

為應對上述挑戰,Red Hat 全新推出 Red Hat AI Inference Server,該開放式推論解決方案是專為高效能設計,並搭配頂尖的模型壓縮(model compression)與最佳化工具。此創新能提供反應更加靈敏的使用者體驗,同時企業在選擇 AI 加速器、模型及 IT 環境時得以享有前所未有的自由度,進而充分釋放生成式 AI 的轉型動能。

Red Hat 副總裁暨AI 事業部總經理 Joe Fernandes 表示:「推論是生成式 AI 真正展現價值的地方,在這個階段,特定的模型能為使用者互動提供快速、準確的回應,但這個過程必須以有效且具成本效益的方式實現。Red Hat AI Inference Server 旨在滿足大規模、高效能、高回應性推論的需求,同時維持低資源耗用,進而提供通用推論層,支援在任何環境、任何加速器上執行的任何模型。」

vLLM:擴充推論創新

Red Hat AI Inference Server 是建置於引領業界的 vLLM 專案之上。此社群專案是由加州大學柏克萊分校於 2023 年中啟動,可提供高傳輸量的生成式 AI 推論、支援大型內容輸入、多 GPU 模型加速並支援連續批次處理等眾多功能。

vLLM 不僅廣泛支援公開可用的模型,更能從 Day 0 即整合 DeepSeek、Gemma、Llama、Mistral、Phi 等模型,以及開源企業級推理模型(reasoning models)如 Llama Nemotron,推動其成為未來 AI 推論創新的實質標準。頂尖模型的供應商正積極擁抱 vLLM,進一步鞏固 vLLM 在塑造生成式 AI 未來時扮演的關鍵角色。

標籤: Red HatvLLM推論生成式 AI
上一篇文章

展場亮點紀實|讓AI與光學為永續時尚把脈

下一篇文章

HPE與NVIDIA深化合作,強化在AI工廠產品組合上的整合

相關文章

Ciotaiwan logo black
新聞速寫

安國將於OCP展示最新Arm架構CPU Mobius100 (CSS V3)8核心模擬平台

2025-10-13
12006301013
新聞速寫

英特爾公布Panther Lake架構 首款採用18A製程打造的AI PC平台

2025-10-13
Logitech近日宣布在台推出全新「Logitech MX Master 4 無線滑鼠」,與全球同步發售
新聞速寫

經典再進化!Logitech MX Master 4 無線滑鼠 全球同步發售

2025-10-13
下一篇文章

HPE與NVIDIA深化合作,強化在AI工廠產品組合上的整合

追蹤我們的 Facebook

近期文章

  • SentinelOne 融合 AI重新定義智慧 SOC
  • HCL AppScan 三位一體技術 重新定義源碼檢測
  • HPE Aruba Networking Central 落實零信任
  • 克服 AI 應用四大挑戰,Cloudflare 節點遍佈全球
  • Synology PB 級伺服器專為 AI 巨量資料設計

📈 CIO點閱文章週排行

  • I171s07

    生成式 AI 標準化根因分析

    0 分享
    分享 0 Tweet 0
  • 【專訪】櫻花集團總經理李惠恂

    0 分享
    分享 0 Tweet 0
  • 跨越 AI 鴻溝:影子 AI 與超級使用者

    0 分享
    分享 0 Tweet 0
  • 【專訪】數位發展部資通安全署署長蔡福隆

    0 分享
    分享 0 Tweet 0
  • 量子 AI 將會開發每個人的無限潛力

    0 分享
    分享 0 Tweet 0
  • 英特爾公布Panther Lake架構 首款採用18A製程打造的AI PC平台

    0 分享
    分享 0 Tweet 0
  • 透過 ISO 42001 規範進行 AI 與 Data 治理

    0 分享
    分享 0 Tweet 0
  • 【汽車製造】Bentley Motors 智能引擎驅動奢華

    0 分享
    分享 0 Tweet 0
  • 如映 CyberEyes 平台助肯驛國際轉型成功,強化市場競爭力

    0 分享
    分享 0 Tweet 0
  • 智慧機器人應用 SIG 成立 臺南整合產官學研共推 AI 機器人聚落

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

【高科技業】AI 強化的影片展示 為B2B 帶來更強大的轉型動力

本文將深入探討 AI 強化影片內容如何革新 B2B 產品展示的模式,說明其帶來的

1200630

【編輯室札記】實務階段的 AI 預算樣貌

總主筆/施鑫澤 十月到了!一般機關或者企業多半在十月進行來年的預算提報與討論,相

1200630

智慧機器人應用 SIG 成立 臺南整合產官學研共推 AI 機器人聚落

文/鄭宜芬 行政院今年 6 月宣布「智慧機器人產業推動方案」,臺南市政府積極串聯

120063010031

【專訪】數位發展部資通安全署署長蔡福隆

國家級防護戰略 落實全社會資安韌性 數位發展部資通安全署自 2022 年成立以來

12006301003

Fast-ID 驗轉中心上線 7 家銀行啟用跨機構身份驗證

文/鄭宜芬 金融監督管理委員會偕同金融行動身分識別聯盟(金融Fast-ID聯盟)

I171d08

將營業秘密保護內化為企業 DNA

文/蕭奕弘 台積電近期爆發的員工洩密案,再次突顯營業秘密保護的重要性。對於 CI

I172y02

【專訪】櫻花集團總經理李惠恂

產品與服務雙軌 AI 化 智慧廚衛新模式 不同於一般的傳統製造業,櫻花集團定位為

銀行發行穩定幣與託管的下一步:AI、合規與金融基礎建設的新篇章

文/蔡孟凌 過去幾年,我們可以看到全球金融產業對「穩定幣」(Stablecoin

12006300925

行銷自動化新階段 李宏毅談 Agentic AI 轉型價值

文/鄭宜芬 Agentic AI 將目標轉化為可執行的自主式應用與自動化工作流程

Ciotaiwan logo 600 white

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音