• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 新聞速寫

Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

2025-05-27
分類 : 新聞速寫
0
A A
0
Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

文/Red Hat

世界領先開放原始碼軟體解決方案供應商 Red Hat 今日宣布推出 Red Hat AI Inference Server,邁出生成式 AI(gen AI)普及至混合雲的重要一步。作為 Red Hat AI 的全新企業級推論伺服器,此解決方案不僅源自於強大的 vLLM 社群專案,更透過 Red Hat 整合 Neural Magic 技術加以強化,提供更快的速度、更高的加速器效率與更佳的成本效益,促進實現 Red Hat 的願景,亦即能於任何雲端環境、任何 AI 加速器上執行各種生成式 AI 模型。無論是獨立部署,或是作為 Red Hat Enterprise Linux AI(RHEL AI)及 Red Hat OpenShift AI 的整合元件,此突破性平台賦能企業能更自信地在生產環境中部署與擴展生成式 AI。

推論(Inference)是 AI 的關鍵執行引擎,預先訓練模型得以借助此步驟將資料轉化為實際影響的結果。推論作為使用者互動的樞紐,需要迅速且準確的回應。隨著生成式 AI 模型日益複雜,加上生產環境部署規模擴增,推論可能成為一大瓶頸,不僅會消耗大量硬體資源,更可能導致回應速度遲緩並提升營運成本。為了大規模釋放 AI 真正的潛力,並且更從容地應對其潛在的複雜性,強大的推論伺服器已不再是奢侈品,而是必要條件。

為應對上述挑戰,Red Hat 全新推出 Red Hat AI Inference Server,該開放式推論解決方案是專為高效能設計,並搭配頂尖的模型壓縮(model compression)與最佳化工具。此創新能提供反應更加靈敏的使用者體驗,同時企業在選擇 AI 加速器、模型及 IT 環境時得以享有前所未有的自由度,進而充分釋放生成式 AI 的轉型動能。

Red Hat 副總裁暨AI 事業部總經理 Joe Fernandes 表示:「推論是生成式 AI 真正展現價值的地方,在這個階段,特定的模型能為使用者互動提供快速、準確的回應,但這個過程必須以有效且具成本效益的方式實現。Red Hat AI Inference Server 旨在滿足大規模、高效能、高回應性推論的需求,同時維持低資源耗用,進而提供通用推論層,支援在任何環境、任何加速器上執行的任何模型。」

vLLM:擴充推論創新

Red Hat AI Inference Server 是建置於引領業界的 vLLM 專案之上。此社群專案是由加州大學柏克萊分校於 2023 年中啟動,可提供高傳輸量的生成式 AI 推論、支援大型內容輸入、多 GPU 模型加速並支援連續批次處理等眾多功能。

vLLM 不僅廣泛支援公開可用的模型,更能從 Day 0 即整合 DeepSeek、Gemma、Llama、Mistral、Phi 等模型,以及開源企業級推理模型(reasoning models)如 Llama Nemotron,推動其成為未來 AI 推論創新的實質標準。頂尖模型的供應商正積極擁抱 vLLM,進一步鞏固 vLLM 在塑造生成式 AI 未來時扮演的關鍵角色。

標籤: Red HatvLLM推論生成式 AI
上一篇文章

展場亮點紀實|讓AI與光學為永續時尚把脈

下一篇文章

HPE與NVIDIA深化合作,強化在AI工廠產品組合上的整合

相關文章

1200630
新聞速寫

2025 Ansys Simulation World 台灣用戶技術大會開跑

2025-07-10
Lenovo宣布旗下多款搭載NVIDIA GeForce RTX 50系列顯示卡的電競筆電正式在台上市
新聞速寫

Lenovo 推出搭載NVIDIA RTX 50系列筆電陣容

2025-07-10
華碩宣布加入由國立臺灣大學電機資訊學院發起的「ai電資大聯盟」。
新聞速寫

扎根創新人才 華碩加入臺大AI 電資大聯盟

2025-07-10
下一篇文章

HPE與NVIDIA深化合作,強化在AI工廠產品組合上的整合

追蹤我們的 Facebook

近期文章

  • AI 企業應用的深層準備度
  • 黃彥男:資安是一切基礎 FIDO 專場揭示企業驗證轉型
  • 2025 Ansys Simulation World 台灣用戶技術大會開跑
  • Lenovo 推出搭載NVIDIA RTX 50系列筆電陣容
  • 扎根創新人才 華碩加入臺大AI 電資大聯盟

📈 CIO點閱文章週排行

  • 1200x630 I162d12

    【專訪】街口電子支付總經理范庭甄

    0 分享
    分享 0 Tweet 0
  • 【專訪】燁輝企業總經理張振武

    0 分享
    分享 0 Tweet 0
  • 黃彥男:資安是一切基礎 FIDO 專場揭示企業驗證轉型

    0 分享
    分享 0 Tweet 0
  • 健康台灣深耕計畫下的科技角色與挑戰

    0 分享
    分享 0 Tweet 0
  • 企業 AI 資源布局與應用情況

    0 分享
    分享 0 Tweet 0
  • 從原則邁向 IT 系統實踐之路(下)將個資保護 DNA,注入資通系統新生命

    0 分享
    分享 0 Tweet 0
  • NVIDIA 黃仁勳:代理式人工智慧(Agentic AI)引領產業變革,數位員工時代來臨

    0 分享
    分享 0 Tweet 0
  • 企業如何應對台灣加密監管升溫?

    0 分享
    分享 0 Tweet 0
  • 堅韌的台灣供應鏈

    0 分享
    分享 0 Tweet 0
  • 2025 CIO Insight 調查報告下載

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

1200 S 17317930

StarFab 攜手瑞穗銀行、JETRO 揭開新創快速搶攻日本市場指南!

國內指標性新創展覽 InnoVEX 2023 於5月30日至6月2日舉行,Sta

09 鄭樹發 A2a4414 1200a

建構廠內互聯環境 有助掌握生產狀態

雖​然智慧工廠是非常熱門的議題,不過許多傳統製造業仍然對引進新技術相當抗拒,最常

網頁文章首圖1200x630 (5) 拷貝

因應市場變化 阿瘦推動轉型有成

第七屆商業服務科技論壇 以「健康、舒適、美觀、創新」為理念,全力促進顧客足下與生

2024 Cio Insight Lenovo

Lenovo Truscale 一切即服務,解鎖企業創新能量

2024 CIO Insight 調查發表會 會後報導 Lenovo 悉心打造

遠東零售集團總部資深副總經理林幼玲

新冠肺炎延燒 加速數位轉型之路

文/林裕洋 新冠肺炎在全世界肆掠,最早爆發出疫情的中國,除復工時間、進度受到影響

◤ 是方電訊資深經理蔡銘鴻。

是方 AI 數據中心 助製造業打造 AI 私有雲

第十一屆製造業 CIO 論壇 台北場 會後報導 製造業在實踐 AI 技術時,必須

Ciotaiwan Logo 600 White

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音