• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 新聞速寫

Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

2025-05-27
分類 : 新聞速寫
0
A A
0
Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

文/Red Hat

世界領先開放原始碼軟體解決方案供應商 Red Hat 今日宣布推出 Red Hat AI Inference Server,邁出生成式 AI(gen AI)普及至混合雲的重要一步。作為 Red Hat AI 的全新企業級推論伺服器,此解決方案不僅源自於強大的 vLLM 社群專案,更透過 Red Hat 整合 Neural Magic 技術加以強化,提供更快的速度、更高的加速器效率與更佳的成本效益,促進實現 Red Hat 的願景,亦即能於任何雲端環境、任何 AI 加速器上執行各種生成式 AI 模型。無論是獨立部署,或是作為 Red Hat Enterprise Linux AI(RHEL AI)及 Red Hat OpenShift AI 的整合元件,此突破性平台賦能企業能更自信地在生產環境中部署與擴展生成式 AI。

推論(Inference)是 AI 的關鍵執行引擎,預先訓練模型得以借助此步驟將資料轉化為實際影響的結果。推論作為使用者互動的樞紐,需要迅速且準確的回應。隨著生成式 AI 模型日益複雜,加上生產環境部署規模擴增,推論可能成為一大瓶頸,不僅會消耗大量硬體資源,更可能導致回應速度遲緩並提升營運成本。為了大規模釋放 AI 真正的潛力,並且更從容地應對其潛在的複雜性,強大的推論伺服器已不再是奢侈品,而是必要條件。

為應對上述挑戰,Red Hat 全新推出 Red Hat AI Inference Server,該開放式推論解決方案是專為高效能設計,並搭配頂尖的模型壓縮(model compression)與最佳化工具。此創新能提供反應更加靈敏的使用者體驗,同時企業在選擇 AI 加速器、模型及 IT 環境時得以享有前所未有的自由度,進而充分釋放生成式 AI 的轉型動能。

Red Hat 副總裁暨AI 事業部總經理 Joe Fernandes 表示:「推論是生成式 AI 真正展現價值的地方,在這個階段,特定的模型能為使用者互動提供快速、準確的回應,但這個過程必須以有效且具成本效益的方式實現。Red Hat AI Inference Server 旨在滿足大規模、高效能、高回應性推論的需求,同時維持低資源耗用,進而提供通用推論層,支援在任何環境、任何加速器上執行的任何模型。」

vLLM:擴充推論創新

Red Hat AI Inference Server 是建置於引領業界的 vLLM 專案之上。此社群專案是由加州大學柏克萊分校於 2023 年中啟動,可提供高傳輸量的生成式 AI 推論、支援大型內容輸入、多 GPU 模型加速並支援連續批次處理等眾多功能。

vLLM 不僅廣泛支援公開可用的模型,更能從 Day 0 即整合 DeepSeek、Gemma、Llama、Mistral、Phi 等模型,以及開源企業級推理模型(reasoning models)如 Llama Nemotron,推動其成為未來 AI 推論創新的實質標準。頂尖模型的供應商正積極擁抱 vLLM,進一步鞏固 vLLM 在塑造生成式 AI 未來時扮演的關鍵角色。

標籤: Red HatvLLM推論生成式 AI
上一篇文章

展場亮點紀實|讓AI與光學為永續時尚把脈

下一篇文章

HPE與NVIDIA深化合作,強化在AI工廠產品組合上的整合

相關文章

華碩及旗下電競知名品牌 ROG玩家共和國宣布,於第 34 屆台灣精品獎一舉斬獲 23 項產品獎,名列全台企業之首。(圖後排左一為華碩顯示器事業部產品企劃處副處長林敬欣)
新聞速寫

橫掃 23 項大賞 華碩榮登台灣精品獎最大贏家

2025-11-28
台達亮相2025台北國際自動化工業大展
新聞速寫

趨勢科技將推出業界最完整的企業AI風險管理方案

2025-11-28
120063011288
新聞速寫

達梭 2025 SIMULIA 創新技術年會 以模擬創新技術驅動 AI 智慧研發

2025-11-28
下一篇文章

HPE與NVIDIA深化合作,強化在AI工廠產品組合上的整合

追蹤我們的 Facebook

近期文章

  • 資安雙面刃 生成式 AI 三大風險與機會
  • 從技術走向治理,CISO 重新定義資安責任邊界
  • 防範威脅三關鍵:零信任、韌性、IT/OT 防線
  • 供應鏈動搖企業防線 資安治理問責全面升級
  • 預算是迎戰 AI 與量子風險的主力配置

📈 CIO點閱文章週排行

  • I173s23webp

    優化人力與組織的 AI 轉型,7 大案例一次看明

    0 分享
    分享 0 Tweet 0
  • 硬體到底要怎麼選,才能「不花冤枉錢」?

    0 分享
    分享 0 Tweet 0
  • 藝術殿堂下的生命未來對話:亞洲大學「量子 AI 與生命未來」國際研討會的腦力激盪

    0 分享
    分享 0 Tweet 0
  • 個資法翻修:邁向獨立監管、統一治理

    0 分享
    分享 0 Tweet 0
  • 【專訪】數位發展部部長林宜敬

    0 分享
    分享 0 Tweet 0
  • 從防禦到誘敵,生成式對抗網路(GANs)驅動的資安新戰場

    0 分享
    分享 0 Tweet 0
  • 台積電頒發 30 家優良供應商 建廠安全首列獨立獎項

    0 分享
    分享 0 Tweet 0
  • 台灣邁向主權 AI 新紀元

    0 分享
    分享 0 Tweet 0
  • 企業 AI 應用成熟度

    0 分享
    分享 0 Tweet 0
  • 台灣量子電腦發展的國安級建言:從 Quantum Taiwan 2025 看見的契機與警訊

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

I172s20

AI 結合醫療資料,Absci 引領 AI 篩選藥物浪潮

為解決傳統藥物開發流程過長的痛點,Absci 運用超過百萬筆蛋白質資料訓練 AI

12006301127

台積電頒發 30 家優良供應商 建廠安全首列獨立獎項

文/鄭宜芬 台積電 25 日舉辦 2025 年供應鏈管理論壇,公布 30 家優良

120063011222

金融監理科技 2025 高峰論壇:穩定幣與監理科技共同推進臺灣金融新架構

文/鄭宜芬 「金融監理科技高峰論壇」日前於台北盛大舉行。吸引產官學界金融領域專業

1200630

臺灣智慧醫療學校 11/19上線 培訓四大 CMIO 職能

文/鄭宜芬 為了培育跨越臨床與科技的關鍵人才,衛生福利部資訊處推動國內首個專為醫

12006301105

【編輯室札記】資安產業的另類發展蹊徑

總主筆/施鑫澤‧刊期/2025.11 在一場聚集國內資安長的晚會中,與若干資安長

I173s09 (1)

台灣邁向主權 AI 新紀元

文/謝介壽 台灣從行政院「AI 新十大建設」到總統 2025 年雙十演說「全球前

I172s05 2

Clorox 數位轉型,重塑企業科技骨幹的挑戰與策略

從遺留系統到 AI 前沿:Clorox 案例揭示 IT 領導者必須面對的架構現代

文章至頂圖 04 1

防範威脅三關鍵:零信任、韌性、IT/OT 防線

2025-2026 CISO Insight資安調查解析-4 組織面臨的威脅態勢

國際量子人工智慧與生命未來研討會

藝術殿堂下的生命未來對話:亞洲大學「量子 AI 與生命未來」國際研討會的腦力激盪

文/黃光彩 在莊嚴優雅的亞洲大學美術館(Asia University Muse

Ciotaiwan logo 600 white

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音