• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 新聞速寫

Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

2025-05-27
分類 : 新聞速寫
0
A A
0
Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

Red Hat 推出 Red Hat AI Inference Server,為跨混合雲的模型與加速器釋放生成式 AI 潛力

文/Red Hat

世界領先開放原始碼軟體解決方案供應商 Red Hat 今日宣布推出 Red Hat AI Inference Server,邁出生成式 AI(gen AI)普及至混合雲的重要一步。作為 Red Hat AI 的全新企業級推論伺服器,此解決方案不僅源自於強大的 vLLM 社群專案,更透過 Red Hat 整合 Neural Magic 技術加以強化,提供更快的速度、更高的加速器效率與更佳的成本效益,促進實現 Red Hat 的願景,亦即能於任何雲端環境、任何 AI 加速器上執行各種生成式 AI 模型。無論是獨立部署,或是作為 Red Hat Enterprise Linux AI(RHEL AI)及 Red Hat OpenShift AI 的整合元件,此突破性平台賦能企業能更自信地在生產環境中部署與擴展生成式 AI。

推論(Inference)是 AI 的關鍵執行引擎,預先訓練模型得以借助此步驟將資料轉化為實際影響的結果。推論作為使用者互動的樞紐,需要迅速且準確的回應。隨著生成式 AI 模型日益複雜,加上生產環境部署規模擴增,推論可能成為一大瓶頸,不僅會消耗大量硬體資源,更可能導致回應速度遲緩並提升營運成本。為了大規模釋放 AI 真正的潛力,並且更從容地應對其潛在的複雜性,強大的推論伺服器已不再是奢侈品,而是必要條件。

為應對上述挑戰,Red Hat 全新推出 Red Hat AI Inference Server,該開放式推論解決方案是專為高效能設計,並搭配頂尖的模型壓縮(model compression)與最佳化工具。此創新能提供反應更加靈敏的使用者體驗,同時企業在選擇 AI 加速器、模型及 IT 環境時得以享有前所未有的自由度,進而充分釋放生成式 AI 的轉型動能。

Red Hat 副總裁暨AI 事業部總經理 Joe Fernandes 表示:「推論是生成式 AI 真正展現價值的地方,在這個階段,特定的模型能為使用者互動提供快速、準確的回應,但這個過程必須以有效且具成本效益的方式實現。Red Hat AI Inference Server 旨在滿足大規模、高效能、高回應性推論的需求,同時維持低資源耗用,進而提供通用推論層,支援在任何環境、任何加速器上執行的任何模型。」

vLLM:擴充推論創新

Red Hat AI Inference Server 是建置於引領業界的 vLLM 專案之上。此社群專案是由加州大學柏克萊分校於 2023 年中啟動,可提供高傳輸量的生成式 AI 推論、支援大型內容輸入、多 GPU 模型加速並支援連續批次處理等眾多功能。

vLLM 不僅廣泛支援公開可用的模型,更能從 Day 0 即整合 DeepSeek、Gemma、Llama、Mistral、Phi 等模型,以及開源企業級推理模型(reasoning models)如 Llama Nemotron,推動其成為未來 AI 推論創新的實質標準。頂尖模型的供應商正積極擁抱 vLLM,進一步鞏固 vLLM 在塑造生成式 AI 未來時扮演的關鍵角色。

標籤: Red HatvLLM推論生成式 AI
上一篇文章

展場亮點紀實|讓AI與光學為永續時尚把脈

下一篇文章

HPE與NVIDIA深化合作,強化在AI工廠產品組合上的整合

相關文章

華碩商用電腦以38.6%市佔蟬聯2025年第二季台灣市佔冠軍!
新聞速寫

華碩商用市佔冠軍!領航AI時代 以資安與高效驅動企業升級

2025-08-26
WithSecure率先突破零日偵測技術 EDR行為資料導入曝險管理,助企業主動防禦未知威脅
新聞速寫

WithSecure率先突破零日偵測技術

2025-08-26
華碩集團旗下宇碩電子通過ISO 26262 2018國際道路車輛功能安全標準流程驗證,具備完整安全需求的開發技術能力
新聞速寫

宇碩電子通過SGS_ISO 26262:2018 驗證 鞏固車用電子領導地位

2025-08-26
下一篇文章

HPE與NVIDIA深化合作,強化在AI工廠產品組合上的整合

追蹤我們的 Facebook

近期文章

  • 華碩商用市佔冠軍!領航AI時代 以資安與高效驅動企業升級
  • 虛擬資產的監理與安全
  • WithSecure率先突破零日偵測技術
  • 宇碩電子通過SGS_ISO 26262:2018 驗證 鞏固車用電子領導地位
  • Apex One 零日漏洞持續遭利用,中芯數據 MTH 服務驗證超前防禦

📈 CIO點閱文章週排行

  • I170d17

    擔心採用雲端 LLM 翻船,地端 LLM 建置成希望

    0 分享
    分享 0 Tweet 0
  • 有效的防火牆管理

    0 分享
    分享 0 Tweet 0
  • 【專訪】南仁湖集團資訊部經理劉哲宇

    0 分享
    分享 0 Tweet 0
  • 7 大容器安全一把抓!別讓容器成為駭客下一個易下手目標

    0 分享
    分享 0 Tweet 0
  • AI 轉型下的企業如何拆解人才難題?

    0 分享
    分享 0 Tweet 0
  • 資料品質已成為企業資料治理與關鍵決策的重心

    0 分享
    分享 0 Tweet 0
  • 邁向個資保護新時代

    0 分享
    分享 0 Tweet 0
  • 資安署攜衛福部四策略強化醫界防護 資安將納醫院評鑑

    0 分享
    分享 0 Tweet 0
  • 數發部部長黃彥男借調期滿 請辭歸建中央研究院

    0 分享
    分享 0 Tweet 0
  • NVIDIA 黃仁勳:代理式人工智慧(Agentic AI)引領產業變革,數位員工時代來臨

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

I170s09

綠色金融科技新創加速打開淨零大門

文/劉彥岑(財團法人資訊工業策進會 數轉院 金融科技中心 規劃師) 隨著企業和投

1200630

HITCON 2025 啟動資安韌性新時代 打造國際交流盛典

文/鄭宜芬 今年 HITCON 2025(台灣駭客年會)聚焦 Cyber Res

I170s14 1

金融業與科技業加速佈局虛擬資產

文/蔡孟凌 近年來虛擬資產市場蓬勃發展,傳統金融機構、科技公司乃至新創企業紛紛投

I170s03

AI 轉型下的企業如何拆解人才難題?

文/王義智 從 Shopify 「AI Baseline」到 Google「體面

1200630

【專訪】聯華電子資深副總經理暨資安長吳宗賢

資安為雙軸轉型奠基 點亮晶圓代工燈塔 聯電導入工業 4.0 技術,2025 年入

I170s04 1

川普2.0來襲:長期韌性、短期彈性的供應鏈新趨勢

對等關稅政策正衝擊全球經濟發展,面對地緣政治、貿易壁壘等挑戰,臺灣製造業在佈局全

圖三

新創總會與台灣資安大聯盟 攜手打造雙向資安合作平台

文/鄭宜芬 全國創新創業總會(簡稱新創總會)與台灣資安大聯盟正式結盟,宣示雙方攜

I170s11

有效的防火牆管理

常見的防火牆規則管理錯誤與最佳實務! 文/屠震 防火牆可以阻擋非法的入侵,透過防

I170d04

CQL 系列報導 ─ 探討 CQL 的架構與運作原理

口述/孫培然·彙整/CIO編輯室 接下來要探討的是 CQL(Clinical Q

Ciotaiwan Logo 600 White

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音