• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 精選文章

AI 民主化跨大步,解析低成本 AI 模型背後的創新

2025-03-04
分類 : 精選文章
0
A A
0
Ai 民主化跨大步,解析低成本 ai 模型背後的創新

在 AI 界一飛沖天的中國新型 AI 模型 DeepSeek,透過像是模型蒸餾、監督式微調、強化學習等一連串降低資源消耗與相關成本的技術,竟然贏得了「AI 民主化賦能者」的名聲。

編譯/酷魯


當前全球正關注中國某對沖基金開發的 DeepSeek,其效能表現不僅可與 Open AI 當紅 AI 模型相提並論,而且定價估計比 OpenAI 便宜 20 至 40 倍,不僅讓過去預算有限的小型公司也能開始擁抱 GenAI,同時一舉衝上 Apple 應用商店免費下載排行榜第一名。以下就讓我們一同探究該模型火紅與創新背後的秘密武器為何。

內容目錄 隱藏
監督式微調、兩階段強化學習與模型蒸餾的完美整合
破解創新 AI 模型正反兩面的質疑與迷思
創新關鍵全在強化學習,未來焦點全面轉向 AI 的有效擴展
開放 AI 模型將遍地開花

監督式微調、兩階段強化學習與模型蒸餾的完美整合

DeepSeek 同時整合了監督式微調(Supervised Fine-Tuning,SFT)與強化學習(Reinforcement Learning,RL)技術。其令人矚目的創新訓練方法,是先在初始階段進行冷啟動(Cold-Start)微調,然後採取推理導向的第一次強化學習,最後進行監督式微調與第二次的強化學習,透過兩階段強化學習,能夠優化模型兼顧推理能力提升與兼顧人類偏好的整體表現。

[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]

這家中國 AI 新創開源了多個蒸餾(Distillation)模型,展現了蒸餾 R1 知識至開放原始碼模型的強大潛力。該模型先訓練大型教師產生的軟標註(Soft Label),然後再用軟標註來訓練小型的學生網路,在有效降低計算量的同時,並保持高效能與精準度。

除此之外,為了提升推理能力,該模型還採用了群體相對政策優化(Group Relative Policy Optimization,GRPO)的 RL 演算法,在不依賴評論器(Critic)的設計下能有效簡化計算,並透過相對獎勵機制,實現高精準的推理結果。

破解創新 AI 模型正反兩面的質疑與迷思

DeepSeek 熱潮持續延燒,激情過後業界也開始冷靜審視與討論其創新背後的疑問與迷思:

  1. 遭到抄襲、侵權的指控
    OpenAI 指控 DeepSeek 竊取其智財權,並表示有證據顯示該公司利用 GPT 模型來訓練自家 AI。此外並指控,該模型是經資料蒸餾才訓練出來的。事實上,蒸餾技術是 AI 界降低成本的常見做法,而且該技術只是這款模型採用的技術之一,其創新之處在於它還整合了強化學習等多種技術。由於 OpenAI 本身並沒有取得相關 AI 專利,而且美國法界認為 AI 生成內容不能享有著作權,侵權指控似乎很難成立。
  2. 其為完全開放原始碼的模型
    DeepSeek 的成功被視為開放原始碼 AI 戰勝封閉式 AI 的象徵。但 R1 並不完全符合公認的開放原始碼定義,因為必須提供用於訓練 AI 資料細節的存取權、用於構建和運行 AI 的完整程式碼,以及訓練過程中的設定與權重,對此 R1 並未公開。
  3. 可能會有額外的安全隱私風險
    人們會因為該新創公司擁有中國背景而有安全隱私方面顧慮,而且其會將使用者資料回傳,但這個問題可說是當前 AI 模型極待解決的通病,因為其他 LLM 一樣會對隱私與安全造成同樣的風險。
  4. 美國出口管制無效
    DeepSeek 的技術突破被視為美國出口管制的意外結果,因為該中國新創被迫在算力受限的情況下,尋找更高效的 AI 訓練方法。但 AI 政策專家 Miles Brundage 指出,出口管制仍可能拖慢中國運行更多 AI 實驗和構建 AI 代理(AI agent)的腳步。其創新並不意味著不需要更多 GPU,這也不代表他們能像擁有更大算力的 OpenAI 那樣,迅速從 o1 躍升至 o3 或 o5。
  5. 其對 Nvidia 構成嚴重威脅
    微軟執行長納德拉(Satya Nadella)在 X 上推文指出,與直覺相反的,該 AI 模型的影響反而會增加對高階 GPU 的需求,因為傑文斯悖論(Jevons paradox)效應會在背後發揮作用。
  6. AGI 即將到來?
    儘管 R1 標誌著 AI 競賽中的一個關鍵轉折點,但該新創公司並未達成全新的技術突破。紐約大學教授兼 AI 專家 Gary Marcus 表示,要達到 AGI 可能還需要五到六次的重大突破,而率先推動這些突破的企業或國家,最終可能會勝出。

創新關鍵全在強化學習,未來焦點全面轉向 AI 的有效擴展

「深入研究 DeepSeek 的技術核心,可以看出其關鍵在於 RL 強化學習及其應用方式,」IDC 全球 AI、自動化、資料與分析研究部門集團副總裁兼總經理 Ritu Jyoti 表示。「大多數語言模型都採用預訓練、監督式微調,最後再透過 RL 進一步優化。然而,DeepSeek 的方法顯示,LLM 僅憑 RL 就能展現推理能力。」

DeepSeek-R1 是基於 V3 此一基礎模型開發的新開放權重(Open-Weight) LLM。而 DeepSeek-R1-Zero 則是一個完全透過強 RL 訓練的階段性模型。根據 Gartner 的分析,這顯示出模型供應商可以擁有透過純 RL 訓練數學與程式設計等特定領域的能力。

然而,Gartner 研究人員指出,DeepSeek 並不代表新的模型典範。反而,它是基於現有 LLM 訓練架構,對技術與架構進行分層優化,使訓練與推理更高效。此外,該模型也沒有為模型效能建立新的技術水準。Gartner 研究人員補充表示,其雖能與現有最先進模型相匹配,但並未超越它們。他們還表示,該模型並不能證明透過額外運算資源與資料來擴展模型是無關緊要的。相反地,它表明了擴展更有效的模型是值得的。

[ 推薦閱讀:myLLM Studio:AI Agent 雲地整合系統核心模組 ]

「R1 的推理成本遠較 OpenAI o1 預覽版模型來得更低,實與 LLM 模型層更廣泛的商品化密切相關,」他們寫道。「AI 的效率已不再取決於每符元(Token)成本,」研究人員補充道。「而是關於哪個模型能在不影響準確性與延遲的情況下,以最低成本進行推理。因此,未來的焦點將很快轉向 AI 的有效擴展,而不在於組建多少運算資源來訓練模型。」

開放 AI 模型將遍地開花

可以預見的是,DeepSeek 會在以下幾個層面造成影響:

  1. 成本面:由於該模型只需以往傳統模型所花成本的一小部分就能實現高效能,因而能有效降低先進 AI 模型的開發與部署門檻。但 Gartner 研究人員指出,最先進的新模型仍將需要高昂的研發與運算成本,並最終轉嫁至早期採用者身上。
  2. 市場面:過去少數超大規模業者壟斷的局面已被打破,會有更多中小型企業加入開發行列。Gartner 研究人員指出,在 DeepSeek 發布後,包括 Meta 在內的其他模型開發商已開始制定應對策略。
  3. 開放面:中國 AI 新創選擇將其模型以開放權重形式發布,使開發者和研究人員能夠自由存取與改進其技術。這種開放性有助於促進 AI 社群的合作,加速 AI 技術的發展與應用。
  4. 策略面:由於高效能 AI 可以在更少資料、更低成本下實現,CIO 們可能需要重新評估 AI 策略,這部分會在下一章節深入討論,在此不予贅述。
  5. 安全面:由於該模型來自中國,可能引發資料隱私與安全方面的顧慮。這部分會在之後章節深入討論,在此不予贅述。
  6. 維運面:Forrester 分析師團隊指出,CIO 們莫不認為中國最新模型會影響邊緣運算、AIOps(人工智慧營運)以及 IT 維運。當 LLM 在邊緣裝置上運行時,AIOps 和可觀測性(Observability)可達到新的即時洞察力與自動化水準。

(本文授權非營利轉載,請註明出處:CIO Taiwan)

標籤: AIDeepSeekLLM人工智慧
上一篇文章

當 ESG 遇上 AI

下一篇文章

凌羣電腦與HPE合力推NeuroChain 助臺灣產業升級轉型

相關文章

I172s03b
精選文章

企業 AI 預算規劃的方法論與實戰策略

2025-10-30
I172s03c
精選文章

頂尖 CIO 如何規劃 AI 預算取得成功?

2025-10-23
I172s18
精選文章

提示工程已死!情境工程成為 GenAI 新顯學

2025-10-22
下一篇文章
◤ 凌羣電腦總經理劉瑞隆(左)、HPE經銷夥伴事業處標準運算系統暨數位銷售事業處副總經理郭裕昇(右)表示,凌羣電腦、HPE將攜手推廣NeuroChain生成式AI解決方案,助力臺灣產業加速升級,提升全球競爭力。

凌羣電腦與HPE合力推NeuroChain 助臺灣產業升級轉型

追蹤我們的 Facebook

近期文章

  • AI Factory 助攻 製鞋業邁向智慧製造
  • Arm Unlocked Taipei 2025 深化生態系合作 打造智慧運算未來
  • 電商業務滲透新市場 驅動 Appier 業務動能成長
  • 投球軌跡誤差<1 cm 棒球科技「鷹眼」精準度直逼 MLB
  • 智慧杆示範場域 松菸以 AI 即時監測提升城市服務

📈 CIO點閱文章週排行

  • 釣魚網站以假亂真

    【全支付盜刷事件】你需要知道:偽冒釣魚如何發生、該如何判斷與應對

    0 分享
    分享 0 Tweet 0
  • Citrix Asean 攜手邁達特推廣 Citrix VDI

    0 分享
    分享 0 Tweet 0
  • 【專訪】數位發展部部長林宜敬

    0 分享
    分享 0 Tweet 0
  • 2025 CISO Insight 資安調查報告

    0 分享
    分享 0 Tweet 0
  • AI 結合醫療資料,Absci 引領 AI 篩選藥物浪潮

    0 分享
    分享 0 Tweet 0
  • 台灣金融 AI 大語言模型之發展與產業應用

    0 分享
    分享 0 Tweet 0
  • 頂尖 CIO 如何規劃 AI 預算取得成功?

    0 分享
    分享 0 Tweet 0
  • 【策略黑客術 Part 1】以提示工程瞬間跑完四大分析

    0 分享
    分享 0 Tweet 0
  • 台灣邁向主權 AI 新紀元

    0 分享
    分享 0 Tweet 0
  • 臺灣智慧醫療學校 11/19上線 培訓四大 CMIO 職能

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

1761226332322 (1)

全球 200 位資安領袖齊聚 HITCON CISO Summit 共探 AI 與資安韌性未來

文/鄭宜芬 由台灣駭客協會主辦、CIO Taiwan 協辦的年度資安盛會「HIT

I172s15 1

台灣金融 AI 大語言模型之發展與產業應用

在地化、合規化與普惠化三路並進 台灣憑藉深厚金融資料與健全監管,積極打造本土金融

120063010301

臺韓專家對談主權 AI 治理  強化資料韌性與跨國協作

文/鄭宜芬 數位發展部 29 日舉辦「主權AI與永續發展國際專家座談會」(Sov

I172d05

AI 成為推動企業永續的堅實後盾

文/林呈欣 企業領袖要正面面對龐大而艱鉅的氣候挑戰而不退縮,透過更全面理解氣候變

I172s07

【策略黑客術 Part 1】以提示工程瞬間跑完四大分析

年底快到了,企業策略季又來了,每逢此時都會出現團建、年度策略啟動會、策略委員會、

1200 adobestock 1232856033

即問即答 AI 企業助理

文/葉宏謨 沒有資料就沒有 AI。AI 可以畫出歷史上任何偉大畫家風格的畫作,可

1200630 (1) (1)

【影】網詐通報網3.0上線 跨平台 API+AI 偵測

文/鄭宜芬 詐騙手法日新月異,為擴展《網路詐騙通報查詢網》通報情資來源,數位發展

I171s12

ESG 與永續發展

2025 CIO Insight 調查解析系列 到 2030 年僅剩 5 年,全

I172s10 1

人機共舞的未來藍圖

文/張瑞雄(資訊系教授、台北商業大學前校長) 在科技的進步中,人工智慧不再只是輔

Ciotaiwan logo 600 white

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音