• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 專欄

DeepSeek 在 AI 領域對比與發展

2025-03-10
分類 : 專欄
0
A A
0
1200x630i164d06

Photo by Solen Feyissa on Unsplash

文/洪為璽


洪為璽 200x300
◤ 作者洪為璽博士,現為國立政治大學資訊管理學系教授兼CINTES研究中心主任,專長為資訊策略管理、資訊安全管理與大型資訊系統導入與應用。

人工智慧技術的發展迅速,導致語言模型在各個領域的應用日益廣泛。其中,DeepSeek和 ChatGPT 是目前最熱門的話題之一,受到了業界和使用者的關注,以下簡述 DeepSeek 的背景與 AI 研發現況。

內容目錄 隱藏
DeepSeek 橫空出世
模型架構
優勢與應用
未來趨勢
結論

DeepSeek 橫空出世

中國大陸的人工智慧公司 DeepSeek 是由梁文峰於 2023 年 7 月創立,此公司的目標以低成本模式研發並實現微薄獲利。2023 年 11 月,DeepSeek 發布了第一個 AI 模型 DeepSeek-v1,此後,DeepSeek 持續研發,並快速推出新版本,最新的 DeepSeek-R1 在邏輯推理速度上取得了重大突破,DeepSeek 聲稱該模型的性能已經達到了與 OpenAI 的 GPT-4 相當的性能,且僅花費了約 600 萬美元的訓練成本。

[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球CIO同步獲取精華見解 ]

此項發布震驚了許多國家與企業,尤其是 AI 技術研發的龍頭「META」公司,而矽谷創投家兼特朗普顧問馬克‧安德森將 DeepSeek-R1 形容為「人工智慧的斯普特尼克(Sputnik)時刻」,描述 DeepSeek-R1 的亮相讓美國意識到自己的技術落後,從而促使了競賽的全面爆發,美國的積極應對與行動,顯示出人工智慧領域競爭日益白熱化,本篇文章將探討 DeepSeek 和 ChatGPT 在模型架構、計算效率、推理能力、未來趨勢等方面的比較。

模型架構

DeepSeek 和 ChatGPT 在技術架構上均基於 Transformer,簡單來說是一種讓 AI 理解和處理語言的技術,但兩者在模型設計與訓練方法上有所不同,以下分為兩點來說明。

  • 第一,架構類型:
    DeepSeek-R1 採用混合專家架構(Mixture of Experts, MoE),這是一種能夠根據不同任務需求選擇啟動特定「專家」子網絡的模型架構。換句話說,當模型在處理任務時,能分配最合適的專家來參與計算,進而提升計算效率並降低資源消耗。而 ChatGPT(GPT-4)採用了 Transformer 架構,是基於自注意力機制(Self-Attention),此機制是指 AI 能捕捉句子或段落中遠距離詞彙之間的關係,並更新詞彙的含意,這是目前主流且成熟的深度學習模型架構之一。
  • 第二,參數規模與推理模式:
    一般而言參數越多,模型通常會更強大,能夠學習更複雜的模式,但也會增加計算資源的需求。DeepSeek-R1 總參數量為 6,710 億(671B),但每次推理時實際啟用的參數僅約 370 億(37B)。這種設計提高了計算效率,降低了推理成本。ChatGPT(GPT-4)則是每次推理都會使用全部參數,因此推理時的計算負擔較高,但對於需要長時間一致性的應用較為穩定,例如長篇寫作或是連貫性推理等。

優勢與應用

了解 DeepSeek 和 ChatGPT 模型架構後,雖然兩者在基礎架構上都基於 Transformer,但它們的訓練方式與推理策略不同,彼此具有不同的優勢,以下將 DeepSeek 和 ChatGPT 的計算效率與推理能力進行比較,並舉例適合的應用場景與說明。

首先,我們先來了解 DeepSeek 的優勢,根據上一段模型架構分析,DeepSeek 採用 MoE(Mixture of Experts)架構,讓不同「專家」子模型負責特定任務,這使得 DeepSeek 適合處理高精確度計算與運算的任務,以下舉兩個例子。

  • 第一,專業領域數據分析:
    因為 DeepSeek 具備強大的數學運算與數據處理能力,加上採用混合專家架構,所以非常適合進行特定領域的數據分析與預測。以投資公司為例,分析師每天需要分析上百支股票的市場數據,包括價格波動、交易量、技術指標等,可以將歷史數據與即時市場數據輸入模型,讓 DeepSeek 進行分析與預測,並根據歷史走勢預測趨勢,而ChatGPT雖然能撰寫報告,但在數據計算上不如DeepSeek精確。
  • 第二,數學邏輯推理:
    在 DeepSeek 提供的測試數據上,我們發現數學解題的能力已經並肩 ChatGPT,甚至精準度更高於 ChatGPT。以數學 AI 助手為例,學校希望透過 AI 提供學生更高效的學習體驗,特別是幫助學生在數學考試中提高解題能力,使用 DeepSeek 可以有效率的提供學生精準的答案與推理過程。ChatGPT 雖然 也能解決數學邏輯問題,但某些複雜演算法的實現可能不夠精確,特別是在處理邏輯較為複雜的數據結構問題時。

再來,我們介紹 ChatGPT 的優勢,根據上一段模型架構分析,ChatGPT 基於自注意力機制,能夠捉句子或段落中遠距離詞彙之間的關係,因此在自然語言推理與長篇邏輯推理上有強大的優勢,並且在創意生成、設計創作的能力上優於 DeepSeek,以下舉兩個例子。

  • 第一,強大的創意行銷:
    可口可樂公司使用 ChatGPT 來生成廣告文案、社群媒體貼文,並分析消費者互動數據,以最佳化行銷策略,並且舉辦全球行銷活動「Create Real Magic」中,鼓勵消費者使用 AI 生成可口可樂主題的創意作品,提升品牌影響力。
  • 第二,自然語言處理能力:
    以 MESA 為例,MESA 是一款專為 Shopify 商家設計的工作流程自動化應用程式,將 Shopify 與 ChatGPT 等多種應用程式整合,實現各種自動化工作流程,能夠自動回應客戶問題,且根智慧生成推薦內容等功能,此整合凸顯了 ChatGPT 強大的自然語言處理能力 。

未來趨勢

隨著 AI 技術快速的發展與激烈競爭,企業對於 AI 的需求日益增長,DeepSeek 的出現無疑影響了整個市場,而不同 AI 產品間的定位與市場分工也逐漸清晰,以下將根據兩者 AI 的性質討論,並分析未來趨勢。

首先分析 DeepSeek,DeepSeek 的優勢在於便宜的價格,但特定領域的表現上卻匹敵 ChatGpt,加上開源的性質,能夠讓使用者免費下載並做修改和部署,以下是兩者性質分析,並分為兩方面看未來的趨勢。。

  • 第一,中小企業 AI 的普及:
    目前許多中小企業正在面臨智慧轉型,而中小企業不一定能負擔市面上主流 AI 的價格,但 DeepSeek 的價格改變了市場,成為中小企業更有性價比的選擇,而且技術門檻低,開源技術使開發者能調整與優化,滿足中小型企業的靈活需求。
  • 第二,產業專業化:
    因為 DeepSeek 的強項是分析特定專業領域的資料,加上開源的特性,能夠讓企業客製化訓練屬於自己的模型,並且支持本地部署,不用上傳至 OpenAI 伺服器,降低重要資料外洩的風險。

接下來依據性質分析 ChatGPT 的未來趨勢,分為以下兩點,

  • 第一點,AI 深度整合:
    ChatGPT 服務的範圍與 DeepSeek 不同,已經擁有全球性的影響力,因此 ChatGPT 正朝向「企業 AI 服務」方向發展,使 AI 能快速且便利的流入企業之中。例如,Microsoft 365 Copilot 是專門針對 Office 應用的 AI 工具,基於 GPT 技術開發,且經過 Microsoft 深度整合,針對企業實際應用做了優化,可以自動生成 Word 內容、分析 Excel 數據、摘要 Outlook 電子郵件、整理 Teams 會議記錄等功能。
  • 第二點,個性化 AI:
    雖然 ChatGPT 的優勢不在於開源,但 ChatGPT 可以提供簡單、易用的客製化 AI 工具,這使技術門檻降低,不用專業技術團隊也能讓企業打造個性化 AI,並且降低 AI 部署的技術成本。例如,Radfield Home Care 是一家居家護理服務的公司,他們將 ChatGPT 整合到行銷和人力資源操作中,還在短短三天內開發了定制軟體,節省了聘請外部開發人員的成本,Radfield Home Care 在無需擁有專業技術團隊的情況下,成功地開發了客製化的 AI 應用,這展現了 ChatGPT 如何降低成本與 AI 的整合便利性。

結論

根據上述分析,DeepSeek 和 ChatGPT 各自擁有不同的技術特點與應用優勢,DeepSeek-R1 在數學推理、邏輯分析及數據處理方面表現突出,特別適用於數據分析、邏輯推理等專業領域。

而 ChatGPT 則在語言理解、創意寫作及多語言客服上具有強大優勢,已廣泛應用於行銷、企業溝通和客戶服務。

DeepSeek 目前以開源模式提供,允許企業與研究機構進行私有化部署,這對於有數據安全需求的使用者而言是一大優勢,此外,其強調技術透明度,使得 AI 模型的可控性更高,可能更受關注 AI 風險管理的企業與研究團隊青睞。

[ 閱讀 洪為璽 的所有文章]

另一方面,ChatGPT 持續流入企業進行整合,進一步擴展企業級應用,提供更高效的自動化與解決方案。透過與雲端服務的結合,ChatGPT 可幫助企業提升生產力,並在大型組織內部推動更有效率的決策。

整體而言,DeepSeek 以開源與技術透明度為特色,而 ChatGPT 則專注於生態整合與多功能應用。隨著 AI 技術持續發展,兩者在市場上將形成競爭與互補並存的趨勢,加速 AI 的進步,在未來只會有更多的 AI 工具,如何善用這些 AI 工具將成為現代中每個人的課題。


(本文授權非營利轉載,請註明出處:CIO Taiwan)

標籤: AIChatGPTDeepSeek人工智慧
上一篇文章

【影】數位憑證皮夾 3 月底沙盒測試 開源且採分散式架構

下一篇文章

戰無不勝!華碩Radeon RX 9070 XT / 9070系列顯示卡重磅出擊

相關文章

I170s11
CSO精選

有效的防火牆管理

2025-08-19
I170d04
專欄

CQL 系列報導 ─ 探討 CQL 的架構與運作原理

2025-08-14
I170d05
專欄

ESG 永續資訊揭露標準浮現

2025-08-12
下一篇文章
全新prime系列顯示卡一樣配有相變gpu散熱片、雙滾珠軸承風扇,以促進系統熱傳遞效果,同時還搭載0db技術、雙bios開關和鋁製保護背板,由內至外均剽悍無懈可擊。

戰無不勝!華碩Radeon RX 9070 XT / 9070系列顯示卡重磅出擊

追蹤我們的 Facebook

近期文章

  • 藍盾+實名要素驗證 政府 LINE 帳號防堵詐騙集團
  • 數位轉型意識提升 2025 企業數位五力自評 69.3 分創新高
  • 有效的防火牆管理
  • 金融業與科技業加速佈局虛擬資產
  • 川普2.0來襲:長期韌性、短期彈性的供應鏈新趨勢

📈 CIO點閱文章週排行

  • I170d17

    擔心採用雲端 LLM 翻船,地端 LLM 建置成希望

    0 分享
    分享 0 Tweet 0
  • 【專訪】聯華電子資深副總經理暨資安長吳宗賢

    0 分享
    分享 0 Tweet 0
  • 面對生成式 AI 帶來的勞役不均現象

    0 分享
    分享 0 Tweet 0
  • 【專訪】燁輝企業總經理張振武

    0 分享
    分享 0 Tweet 0
  • 川普2.0來襲:長期韌性、短期彈性的供應鏈新趨勢

    0 分享
    分享 0 Tweet 0
  • MCP ─ AI 模型與數據世界的橋樑

    0 分享
    分享 0 Tweet 0
  • 【專訪】漢翔公司資訊處處長方一定

    0 分享
    分享 0 Tweet 0
  • 資安署攜衛福部四策略強化醫界防護 資安將納醫院評鑑

    0 分享
    分享 0 Tweet 0
  • 邁向個資保護新時代

    0 分享
    分享 0 Tweet 0
  • Rapidus 二奈米成功試產有何意義?

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

1200 林宏文 250122

Rapidus 二奈米成功試產有何意義?

文/林宏文(主跑科技、生技產業三十年,著有《晶片島上的光芒》) 最近日本 Rap

1200630 (2)

【專訪】南仁湖集團資訊部經理劉哲宇

集團整併轉型挑戰 在變局中塑造治理力 南仁湖企業經歷三地集團整併、資本結構轉變與

I170s04 1

川普2.0來襲:長期韌性、短期彈性的供應鏈新趨勢

對等關稅政策正衝擊全球經濟發展,面對地緣政治、貿易壁壘等挑戰,臺灣製造業在佈局全

1200630

AI 公務人才發展辦公室揭牌 聚焦三大核心業務

文/鄭宜芬 為加速政府服務導入人工智慧(AI)應用,行政院人事行政總處與數位發展

20250731 145511

童子賢:半導體為臺灣造山 AI 將為臺灣「造浪」

文/鄭宜芬 台北市電腦公會榮譽理事長暨和碩董事長童子賢 31 日出席數位發展部主

1200630

數位轉型意識提升 2025 企業數位五力自評 69.3 分創新高

文/鄭宜芬 亞太行銷數位轉型聯盟協會(AMT聯盟)近日發布《2025 企業數位新

I169d08 (1)

邁向個資保護新時代

文/蕭奕弘、張岑伃 民國 99 年個人資料保護法(下稱個資法)大幅修正,將原本的

I169s05

生成式 AI 為台灣產業帶來流程再造

生成式 AI 發展迅速,除了先行導入者累積了許多導入經驗,相關科技組織也積極布建

1200630

臺灣攜手 21 個亞太經濟體 共同發表首份數位與 AI 部長宣言

文/鄭宜芬 數位發展部部長黃彥男於 8 月 4 日至 6 日率領我國代表團出席「

Ciotaiwan Logo 600 White

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音