• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 專欄

DeepSeek 在 AI 領域對比與發展

2025-03-10
分類 : 專欄
0
A A
0
1200x630i164d06

Photo by Solen Feyissa on Unsplash

文/洪為璽


洪為璽 200x300
◤ 作者洪為璽博士,現為國立政治大學資訊管理學系教授兼CINTES研究中心主任,專長為資訊策略管理、資訊安全管理與大型資訊系統導入與應用。

人工智慧技術的發展迅速,導致語言模型在各個領域的應用日益廣泛。其中,DeepSeek和 ChatGPT 是目前最熱門的話題之一,受到了業界和使用者的關注,以下簡述 DeepSeek 的背景與 AI 研發現況。

內容目錄 隱藏
DeepSeek 橫空出世
模型架構
優勢與應用
未來趨勢
結論

DeepSeek 橫空出世

中國大陸的人工智慧公司 DeepSeek 是由梁文峰於 2023 年 7 月創立,此公司的目標以低成本模式研發並實現微薄獲利。2023 年 11 月,DeepSeek 發布了第一個 AI 模型 DeepSeek-v1,此後,DeepSeek 持續研發,並快速推出新版本,最新的 DeepSeek-R1 在邏輯推理速度上取得了重大突破,DeepSeek 聲稱該模型的性能已經達到了與 OpenAI 的 GPT-4 相當的性能,且僅花費了約 600 萬美元的訓練成本。

[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球CIO同步獲取精華見解 ]

此項發布震驚了許多國家與企業,尤其是 AI 技術研發的龍頭「META」公司,而矽谷創投家兼特朗普顧問馬克‧安德森將 DeepSeek-R1 形容為「人工智慧的斯普特尼克(Sputnik)時刻」,描述 DeepSeek-R1 的亮相讓美國意識到自己的技術落後,從而促使了競賽的全面爆發,美國的積極應對與行動,顯示出人工智慧領域競爭日益白熱化,本篇文章將探討 DeepSeek 和 ChatGPT 在模型架構、計算效率、推理能力、未來趨勢等方面的比較。

模型架構

DeepSeek 和 ChatGPT 在技術架構上均基於 Transformer,簡單來說是一種讓 AI 理解和處理語言的技術,但兩者在模型設計與訓練方法上有所不同,以下分為兩點來說明。

  • 第一,架構類型:
    DeepSeek-R1 採用混合專家架構(Mixture of Experts, MoE),這是一種能夠根據不同任務需求選擇啟動特定「專家」子網絡的模型架構。換句話說,當模型在處理任務時,能分配最合適的專家來參與計算,進而提升計算效率並降低資源消耗。而 ChatGPT(GPT-4)採用了 Transformer 架構,是基於自注意力機制(Self-Attention),此機制是指 AI 能捕捉句子或段落中遠距離詞彙之間的關係,並更新詞彙的含意,這是目前主流且成熟的深度學習模型架構之一。
  • 第二,參數規模與推理模式:
    一般而言參數越多,模型通常會更強大,能夠學習更複雜的模式,但也會增加計算資源的需求。DeepSeek-R1 總參數量為 6,710 億(671B),但每次推理時實際啟用的參數僅約 370 億(37B)。這種設計提高了計算效率,降低了推理成本。ChatGPT(GPT-4)則是每次推理都會使用全部參數,因此推理時的計算負擔較高,但對於需要長時間一致性的應用較為穩定,例如長篇寫作或是連貫性推理等。

優勢與應用

了解 DeepSeek 和 ChatGPT 模型架構後,雖然兩者在基礎架構上都基於 Transformer,但它們的訓練方式與推理策略不同,彼此具有不同的優勢,以下將 DeepSeek 和 ChatGPT 的計算效率與推理能力進行比較,並舉例適合的應用場景與說明。

首先,我們先來了解 DeepSeek 的優勢,根據上一段模型架構分析,DeepSeek 採用 MoE(Mixture of Experts)架構,讓不同「專家」子模型負責特定任務,這使得 DeepSeek 適合處理高精確度計算與運算的任務,以下舉兩個例子。

  • 第一,專業領域數據分析:
    因為 DeepSeek 具備強大的數學運算與數據處理能力,加上採用混合專家架構,所以非常適合進行特定領域的數據分析與預測。以投資公司為例,分析師每天需要分析上百支股票的市場數據,包括價格波動、交易量、技術指標等,可以將歷史數據與即時市場數據輸入模型,讓 DeepSeek 進行分析與預測,並根據歷史走勢預測趨勢,而ChatGPT雖然能撰寫報告,但在數據計算上不如DeepSeek精確。
  • 第二,數學邏輯推理:
    在 DeepSeek 提供的測試數據上,我們發現數學解題的能力已經並肩 ChatGPT,甚至精準度更高於 ChatGPT。以數學 AI 助手為例,學校希望透過 AI 提供學生更高效的學習體驗,特別是幫助學生在數學考試中提高解題能力,使用 DeepSeek 可以有效率的提供學生精準的答案與推理過程。ChatGPT 雖然 也能解決數學邏輯問題,但某些複雜演算法的實現可能不夠精確,特別是在處理邏輯較為複雜的數據結構問題時。

再來,我們介紹 ChatGPT 的優勢,根據上一段模型架構分析,ChatGPT 基於自注意力機制,能夠捉句子或段落中遠距離詞彙之間的關係,因此在自然語言推理與長篇邏輯推理上有強大的優勢,並且在創意生成、設計創作的能力上優於 DeepSeek,以下舉兩個例子。

  • 第一,強大的創意行銷:
    可口可樂公司使用 ChatGPT 來生成廣告文案、社群媒體貼文,並分析消費者互動數據,以最佳化行銷策略,並且舉辦全球行銷活動「Create Real Magic」中,鼓勵消費者使用 AI 生成可口可樂主題的創意作品,提升品牌影響力。
  • 第二,自然語言處理能力:
    以 MESA 為例,MESA 是一款專為 Shopify 商家設計的工作流程自動化應用程式,將 Shopify 與 ChatGPT 等多種應用程式整合,實現各種自動化工作流程,能夠自動回應客戶問題,且根智慧生成推薦內容等功能,此整合凸顯了 ChatGPT 強大的自然語言處理能力 。

未來趨勢

隨著 AI 技術快速的發展與激烈競爭,企業對於 AI 的需求日益增長,DeepSeek 的出現無疑影響了整個市場,而不同 AI 產品間的定位與市場分工也逐漸清晰,以下將根據兩者 AI 的性質討論,並分析未來趨勢。

首先分析 DeepSeek,DeepSeek 的優勢在於便宜的價格,但特定領域的表現上卻匹敵 ChatGpt,加上開源的性質,能夠讓使用者免費下載並做修改和部署,以下是兩者性質分析,並分為兩方面看未來的趨勢。。

  • 第一,中小企業 AI 的普及:
    目前許多中小企業正在面臨智慧轉型,而中小企業不一定能負擔市面上主流 AI 的價格,但 DeepSeek 的價格改變了市場,成為中小企業更有性價比的選擇,而且技術門檻低,開源技術使開發者能調整與優化,滿足中小型企業的靈活需求。
  • 第二,產業專業化:
    因為 DeepSeek 的強項是分析特定專業領域的資料,加上開源的特性,能夠讓企業客製化訓練屬於自己的模型,並且支持本地部署,不用上傳至 OpenAI 伺服器,降低重要資料外洩的風險。

接下來依據性質分析 ChatGPT 的未來趨勢,分為以下兩點,

  • 第一點,AI 深度整合:
    ChatGPT 服務的範圍與 DeepSeek 不同,已經擁有全球性的影響力,因此 ChatGPT 正朝向「企業 AI 服務」方向發展,使 AI 能快速且便利的流入企業之中。例如,Microsoft 365 Copilot 是專門針對 Office 應用的 AI 工具,基於 GPT 技術開發,且經過 Microsoft 深度整合,針對企業實際應用做了優化,可以自動生成 Word 內容、分析 Excel 數據、摘要 Outlook 電子郵件、整理 Teams 會議記錄等功能。
  • 第二點,個性化 AI:
    雖然 ChatGPT 的優勢不在於開源,但 ChatGPT 可以提供簡單、易用的客製化 AI 工具,這使技術門檻降低,不用專業技術團隊也能讓企業打造個性化 AI,並且降低 AI 部署的技術成本。例如,Radfield Home Care 是一家居家護理服務的公司,他們將 ChatGPT 整合到行銷和人力資源操作中,還在短短三天內開發了定制軟體,節省了聘請外部開發人員的成本,Radfield Home Care 在無需擁有專業技術團隊的情況下,成功地開發了客製化的 AI 應用,這展現了 ChatGPT 如何降低成本與 AI 的整合便利性。

結論

根據上述分析,DeepSeek 和 ChatGPT 各自擁有不同的技術特點與應用優勢,DeepSeek-R1 在數學推理、邏輯分析及數據處理方面表現突出,特別適用於數據分析、邏輯推理等專業領域。

而 ChatGPT 則在語言理解、創意寫作及多語言客服上具有強大優勢,已廣泛應用於行銷、企業溝通和客戶服務。

DeepSeek 目前以開源模式提供,允許企業與研究機構進行私有化部署,這對於有數據安全需求的使用者而言是一大優勢,此外,其強調技術透明度,使得 AI 模型的可控性更高,可能更受關注 AI 風險管理的企業與研究團隊青睞。

[ 閱讀 洪為璽 的所有文章]

另一方面,ChatGPT 持續流入企業進行整合,進一步擴展企業級應用,提供更高效的自動化與解決方案。透過與雲端服務的結合,ChatGPT 可幫助企業提升生產力,並在大型組織內部推動更有效率的決策。

整體而言,DeepSeek 以開源與技術透明度為特色,而 ChatGPT 則專注於生態整合與多功能應用。隨著 AI 技術持續發展,兩者在市場上將形成競爭與互補並存的趨勢,加速 AI 的進步,在未來只會有更多的 AI 工具,如何善用這些 AI 工具將成為現代中每個人的課題。


(本文授權非營利轉載,請註明出處:CIO Taiwan)

標籤: AIChatGPTDeepSeek人工智慧
上一篇文章

【影】數位憑證皮夾 3 月底沙盒測試 開源且採分散式架構

下一篇文章

戰無不勝!華碩Radeon RX 9070 XT / 9070系列顯示卡重磅出擊

相關文章

I168s10 Web
專欄

金融科技是美中角力下跨境支付的解答

2025-06-16
作業系統(OS)安全
CSO精選

作業系統(OS)安全

2025-06-10
I168web 2 Cover
專欄

白宮發布重要的無人機政策行政命令的啟示及產業商機

2025-06-10
下一篇文章
全新prime系列顯示卡一樣配有相變gpu散熱片、雙滾珠軸承風扇,以促進系統熱傳遞效果,同時還搭載0db技術、雙bios開關和鋁製保護背板,由內至外均剽悍無懈可擊。

戰無不勝!華碩Radeon RX 9070 XT / 9070系列顯示卡重磅出擊

追蹤我們的 Facebook

近期文章

  • 金融科技是美中角力下跨境支付的解答
  • 數位轉型不靠喊單 Q Burger 實現早餐營運差異化
  • 統一資訊強化內部開發效能 加速推進數位與雲端轉型
  • Check Point Software 以 AI 強化邊緣防禦,全新分支安全閘道效能提升四倍
  • 華碩領航資安專利布局 榮獲後量子密碼CAVP認證

📈 CIO點閱文章週排行

  • ISO 27701 新版將面世,PIMS 標準出新版,個資保護國內外升級

    ISO 27701 新版將面世,PIMS 標準出新版,個資保護國內外升級

    0 分享
    分享 0 Tweet 0
  • TA-DIF 打造可解釋可部署 AI OT 安全異常偵測機制

    0 分享
    分享 0 Tweet 0
  • AI 代理驅動認知 ERP 發展

    0 分享
    分享 0 Tweet 0
  • 雷虎無人艇失聯與尋獲事件,挑戰的關鍵技術

    0 分享
    分享 0 Tweet 0
  • 【專訪】國立陽明交通大學校長林奇宏

    0 分享
    分享 0 Tweet 0
  • 作業系統(OS)安全

    0 分享
    分享 0 Tweet 0
  • 白宮發布重要的無人機政策行政命令的啟示及產業商機

    0 分享
    分享 0 Tweet 0
  • 台灣航太與造船業的文藝復興:打造無人載具新未來

    0 分享
    分享 0 Tweet 0
  • NVIDIA 黃仁勳:代理式人工智慧(Agentic AI)引領產業變革,數位員工時代來臨

    0 分享
    分享 0 Tweet 0
  • 經濟部頒發創新發明雙獎 政府擬推 AI 十大建設

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

網頁文章首圖1200x630 網頁文章首圖1200x630

CYFIRMA DeCYFIR 結合 AI 分析 打造主動防護

高科技資安論壇 會後報導 主動式防禦是利用外部威脅情資,修補系統或資安漏洞強化防

AWS 解決方案架構經理鄭志帆

搶攻資料商機 AWS 平台功能齊備

2023 CIO大調查發表會 隨著資料經濟時代來臨,僅有 32% 企業能夠從中挖

1200 C3a3844

精誠:行動平台淪為目標式攻擊新戰場

第十屆金融CIO高峰會夏季場 根據MIC的調查指出,台灣消費者首選行動支付的比例

Big Data Visualization. Futuristic Design Of Data Flow. Abstrac

AI應用發威 SAS 台灣持續成長

因持續受惠於市場對人工智慧解決方案的需求,帶動SAS台灣營收連10年雙位數成長,

Gartner 資深執行副總經理張汝恬

張汝恬以平台促進融合重組,加速形塑商業價值

第十五屆CIO價值學院第二堂課 會後報導 Gartner資深執行副總經理張汝恬表

1200 Ethical Issues Ai Collage

AI 國際法遵需求迫在眉睫 人工智慧風險管理成顯學

人工智慧風險管理的國際發展與應用 AI 發展日新月異,憂心類似電影情節威脅到人類

Ciotaiwan Logo 600 White

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音