• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 原生現場

施永強:生成式 AI 引爆革命 改變 AI 發展藍圖

2024-12-04
分類 : 原生現場
0
A A
0
1200 美國紐澤西理工大學施永強 大圖 2

◤ 美國紐澤西理工大學施永強

第十七屆CIO價值學院 第四堂課數位轉型與AI創新 會後報導

生成式 AI 強大威力正改變 AI 技術發展趨勢,其具備自動生成多層次特徵,並適應各種場景需求,已在在圖像、語音識別中等展現非常優異成績。可預期 GPT-5 模型的推理能力和多模式能力, 將徹底改變人類與 AI 互動的方式。

文/林裕洋


早在1950年代科學家即投入 AI 發展,只是早期受限於電腦運算能力有限,AI 發展並沒有太大進展。直到2016年,在高速電腦運算能力與 GPU 等加持下,Google 推出 AlphaGo 系統,並連續多次擊敗世界頂尖圍棋棋手之後,正式開啟全球 AI 蓬勃發展時代,也催生出智慧交通、智慧醫療等創新應用服務。

早期傳統模式識別方法依賴於人工設計的特徵進行分類,不僅有成本高昂、難以應對複雜場景變化等挑戰。現今在生成式 AI 技術不斷演進,正推動各行業的應用范愁予創新,在從圖像生成、文本生成,到多模態資料處理等領域,已展現出強大適應能力和發展潛力。

美國紐澤西理工大學教授施永強指出,2022年底 OpenAI 推出 ChatGPT 服務,讓人見識到生成式 AI 的強大威力,也自此改變 AI 技術發展趨勢。隨著自動化特徵工程進化、AutoML 技術成熟,生成式 AI 能夠在不依賴手工設計特徵的情況下自動生成多層次特徵,並適應各種場景需求,GPT-4、LLaMA 系列等生成式 AI 模型,不僅在語言生成方面有非常驚人表現,還能通過多層次特徵學習,在圖像、語音識別中等展現非常優異成績。可預期 GPT-5 模型推理能力和多模式能力,將徹底改變人類與人工智慧互動的方式。

內容目錄 隱藏
第十七屆CIO價值學院 第四堂課數位轉型與AI創新 會後報導
生成式 AI 助攻 圖像標註大幅進步
防止深度偽造 仰賴 Multi-attentional Framework
借鏡以色列 全力發展 AI

生成式 AI 助攻 圖像標註大幅進步

圖像解析是種為特定圖像生成自然語言描述技術,在人機互動、圖像檢索、視覺輔助等方面具有廣泛應用價值,當 AI 應用於圖像解析時,可展現出絕佳的效益。其中視覺特徵提取,是提取圖像中的區域特徵、網格特徵、上下文特徵等,至於上、下文注意力機制,則是 捕捉目標特徵和上下文特徵之間的互動關係。目前圖像解析常用評估指標,有 BLEU、METEOR、ROUGE、CIDEr、SPICE 等傳統指標,以及 BERTScore、CLIP-S、RefCLIP-S、PAC-S、RefPAC-S 等新興指標。。

目前生成式 AI 已被廣泛應用於圖像標註,在 CLIP、BLIP 等 VLM(Vision Language Models,視覺語言模型)技術協助,讓 AI 系統能自動生成與圖像內容匹配的語意描述,可大幅減少人力負擔。此類技術應用在電子商務和媒體等應用情境中,系統能自動標註商品或內容的特徵,提升圖像檢索和數據處理效率。

施永強說,若圖像描述技術應用於醫學影像分析,自然也能自動生成各種醫學影像報告,幫助醫生迅速解讀影像內容,為病患進行合適的診斷和治療。我們開發一套基於深度學習的醫學圖像描述系統,並在 MedTrinity-25M 資料集上進行實驗,也展現了令人非常滿意的成果。

在施永強教授推動的 MedTrinity-25M 專案中,生成式 AI 可為醫療影像生成標準化的醫學描述,並將專業術語轉換為病人易於理解的語言。這項技術發展不僅提升診療過程中的溝通效率,也幫助患者可更全面地理解自身病情。如此ㄌ一來,醫療人員可透過易於理解的語言,更好地與患者溝通、縮短疑慮。

防止深度偽造 仰賴 Multi-attentional Framework

隨著生成式 AI 效益逐漸展現,犯罪組織也將其用於深度偽造之中,也帶來真假訊息辨識的需求。目前深度偽造檢測方法主要將問題,作為簡單的二元分類任務 (真與假) 來處理,由於真、假面孔之間差異非常小,並且發生在侷部區域,傳統 Preliminary Framework 不足以捕捉這些細微的差異。

為此,科學家發展出 Multi-attentional Framework,為細粒度圖像進行分類工作,為此圖像判別提供全新視角,有助於解決深度偽造偵測作為細粒度分類問題。Multi-attentional Framework 可對多個區域進行細緻的特徵分析,於多個臉部區域來捕捉局部判別特徵 ,尤其在識別面部、聲音偽造時顯現出較強效果,如針對媒體內容驗證能檢測圖片中細微的差異。根據大量測試顯示,Multi-attentional Framework 在 FaceForensics++、CelebDF 等資料集中取得優異表現,幫助提高圖像可信度。

「自主監督學習也是生成式 AI 預訓練的重要環節,主打能在缺乏標記數據的情況下學習各種特徵。」施永強解釋:「自監督學習的應用尤其適合醫療、金融等敏感數據場景,通過學習未標記數據中的特徵模式,生成式 AI 可在低資源情境中,取得高效的學習效果。隨著資料隱私的重要性提升,自監督學習將在資料密集型行業中,獲得更廣泛應用。」

目前生成式 AI 在視覺識別領域正透過對比學習與增強技術提高準確率,主打能針對同一圖像的不同增強版本,進行深入對比與學習,對於物體分類、檢測等應用特別有效。例如,在自動駕駛的目標識別中,通過自動對比學習可大幅增強 AI 對於快速移動物體的辨識能力,確保車主與用路人的安全。

借鏡以色列 全力發展 AI

AI 快速發展不光在醫療影像診斷、教育訓練、虛擬場景生成等多場景創造出價值,也帶來全新戰爭概念。現代戰爭早已不是在物理空間中進行,而是在網路上進行,如透過網路攻擊使敵方衛星雷達癱瘓,乃至於干擾 GPS、關閉 Internet 網路等,讓敵方失去協同合作的能力。美國軍方正嘗試開發 GameBreaker 的 AI 系統,輔助各級指揮官做決策。這套系統是利用電腦模擬戰爭遊戲,利用機器學習來訓練最佳的戰場決策能力,並提供各種情況下的最佳戰術,供各級指揮官選擇與參考。

施永強指出,以 AI 技術為核心的武器,涵蓋無人船、無人飛機、無人坦克、機器人、自動化武器等,能依照預先輸入的指令,自動判斷與尋找合適攻擊目標。以色列是全球最積極積極投入 AI 研發的國家之一,根據 Oxford Insights 調研機構公布的2021年政府 AI 整備度指數報告,在160個國家中排名第 20 名。以色列 AI 產業發展作法可分為個三個主要方面,分別是發展 AI 必須的基礎設施、完善建立 AI 基礎設施的最佳環境、打造跨領域可持續的生態系統。台灣可以學習以色列的發展模式,同透過雙方之間的幾樓

施永強也積極參與台灣人工智慧協會(Taiwan Artificial Intelligence Association),期盼透過與海外國家交流,推動人工智慧產業化、擴大產業之人工智慧應用,在促進產業 AI 化之外,同時致力於推動 AI 產業化之目標。


(本文授權非營利轉載,請註明出處:CIO Taiwan)

564x96 Cio Taiwan形象稿
上一篇文章

思想科技 AI 協同工作平臺 Asana,飆升營運效率

下一篇文章

FujiFilm 一站式方案快速啟動服務業轉型

相關文章

I170s01 Citrix
原生現場

Citrix 結合多項資安模組 建構一致性安全策略

2025-08-11
I170s01 F
原生現場

帆軟一體化數據平臺 實現數據價值最大化

2025-08-11
I170s01 Ch
原生現場

中華電信攜手 Equinix 助企業打造 BCP、DRP

2025-08-11
下一篇文章
I162s01fujifilm

FujiFilm 一站式方案快速啟動服務業轉型

追蹤我們的 Facebook

近期文章

  • 藍盾+實名要素驗證 政府 LINE 帳號防堵詐騙集團
  • 數位轉型意識提升 2025 企業數位五力自評 69.3 分創新高
  • 有效的防火牆管理
  • 金融業與科技業加速佈局虛擬資產
  • 川普2.0來襲:長期韌性、短期彈性的供應鏈新趨勢

📈 CIO點閱文章週排行

  • I170d17

    擔心採用雲端 LLM 翻船,地端 LLM 建置成希望

    0 分享
    分享 0 Tweet 0
  • 【專訪】聯華電子資深副總經理暨資安長吳宗賢

    0 分享
    分享 0 Tweet 0
  • 面對生成式 AI 帶來的勞役不均現象

    0 分享
    分享 0 Tweet 0
  • 川普2.0來襲:長期韌性、短期彈性的供應鏈新趨勢

    0 分享
    分享 0 Tweet 0
  • 【專訪】燁輝企業總經理張振武

    0 分享
    分享 0 Tweet 0
  • MCP ─ AI 模型與數據世界的橋樑

    0 分享
    分享 0 Tweet 0
  • 【專訪】漢翔公司資訊處處長方一定

    0 分享
    分享 0 Tweet 0
  • 資安署攜衛福部四策略強化醫界防護 資安將納醫院評鑑

    0 分享
    分享 0 Tweet 0
  • 邁向個資保護新時代

    0 分享
    分享 0 Tweet 0
  • Rapidus 二奈米成功試產有何意義?

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

資料庫的威脅與保護方法

資料庫面臨多種資安威脅,如何透過強化帳號管理、漏洞掃描、加密與防火牆等多種方式,

0814

雲端平台成駭客中繼站 資安院籲強化郵件與雲端安全防護

文/鄭宜芬 國家資通安全研究院近期發現,駭客攻擊手法持續進化,開始濫用常見雲端服

I170d04

CQL 系列報導 ─ 探討 CQL 的架構與運作原理

口述/孫培然·彙整/CIO編輯室 接下來要探討的是 CQL(Clinical Q

I170s10

人工智慧時代的 FATE 原則

文/張瑞雄(資訊系教授、台北商業大學前校長) 當人工智慧(AI)進入全面普及階段

I170d05

ESG 永續資訊揭露標準浮現

文/林呈欣 在全球永續浪潮與主管機關政策驅動下,企業資訊揭露已從財務報表邁向涵蓋

I170s19

外電觀點:關稅風暴下的美國企業 IT 投資策略與應變

在當前全球經濟充滿不確定性的背景下,美國針對半導體產品所施加的關稅政策,正以前所

1200630 (2)

【專訪】南仁湖集團資訊部經理劉哲宇

集團整併轉型挑戰 在變局中塑造治理力 南仁湖企業經歷三地集團整併、資本結構轉變與

智慧醫療產業的價值轉譯與下一步:從技術導入走向臨床決策支援的關鍵路徑

本文從產業趨勢、技術應用、政策制度與策略建議四個面向切入,描繪智慧醫療價值轉譯的

I169d08 (1)

邁向個資保護新時代

文/蕭奕弘、張岑伃 民國 99 年個人資料保護法(下稱個資法)大幅修正,將原本的

Ciotaiwan Logo 600 White

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音