• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 新聞速寫

針對視訊會議的 NVIDIA Maxine SDK

2021-06-25
分類 : 新聞速寫
0
A A
0
Image002

在 NVIDIA (輝達) 研究人員開發的人工智慧 (AI) 協助下,從床上起床、打開筆電電源和網路攝影機,便能在每次進行視訊通話時,呈現完美的畫面。

NVIDIA 針對視訊會議推出的 NVIDIA Maxine SDK,背後運用眾多深度學習模型,其中包含 Vid2Vid Cameo,該模型使用生成對抗網路 (GAN),只要使用單一人像平面照片,就能在視訊通話中合成出說話者栩栩如生的立體頭像。

參與者只需要在加入視訊通話前先上傳一張參考圖片,可以是自己的真實照片或卡通圖片,就能使用這項功能。開會時,AI 模型會抓取每個人的即時動作,接著將這些動作套用在先前上傳的靜態圖片上。

這意味著只要與會者先上傳好穿著正式服裝的照片,就算剛起床且頂著一頭亂髮、身上還穿著睡衣,直接進行會議也沒問題,因為 AI 會將與會者的臉部動作套用在靜態的參考照片上,在會議平台中顯現出體面的打扮。要是與會者將身體轉向左邊,這項技術可以調整視角,讓這個人看起來像是正對著網路攝影機。

除了讓與會者看起來體面之外,這項 AI 技術還能將視訊會議所需的頻寬減少十倍,以避免出現畫面抖動和延遲的情況。該技術很快就會在 NVIDIA Video Codec SDK 中,作為 AI Face Codec 供大家使用。

這項專案的共同作者,也是 NVIDIA 的研究人員劉洺堉(Ming-Yu Liu)表示:「許多人使用的網路頻寬有限,但還是想要與親友們流暢地在網路上聊天,而這項技術除了能協助他們之外,此基本技術還能協助動畫師、照片編輯員和遊戲開發者完成手上的工作。」

NVIDIA 本週將於著名的 Conference on Computer Vision and Pattern Recognition (CVPR) 大會上發表 Vid2Vid Cameo,這是 NVIDIA 在這場線上大會中發表的 28 篇論文之一。Vid2Vid Cameo也可以在 AI Playground 上找到,任何人都可以在那裡親身體驗我們的研究演示。

人工智慧在大會上搶盡風頭

為了向經典的竊盜類電影還有 Netflix 的熱門節目致敬,NVIDIA 的研究人員在某次的視訊會議中,讓他們的對話頭像 GAN 模型大顯身手。在演示的過程中強調 Vid2Vid Cameo 的重點功能,包括臉部重新定向、動畫化身和資料壓縮。你可以透過以下影片更加暸解Vid2Vid 及Vid2Vid Cameo。

這些功能很快就會出現在 NVIDIA Maxine SDK 內,為開發人員提供經最佳化調整的預先訓練模型,以用於視訊會議及直播串流中的視訊、音訊及擴增實境效果。

開發人員已經可以使用 Maxine AI 的效果,包括智慧降噪、視訊畫質提升與人體姿勢預估。供免費下載的 SDK 還能搭配 NVIDIA Jarvis 平台使用,以用於包括轉錄和翻譯在內的對話式 AI 應用項目。

AI 向你打招呼

Vid2Vid Cameo 只需要兩個元素,便能建立出用於視訊會議的逼真 AI 對話頭像,包含一張使用者的臉部照片以及一個視訊串流內容,其將決定這個影像要如何進行動作。

該模型在 NVIDIA DGX 系統上使用 18 萬個高品質對話頭像的資料集來進行訓練。該網路學習辨識二十個關鍵點,以便在沒有人類加以標柱的情況下,針對臉部動作建立模型。這些關鍵點針對包括眼睛、嘴巴和鼻子在內的特徵位置進行編碼。

接著,模型會從通話者的參考圖片中擷取這些關鍵點,通話者的圖片可以事先發送給其他參與視訊會議的人,或從過往的會議中重複使用。如此一來,視訊會議平台只需發送說話者臉部關鍵點的動作資料,而不用在每一個與會者之間發送龐大的即時視訊串流內容。

對接收者來說,GAN 模型在接收端使用這些資訊來合成一個模仿參考圖片外觀的視訊內容。

這項技術只需要壓縮和來回發送頭部位置及關鍵點,不用發送完整的視訊串流內容,便能將視訊會議的頻寬需求減少十倍,讓用戶擁有更流暢的通話體驗。因此,可以在不影響視覺品質的情況下,配合各種頻寬環境來調整模型,以傳輸不同數量的關鍵點。

使用者也能自由調整產生出的對話頭像視角,從側面或正面顯示、調低或調高攝影機的角度。照片編輯員同樣能將這項功能應用在平面照片上。

NVIDIA 的研究人員發現,Vid2Vid Cameo 可以產生更為真實清晰的結果,不管參考圖片和視訊內容是否出自同一個人,還是當 AI 把一個人的動作轉移到另一個人的參考圖片上,它的表現都比最先進的模型更出色。

後面這項功能可以把說話者的臉部動作,用在視訊會議裡的數位化身上,並讓它們動起來,甚至是讓遊戲或卡通人物呈現出更有真實感的表情和動作。

Vid2Vid Cameo 模型論文的作者為 NVIDIA 研究人員 Arun Mallya和兩位來自台灣的 Ting-Chun Wang、和 Ming-Yu Liu。NVIDIA Research 團隊由全球兩百多名科學家組成,專注於 AI、電腦視覺、自動駕駛車、機器人和繪圖等領域。

在此特別感謝於 Netflix 播出的《紙房子》影集中,替教授進行英語配音的演員 Edan Moses,感謝他為上述我們最新的 AI 研究成果影片所做出的貢獻。

標籤: AIMaxine SDKNVIDIA
上一篇文章

搭載預先訓練模型及遷移學習工具的快速生產型 AI

下一篇文章

疫情推升資安人員戰技

相關文章

台灣微軟協力經濟部中小及新創署與國立中山大學南區促進產業發展研究中心(中山產發)在亞灣新創園舉辦第四屆「微軟新創加速器 Demo Day 暨商機媒合交流會」。
新聞速寫

微軟新創加速器深化台灣創新動能,助力鏈結國際商機

2025-12-01
2024首度舉辦即獲得各界廣大迴響的華碩ProArt影視菁英交流會,今年加碼請來重量級合作夥伴AMD共襄盛舉,並以「光影流金,色真映像」為題,盛大登場。
新聞速寫

攜手AMD!華碩ProArt系列全新力作完美演繹光影色真

2025-12-01
◤ 慧榮科技為迎接AI時代的長期挑戰,斥資四十億元打造竹北高鐵營運總部,全新機房升級計畫首度曝光。
新聞速寫

慧榮科技攜手擎普打造混合散熱新機房 卡位未來十年AI決戰力 

2025-12-01
下一篇文章

疫情推升資安人員戰技

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

追蹤我們的 Facebook

近期文章

  • AI 時代的安全門戶 FIDO 驅動 Passkey 普及與跨域身分整合
  • 南市府與台智雲打造 AI City 深化智慧治理與賦能產業數位
  • CI 零容錯 資安院推 ICS/SCADA 實戰培訓補強 OT 資安韌性
  • 從技術走向治理,CISO 重新定義資安責任邊界
  • 防範威脅三關鍵:零信任、韌性、IT/OT 防線

📈 CIO點閱文章週排行

  • ◤ 慧榮科技為迎接AI時代的長期挑戰,斥資四十億元打造竹北高鐵營運總部,全新機房升級計畫首度曝光。

    慧榮科技攜手擎普打造混合散熱新機房 卡位未來十年AI決戰力 

    0 分享
    分享 0 Tweet 0
  • AI 促成記憶體大漲,台灣可以抓那些機會?

    0 分享
    分享 0 Tweet 0
  • 2025-2026 CISO Insight 資安調查報告

    0 分享
    分享 0 Tweet 0
  • 藝術殿堂下的生命未來對話:亞洲大學「量子 AI 與生命未來」國際研討會的腦力激盪

    0 分享
    分享 0 Tweet 0
  • 台積電頒發 30 家優良供應商 建廠安全首列獨立獎項

    0 分享
    分享 0 Tweet 0
  • 從防禦到誘敵,生成式對抗網路(GANs)驅動的資安新戰場

    0 分享
    分享 0 Tweet 0
  • 資安雙面刃 生成式 AI 三大風險與機會

    0 分享
    分享 0 Tweet 0
  • 國防預算轉型:實現軍民深度整合的策略

    0 分享
    分享 0 Tweet 0
  • 優化人力與組織的 AI 轉型,7 大案例一次看明

    0 分享
    分享 0 Tweet 0
  • 【專訪】數位發展部部長林宜敬

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 最新文章
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

1200630 (1)

投球軌跡誤差<1 cm 棒球科技「鷹眼」精準度直逼 MLB

文/鄭宜芬 AI 在運動領域的應用日益廣泛,經濟部產業技術司 17 日舉辦「運動

I172s05 2

Clorox 數位轉型,重塑企業科技骨幹的挑戰與策略

從遺留系統到 AI 前沿:Clorox 案例揭示 IT 領導者必須面對的架構現代

I172s11

RWA、代幣化,以及虛擬資產佈局

文/黃啟誠 想像一下,如果我們能把台灣這塊土地上最棒的資產,比如台北信義區的黃金

I173s09 (1)

台灣邁向主權 AI 新紀元

文/謝介壽 台灣從行政院「AI 新十大建設」到總統 2025 年雙十演說「全球前

文章至頂圖 01 1

資安雙面刃 生成式 AI 三大風險與機會

2025-2026 CISO Insight資安調查解析-1 生成式 AI 正改

120063011032

AI 輔助病歷標準化 衛福部自動編碼輔助系統獲「未來科技獎」

文/鄭宜芬 臺灣電子病歷系統因高度碎片化,難以共享醫療資料。衛福部資訊處處長李建

I172s07

【策略黑客術 Part 1】以提示工程瞬間跑完四大分析

年底快到了,企業策略季又來了,每逢此時都會出現團建、年度策略啟動會、策略委員會、

Owennini1200

AI 促成記憶體大漲,台灣可以抓那些機會?

文/林宏文 近來記憶體大漲價,從 DRAM 到 Flash,年初至今都已上漲數倍

12006301119

Cloudflare 故障原因 設定檔異常導致核心流量中斷

文/鄭宜芬 國際 CDN 服務提供商 Cloudflare 的網路於18 日11

Ciotaiwan logo 600 white

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音