• 登入
  • 註冊網站會員
CIO Taiwan
  • 活動
  • 影音
  • 趨勢分析
  • CIO 雜誌
  • CSO精選
  • 電子報
  • 下載
  • 聯繫我們
沒有結果
查看所有結果
CIO Taiwan
沒有結果
查看所有結果
首頁 新聞速寫

NVIDIA 表達性語言合成研究成果

2021-09-01
分類 : 新聞速寫
0
A A
0

原本的自動電話語音和已經發展數十年的 GPS 導航系統都只能發出生硬的機器合成聲音,而人工智慧 (AI) 卻讓智慧型手機和智慧音箱中的虛擬助理呈現逼真的語調。不過,AI 合成的聲音和我們在日常對話及媒體中聽到的真實人聲之間,還是差了那麼一點,原因在於人們說話時帶有複雜的節奏、音調和音色,這是很難以 AI 仿真出來的。

然而這個差距正在迅速縮小。NVIDIA 的研究人員正在打造高品質、可控制的語音合成模型與工具,它們能捕捉人類口說聲音中的豐富細節,又不會聽起來人工感很重。研究人員將於 INTERSPEECH 2021 大會展示這項最新的研究成果,這場會議將持續舉辦至 9 月 3 日。

這些模型有助銀行和零售商的自動語音客服,也能讓電玩遊戲或書籍中的人物更為生動,並即時為數位分身加上合成語音。NVIDIA 內部的創意團隊甚至運用這項技術,為一支介紹 AI 的系列影片製作出富有表現力的旁白內容。

表達性語言合成只是 NVIDIA Research 團隊在對話式 AI 的其中一項研究,這個領域還包括自然語言處理、自動語音辨識、關鍵字偵測、音訊增強等。這項先進研究成果的部分內容已透過 NVIDIA NeMo 工具套件成為開放原始碼,可以在 NGC 容器及其它軟體中心取得,並經最佳化調整,能在 NVIDIA GPU 上高效執行。

《I AM AI》的幕後花絮

NVIDIA 的研究人員與創意專家對於對話式 AI 不是只會坐而言,還會起而行,在《I AM AI》系列影片中實際運用突破性的語音合成模型,介紹重塑各產業發展的全球 AI 創新者。

但直到最近,都是由真人擔任這些影片的旁白。過去的語音合成模型對於合成聲音的節奏和音調控制能力有限,因此和真人旁白的影片相比,嘗試以 AI 製作影片旁白無法激起觀眾的情感。

在過去的一年裡情況出現了變化,NVIDIA 的文字轉語音研究團隊發展出更強大、控制能力更強的語音合成模型,就像是我們在 SIGGRAPH Real-Time Live 競賽獲獎的展示內容所使用的 RAD-TTS 模型。透過 RAD-TTS,使用個人說話的聲音來訓練文字轉語音模型,可以將任何文字提示變成說話者的聲音。

聲音轉換是它的另一項功能,例如畫面上是 A 在說話 (甚至是唱歌),觀眾們聽到的卻是 B 的聲音。設計 RAD-TTS 介面的靈感來源是將人的聲音當成一種樂器,使用者便能夠逐幀微調合成聲音的音調、持續時間和能量。

影片製作人可以使用這個介面,錄製自己讀出影片腳本的聲音,接著用 AI 模型將說話內容變成女性旁白者的聲音。製作人可以再運用這個基本的旁白內容,像配音員一樣指導 AI 並進行調整,讓合成出來的語音強調特定字眼、修改旁白節奏,以更貼切地表達影片的調性。

這個 AI 模型不只能用在配音上:文字轉語音的功能還能用在遊戲、協助聲音機能或語言機能障礙者,或幫助使用者用自己的聲音翻譯不同語言;甚至還能重現著名歌手的表演,不僅可以配合歌曲旋律,還能配合人聲背後所表達的情感。

讓 AI 開發人員、研究人員取得語音技術

研究人員、開發人員和創作者有了 NVIDIA NeMo 這個用於 GPU 加速的對話式 AI 開源碼 Python 工具包,便能為自己的應用試驗及微調語音模型取得先機。

使用 NeMo 中易用的 API 和已經訓練好的模型,可以協助研究人員開發和自訂用於文字轉語音、自然語言處理及即時自動語音辨識的模型。許多模型已經在 NVIDIA DGX 系統上使用超過十萬小時的開源資料集完成訓練,開發人員可以按照自己的應用場景,在 NVIDIA Tensor 核心 GPU 上以混合精度運算微調任何模型。

NVIDIA NeMo 還藉由 NGC 提供在 Mozilla Common Voice 進行訓練的模型,在 Mozilla Common Voice 資料集中擁有 76 種語言、近 1.4 萬小時的群眾外包語音資料。這項由 NVIDIA 支持的專案企圖以全球最大規模的開放數據語音資料集,讓更多人接觸到語音技術。

語音寶盒:NVIDIA 研究人員揭曉 AI 語音技術

INTERSPEECH 大會聚集超過一千名研究人員,展現他們在語音技術的突破性成果。NVIDIA Research 團隊將在本週舉行的 INTERSPEECH 大會上,對開發人員展示對話式 AI 模型架構與完全格式化的語音資料集。

標籤: NVIDIA
上一篇文章

特權用戶是駭客APT行動中的標靶,senhasegura特權帳號管理(PAM)解決方案協助企業安全效率並符合法規要求的管理特權帳號

下一篇文章

AMD EPYC處理器助力美國能源部阿貢國家實驗室

相關文章

新聞速寫

AMD攜手法國政府推動法國AI創新、研究及開放產業體系發展

2026-04-21
施耐德電機旗下 Motivair 發表全新 CDU 系列 回應 HPC 與 AI 工作負載持續攀升的散熱挑戰
新聞速寫

施耐德電機旗下 Motivair 發表全新 CDU 系列 回應 HPC 與 AI 工作負載持續攀升的散熱挑戰

2026-04-21
HPE AI Grid 以 NVIDIA 參考架構為基礎,統一管理 AI 伺服器與網路基礎架構,協助服務供應商實現跨區域與邊緣的分散式推論及即時 AI 服務。
新聞速寫

HPE 攜手NVIDIA打造AI Grid架構 將分散式AI工廠整合為智慧AI網格

2026-04-20
下一篇文章
AMD EPYC處理器助力美國能源部阿貢國家實驗室

AMD EPYC處理器助力美國能源部阿貢國家實驗室

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

2026 Elite Vendor

追蹤我們的 Facebook

近期文章

  • TWQR 跨境支付上線 擴大臺日星 QR Code 支付
  • 龍珠在握:掌握主權 AI 的全勝之道
  • AMD攜手法國政府推動法國AI創新、研究及開放產業體系發展
  • 施耐德電機旗下 Motivair 發表全新 CDU 系列 回應 HPC 與 AI 工作負載持續攀升的散熱挑戰
  • 公司簡介別再像履歷表:一個 Prompt,寫出真正打動客戶的故事型簡報

📈 CIO點閱文章週排行

  • 告別「AI 高成本、低回報」窘境,昕力助企業打造可持續的高 ROI 運營模式

    告別「AI 高成本、低回報」窘境,昕力助企業打造可持續的高 ROI 運營模式

    0 分享
    分享 0 Tweet 0
  • 【完整名單】醫療版「0050」頒獎 臺灣 SMART on FHIR 邁向國際

    0 分享
    分享 0 Tweet 0
  • 臺中榮總強化資安 扮演智慧醫療後盾

    0 分享
    分享 0 Tweet 0
  • 鎖定 AI 身分新邊界,智慧資安科技攜手 Delinea 共築韌性防線

    0 分享
    分享 0 Tweet 0
  • 資策會MIC發布2026年十大重點科技趨勢

    0 分享
    分享 0 Tweet 0
  • 從 Anthropic 事件看 AI 產業發展

    0 分享
    分享 0 Tweet 0
  • 【專訪】高雄醫學大學人工智慧生醫研究院院長盧鴻興

    0 分享
    分享 0 Tweet 0
  • 物流中斷的資安壓力測試 零日攻擊下的營運韌性

    0 分享
    分享 0 Tweet 0
  • 解碼「AI 工廠」:從個人桌面到跨國企業的數位生產線革命

    0 分享
    分享 0 Tweet 0
  • 【專訪】和泰汽車 MaaS 先進策略本部長韓志剛

    0 分享
    分享 0 Tweet 0

數位及平面

  • CIO Taiwan 網站
  • CIO 雜誌紙本
  • CIO 雜誌 HYREAD 版
  • CIO 雜誌 Zinio 版

關注社群

  • Line 加入好友
  • Facebook 粉絲頁

合作夥伴

  • CIO 協進會

關於我們

  • 公司介紹及工作機會
  • 隱私權政策

旗訊科技股份有限公司|統編:84493719|台北市 100 中正區杭州南路一段 15-1 號 19 樓|TEL: 886-2-23214335
Copyright © Flag Information Co.,Ltd. All Rights Reserved.

CIO Taiwan 歡迎你回來!

可用 使用者名稱 或 Email 登入

忘記密碼 註冊

歡迎註冊 CIO Taiwan 網站會員

請設定 Email 及 使用者名稱(使用者名稱不接受中文、將來無法更改)

欄位皆為必填 登入

找回密碼

請輸入 使用者名稱 或 Email 以重設密碼

登入
  • 登入
  • 註冊
沒有結果
查看所有結果
  • 活動
  • 影音
  • 產業速報
  • 新聞速寫
  • 風雲人物
  • 產業瞭望
  • 專欄
  • 精選文章
  • 原生現場
  • 供應商視野
  • 線上調查
  • CIO 雜誌
  • 電子報
  • 下載
  • 聯繫我們

© 2020 CIO Taiwan 版權所有

7/28 活動延期通知

因高雄市政府於7/28早上宣布全日停班停課,因此「智慧醫療研討會高雄場」活動延期舉辦。主辦單位將另行公告研討會相關訊息,歡迎報名參加!

您已閒置超過 3 分鐘了,為您推薦其他文章!點擊空白處、ESC 鍵或關閉回到網頁

公司簡介別再像履歷表:一個 Prompt,寫出真正打動客戶的故事型簡報

你的公司簡介還在列地址、人數跟創立時間嗎?醒醒吧,那是履歷表,不是簡報!本文分享

噤綠環境下的永續揭露準則

文/林呈欣 Cheng-Hsin LIN 站在 2026 年 4 月的時點,台灣

臺灣醫療人工智慧之負責任實踐:從國際倫理框架到臨床落地治理之全生命週期分析

文/李建璋 1. 緒論:醫療 AI 從技術導入邁向治理成熟期的戰略轉型 隨著資訊

國研院國家智慧機器人研究中心揭牌 共研共作機制加速產業創新落地

文/鄭宜芬 行政院推動「AI 新十大建設」及「智慧機器人產業推動方案」,規劃於沙

【簡報包】經濟部 A+ 佈局次世代通訊 瞄準 6G、衛星通訊、全光通訊

文/鄭宜芬 經濟部 13 日公告「A+ 企業創新研發淬鍊計畫-次世代通訊計畫」2

SEMI 首次年度會員調查:五成台業者面臨供應鏈調整壓力、八成難招人才

文/鄭宜芬 在全球 AI 需求強勁帶動下,台灣業者加速擴產與全球布局。SEMI

布局主權 AI  政府資料開放升級戰略資產

文/鄭宜芬 數位發展部 1 日舉辦「114 年政府資料開放頒獎典禮」,表揚中央與

從 Anthropic 事件看 AI 產業發展

文/洪為璽 在 2026 年初,AI 領域爆發了一場象徵性的衝突,焦點是企業對

金融業如何兼顧 AI 創新與「可解釋性」治理實務

文/徐燁儀 過往新興科技出現,各行各業爭相使用,企業內多僅要求高階主管或相關技術

文章分類

  • 產業速報
  • 專欄
  • 影音
  • 風雲人物
  • CXO分享
  • 產業瞭望
  • 原生現場
  • 精選文章
  • 趨勢分析
  • 供應商視野
  • 新聞速寫
  • 下載
  • Sponsors

熱門標籤

  • 最新文章
  • 雲端運算
  • 人工智慧
  • 數位轉型
  • 製造業
  • 物聯網
  • 資料與分析
  • 資安
  • 區塊鏈
  • 5G
  • 儲存
  • 基礎架構

活動

  • CIO價值學院 四堂課
  • 智慧醫療研討會 台北/高雄場
  • 金融科技高峰會 春季/秋季場
  • 製造業CIO論壇 台北/台中/高雄場
  • 商業服務科技論壇
  • 亞太CIO論壇
  • CISO資安學院 金融/醫療/新竹場
  • CIO Insight 調查

影音

  • 影音