優必達攜手夥伴打造的 Ubilink 超算中心,採用 1024 張 NVIDIA Hopper GPU 和 NVIDIA Quantum-2 InfiniBand 網路平台,全球市場排名 31 名。Lilith-3.3-70B 的 TMMLU+ 準確率高達 76.06%,是搶攻全球 AI 商機兩大利器。
採訪/施鑫澤‧ 文/林裕洋
隨著全球生成式 AI 技術風起雲湧,大型語言模型逐漸成為國際科技巨頭與各國政府爭相投入的核心領域。儘管市面上有眾多開源大語言模型,只是清一色都是以英語資料進行訓練,儘管部分版本有運用繁體中文進行優化,但是資料佔比可能往往不到 1%,難以真正符合臺灣市場的需求。為此,除臺灣政府基於「避免 AI 人才斷層風險」、「掌控 AI 服務存取權」等因素,推動打造可信任生成式 AI 對話引擎(TAIDE;Trustworthy AI Dialogue Engine)外,也有許多民間業者投入繁體中文大語言模型的工作。
如 2024 年優必達(Ubitus)以 Llama 3.3 70B 為基礎,推出全新繁體中文 AI 大語言模型 Lilith-3.3-70B。該模型經過精細微調訓練,專注於提升繁體中文語言理解、邏輯推理以及領域專業應用的表現。該模型在 TMMLU+、TMLU 和 MMLU 等多項基準測試中表現出色,尤其是在繁體中文驗證集「TMMLU+」上,以 76.06% 的準確率領先於其他模型,展現對繁體中文的高度語言理解能力。
[ 加入 CIO Taiwan 官方 LINE 、 Facebook 與 IG,與全球CIO同步獲取精華見解 ]
優必達創辦人暨執行長郭榮昌表示,Lilith-3.3-70B 展現優必達在 AI 技術創新領域的努力,我們希望透過此模型推動繁體中文應用普及,更希望能深入更多產業應用。除優必達擅長的遊戲娛樂產業,其他像是金融、教育、醫療等都非常需要本土大模型,我們也可為各領域用戶提供強大技術支持以及產業微調的服務,創造最高品質與表現的產業 AI 模型。
瞄準市場 AI 算力需求,推出 Ubilink 超算中心
創立於2012年,從雲端遊戲起家的優必達,可提供獨家一站式解決方案協助客戶創建雲端遊戲事業,不光已為多家遊戲開發商將其旗下遊戲雲化,也成功協助電信商打造自有品牌的雲遊服務。在雲端遊戲產業之外,該公司技術也能讓客戶的互動式、虛擬實境等豐富多媒體內容,快速串流至全世界。
看準全球市場對 AI 算力的強烈需求,優必達與正崴集團、森崴能源等攜手合作,共同成立「Ubilink 超算中心」。中心採用 1024 張 NVIDIA Hopper GPU 和 NVIDIA Quantum-2 InfiniBand 網路平台,達到 45.82 PFLOPs 的頂尖算力。目前此算力中心在全球市場排名 31 名,亞洲僅次於日本及中國。
值得一提,優必達也是臺灣第一間獲得 NVIDIA 輝達投資的科技公司,擁有世界頂尖的 GPU 虛擬化與雲端串流技術,可提供最佳的雲端及 AI 服務。
郭榮昌指出,雲端遊戲技術本質是分散式算力與即時串流,這與 LLM 部署極為相似。優必達過去在服務任天堂等國際品牌的 3A 級遊戲客戶時,累積處理延遲、互動、畫質等技術能力,這正好也是 AI 運算時會面臨的問題,也奠定我們切入 AI 服務領域的基礎。因此,與其說是公司業務「轉型」,不如說是優必達原始技術正剛好自然地延伸到生成式 AI 的應用。在現今 AI 時代講求「誰能掌握算力,誰就能主導產業」,所以我們才會攜手合作夥伴打造 AI 資料中心,為不同產業用戶提供 AI 服務,讓產業用戶僅需專注在自身上擅長領域之中,無需費心在建置 AI 算力上。
GPU 離峰共享讓算力效益最佳化
身為 NVIDIA Connect Program 生態系一員,優必達擁有頂尖的 GPU 虛擬化與雲端串流技術,目標成為全球領先的雲端和 AI 解決方案平台。在 AI 解決方案部分,該公司在提供 AI 算力服務之外,也提供多種以臺版大語言模型(Taiwan LLM)為基礎之 AI 服務,包含 UbiChat、UbiReal (AI 超擬真人)、UbiONE(AI 虛擬角色創建平台)、UbiArt(圖像生成軟體)和其他應用,讓合作夥伴及客戶享有科技服務。
傳統企業要打造 AI 算力基礎架構,往往得投資大量人力、費用等,現今只需支付少許費用即可享受強大 AI 算力服務,且不需要像其他公有雲業者服務得同步租用其雲端服務,可將寶貴資源集中在 GPU 資源上。而為了讓寶貴 GPU 資源獲得充分利用,優必達採用 GPU 離峰共享策略提升資源效率,尖峰時間以企業客戶的推論使用為主,離峰時間則用於自家的 AI 模型訓練,兼顧商業營運與技術研發。
「舉例來說,遊戲伺服器在白天的非高峰期,會出現大量閒置的 GPU 資源,我們建構排程系統在這些時段投入 AI 訓練。這種「算力分租、時段切換」機制大幅提升能源使用效率,也降低 AI 訓練成本。」郭榮昌解釋:「我們進一步提供此種共享資源架構給企業客戶,這是典型的「AI 即服務」(AIaaS)模式。這種模式對資源有限的臺灣中小企業而言,已經成為企業推動 AI 專案的重要管道。」
發表繁中 AI 模型 開源與商用旗下
2022 年起,優必達開始建構 AI 訓練平台與資料處理流程,並於一年多前正式啟動繁體中文語言模型訓練,而非僅是使用第三方 API 的應用公司,以取得更高的可控性與本地化能力。只是臺灣要發展在地話語言模型面臨雙重困境,首先是高品質繁體中文資料稀缺,其次是語言文化具有強烈在地特性,難以靠簡體中文或英語替代。
[ 推薦閱讀:AI 導入對大型企業是良藥還是毒藥 ]
舉例來說,臺灣用語跟中國、新加坡等華文國家幾乎都不一樣,如「報帳」與「請款」等詞彙,背後存在行政流程與企業制度等差異,若模型不了解語意背景,就無法真正融入企業應用場景。在臺灣大學的協助下,我們與多家領先企業合推出的「Project TAME」開源模型,是專為繁體中文及臺灣產業需求設計,不僅涵蓋電子製造、石化、醫療及法律等領域知識,還特別加強對臺灣文化和語境的理解,展現出超越國際大型模型如 GPT-4o 的表現。
至於 Lilith-3.3-70B 則是商業版本,強化推理能力與指令遵從性,支援臺灣多家客戶在客服、教育、金融場景部署。該產品高效處理繁體中文文本及複雜格式,為使用者提供精確回應,大幅提升體驗,亦為學術與產業基準測試提供可靠框架,推動繁體中文自然語言處理的研究與應用。
(本文授權非營利轉載,請註明出處:CIO Taiwan)
