更多的新興生成式 AI 模型

除了家喻戶曉的生成式 AI 模型外，還有其他許多新興方案選項供企業採用。以下說明某一些或許適合的，也提出更多不同用途的選項。

文／Maria Korolov‧譯／高忠義

自從 OpenAI 的 ChatGPT 在去年冬天獲得破記錄的採用率之後，各種規模的公司行號均嘗試找出一些生成式 AI 的甜蜜魔法加以利用。

事實上，根據 Lucidworks 在 8 月 10 日發表的全球生成式 AI 標竿研究，參與 AI 決策過程的高階主管與經理人中有 96% 積極地將生成式 AI 列為優先投資選項，而有 93% 的公司計劃在明年增加 AI 的支出。

在那些正部署生成式 AI 的企業中，就算不是大多數企業，但仍有許多企業是從 OpenAI 開始，而且通常是透過微軟的 Azure 的私有雲。Azure 的部署讓公司可以建構自有聊天機器人，這表示它們不用擔心資料外洩成了 AI 的訓練資料集。而許多組織已與微軟建立關係，而對於從該公司獲得的安全性、管理能力與企業支援感到放心。

舉例來說，軟體供應商 Nerdio 運用生成式 AI 為其顧客編創 Powershell 指令，轉換安裝程式編碼的語言，並創設具客製化支援功能的聊天機器人。

聊天機器人可以執行許多這類任務，但是常用支援聊天機器人正運用另一種稱為 text-embedding-ada-002 的模型，這是 OpenAI 提供的另一種生成式 AI 模型，專門為了配合嵌入而設計，這是一種資料庫，其設計目的就是要餵資料給大型語言模型（LLM）。通常的方法包括向量資料庫與圖資料庫。

「我們正用各種指令與升級票來建置向量資料庫，而將這項資料庫提供給各種 AI 的實例加以運用，」Nerdio 資深技術產品經理 Stefan Georgiev 這麼說。

採用嵌入方法讓公司可以創造事實上具有通用功能的生成式 AI，卻不需要從頭開始訊練 LLM。

「我們很難獲得需要的大量資料而能自己訓練生成式 AI，」Georgiev 這麼說。「我們必須建立資料管線以蒐集並匯整我們的所有的資料，與運用型態，之後才能建立我們自己的模型，而且適合我們的空間規模。但我們並未這麼做，也不打算這模做，因為已經有相當好的生成式 AI。而我們需要做的只是配合我們的需求，將那些專門化。」

但是雖然 OpenAI 是第一家出閘的公司，但已經不是唯一的選擇。許多公司正審視 Google 的 Bard、Anthropic 的 Claude、 Databricks 的 Dolly、Amazon 的 Titan 或 IBM 的 WatsonX，也評估像是 Meta 的 Llama 2 這類開源 AI 模型。

開源模型也愈來愈容易部署。事實上，微軟已經宣布他們將在 Azure 雲中支援 Llama 2，而 AWS 也已透過 Amazon Bedrock 服務支援多種來源的 LLM，包括 Anthropic、Stability AI、AI21 Labs 與 Meta 的 Llama 2。

[ 加入 CIO Taiwan 官方 LINE 與 Facebook ，與全球 CIO 同步獲取精華見解 ]

S&P Global Market Intelligence 正檢視所有這些開源模型。

「我們使用微軟、Google、Amazon，也使用來自 Hugging Face 的開源模型」這家全球財金資訊公司的資料科學主管 Alain Biem 這麼說。

舉例來說，S&P 透過 Azure 採用 OpenAI API，但那只是該公司可以運用的眾多 AI API 之一。

「我們對於大型語言模型抱持高度不可知的立場，」他這麼說「我們基於不同的使用情境選擇不同的 LLM。我們的哲學是不被任一種模型鎖住，而我們採用的產品開發方式讓我們可以更新這些模型，或者在不同的供應商之間轉換。」

他說，該公司也密切觀察 Hugging Face leaderboard，雖然截至目前主要仍採用 Llama 2 與其變形。Meta 在七月發布 Llama 2，而它在其他開源生成式 AI 專案特別出眾，主要原因在於它的規模、與能力，還有它的授權條件：公司可以免費使用，甚至商業運用也不用前。唯一的限制在於現在每天超過七億的實動用戶需要取得 Meta 的特別許可。

Biem 表示，跟 Hugging Face platform 平台上的其他開源模型一樣，S&P Global i 正對 Llama 2 進行測試。

KPMG 的資料與分析管理總監 Sreekar Krishna 表示，許多公司從 OpenAI 開始。但它們不需要只停留在 OpenAI。

「與我有業務合作的大多數機構並不採用單一供應商的策略，」他這麼說。「他們很清楚，就算你一開始是用 OpenAI，那也只是個出發點。」

更常見的情況是公司考慮使用 Google 的 Bard next，尤其如果他們本來就已經使用 Google 雲或其他 Google 平台。

另一個受到歡迎的選項則是 Databricks，這是企業資料科學團隊愛用的資料管線平台。該公司在四月份那時推出了 Dolly，那是它的開源 LLM，而在七月開始同時許可做研究用途與商業用途，這也為 Llama 2 提供支援。

「Databricks 平台可以處理大量的資料，而且也已成為最廣泛使用的企業開源平台，」Krishna 如此表示。

Krishna 提到，Dolly 與 Llama 2，以及來自 Hugging Face 的其他開源模型一樣，微軟也將支援。

他說，「這是個演變非常快速的局面」。「我們覺得每一個超大規模的雲端服務商很快都會推出開源生成式 AI 模型。」但由於這個領域變動非常快速，公司不應執著在哪個模型最好，而應多花時間思考建構具有彈性的結構。

「如果你能建立好的架構」他這麼說，「你的 LLM 模型就能隨插即用；你可以快速地架設更多的 LLM 模型。那就是我們正在做的事情。」

他說，KPMG 也正實驗建立可以利用 OpenAI、Dolly、Claude 與 Bard 的系統。但除了 Databricks，還有別的資料平台可以運作自有的 LLM。

跨國顧問公司 AArete 科技解決方案總監 John Carey 則使用 Document AI，這是 Snowflake 早期發布的新模型，讓人們可以針對非結構化的文件提出問題。但更重要的，它讓 AArete 可以為企業客戶提供安全方案。

Carey 表示，「他們信賴你，將資料交給你，其中可能包含顧客資訊」。「你有直接的責任必須保護他們的隱私。」

他說，Snowflake 的 Document AI 是一種 LLM，可以在安全的、私密的環境下執行，不存在將私有資料移給外部服務商的風險，或者最後被用來訓練供應商模型的風險。

「我們必須確保這項資料的安全性，並確保有存取控制，以及有標準的資料管理機制，」他這麼說。

內容目錄 隱藏

大型基礎模型之外的選項

走向輕盈

生成式 AI 不只與語言有關

大型基礎模型之外的選項

運用大型基礎模型，透過微調或嵌入將其客製化以供商業用途，這是企業目前部署生成式 AI 的方式之一。但有些公司走另一條路徑，則是評估範圍較窄，專門化的模型。

「我們已看到市場中興起特殊領域專用的模型」，Gartner 的分析師 Arun Chandrasekaran 這麼說。「這類模型通常複雜度較低，也較便宜。」

他說，Databricks、IBM 與 AWS 都有這樣的方案。

有些模型是專門產生電腦編碼或可以描述圖形的模型，以及執行其他專門科學任務的模型。Chandrasekaran 表示，可能還有其他一百多種模型，公司可以用多種不同的方式加以運用。

如果沒有隱私或安全疑慮，公司可以運用公共版的生成式 AI 模型，像是 ChatGPT、Bard 或 Claude，或者在私有雲（像是 Azure）中執行這些模型。Chandrasekaran 表示，公司還可以透過 API 連上這些模型，用嵌入提升功能，透過提供新資料進行訓練以微調既有的模型而開發出新的客製化模型，這是最複雜的方法。

「你必須取得資料並加上註解，」他這樣表示。「所以你現在有了模型，而必須支付推論與託管成本。也因此，我們目前尚未看到大規模的微調。」

他說，但可能因為出現更小、更容易、也更便宜的新模型讓公司可以進行更多訓練、並加以部署的新模型，改變那樣的狀況。

他補充，公司還有另一個選項。

「也就是你自己從無到有打造自有模型，」他這麼說。「許多公司並不會這麼做，除非你是 Fortune 50 大公司，即使那些大公司，也只針對極特殊的用途這麼做。」

對許多公司來說，運用現成的模型，並增加嵌入，是他們選擇的方法。他說，運用嵌入也有另外一項優點。

「如果你用了正確的架構，像是向量資料庫，AI 可以在回答內容中加入參考資料，」他這麼說。「而且你可以真的微調這些模型，讓它在沒有參考資料時就不回答。」

公用的聊天機器人，像是 ChatGPT 就做不到這點。「線上聊天機器人沒有謙遜的美德，」Chandrasekaran 這麼說。「但有了企業版的聊天機器人，它就會說，『我不知道答案。』」

走向輕盈

較小的模型不只更容易微調，也可以在更多樣的部署選項中執行，包括在桌上型電腦或甚至手機中運作。

「六個多月的訓練期間，也處理了數十億的參數」，科技研究與顧問公司 Omdia 的 AI 平台、分析與數據管理首席分析師 Bradley Shimmin 這麼說。「而現在只需要幾個小時就能訓練一個模型。你可以快速地複製並改善模型，加以微調，然後優化以利在較小的硬體上運作，或提升效率。」

公司可能用開源碼來編寫模型，例如 Llama 2，這可能有三種不同的規模，而後加以客製化以達成特定目的。

Shimmin 表示「這樣做的成本遠比使用 GPT 4 的 API 少了許多」。

如果公司開始採用 AI 時，對 AI 瞭解不多，則較小的模型也讓公司有實驗的餘裕。

「你可以實驗一下，而不用花費許多金錢，」他這麼說。「之後就能很快地獲得成功」。

以 Gorilla 為例，那是以 Llama 為基礎，在 1,600 APIs 上為微調過。

「它的建置目的在於學習如何引導 API」Shimmin 補充表示。「實際運用的情境包括企業內部的資料整合。你不再需要維持一個管線，它可以快速地進行根本原因分析，自我修復，建立新的整合，一定讓你大吃一驚。

他說，挑戰之處在於找出在什麼地方使用哪個模型，以及管理各種不同的許可條件與複雜的要求。而且，如果要讓 LLM 可操作化，還有許多工作需要完成。

生成式 AI 不只與語言有關

語言模型在企業界獲得最多關注，因為它們可以編寫程式碼、回答問題，摘要文件內容，並產出行銷電郵。但除了文字之外，生成式 AI 還可以做很多事。

在 ChatGPT 尚未登上新聞頭條的幾個月之前，還有另一個引領風潮的生成式 AI Midjourney。圖像產生器快速演進，甚至 AI 產生的圖像與真人創作已經難以區分，甚至還贏得藝術與攝影大獎。

DeadLizard 是個精緻的創意機構，它的客戶中也包括迪士尼，該公司不只使用 Midjourney，還有其他數種影像工具，包括 Stable Diffusion 與 ClipDrop 以進行影像編輯，也用 Runway 產出動畫。

那些產出的圖像運用作公司自有品牌的社群媒體內容，此外也用來激發創意，以及開創性的研發程序。

「藉由增加開源的生成式 AI 工具組。那等於打開了各種極具價值的創意頭腦與觀點的整個網際網路，」DeadLizard 的共同創辦人 Todd Reinhart 這麼說。「這有助於加速構思過程。」

他說，在這階段即使是奇怪的或不合邏輯的點子也可能有助益，因為那可以跳出通常的舒適圈之外激發解決方案。而且，新的生成式 AI 工具可以大幅度地改善相片編輯能力。以前，公司必須自行拍攝，這通常很耗成本，只有最大的專案才花得起這樣的成本，或者使用庫存的相片與 Photoshop。

「我們現在幾乎每週都會發現全新的工作流程與工具組，」他這麼說。

(本文授權非營利轉載，請註明出處：CIO Taiwan)

標籤: AI AI模型人工智慧生成式AI

更多的新興生成式 AI 模型

思科WebexOne大會發布全新Webex人工智慧策略以一系列Webex人工智慧解決方案重新構想通訊方式

生成式AI：將成資安新戰場【台灣二版資安防禦術】協助企業構建資安治理新藍圖

相關文章

3 大領域：企業透過生成式 AI 而獲得的生產效益

生成式 AI 應用在軟體開發領域

將生成式 AI 落地是一個移動目標

生成式AI：將成資安新戰場【台灣二版資安防禦術】協助企業構建資安治理新藍圖

數位及平面

關注社群

合作夥伴

關於我們

CIO Taiwan 歡迎你回來！

歡迎註冊 CIO Taiwan 網站會員

找回密碼

7/28 活動延期通知

您已閒置超過 3 分鐘了，為您推薦其他文章！點擊空白處、ESC 鍵或關閉回到網頁

【專訪】台達副總裁暨企業策略業務發展和聯盟總經理柯淑芬博士

人工智慧與區塊鏈聯手管理大麻產業

台商耕耘越南多時台幹青黃不接

華碩雲端：全球資料量暴增數位治理更為重要

三個應用案例細說邊緣分析的價值

文章分類

熱門標籤

活動

影音

更多的新興生成式 AI 模型

大型基礎模型之外的選項

走向輕盈

生成式 AI 不只與語言有關

思科WebexOne大會發布全新Webex人工智慧策略 以一系列Webex人工智慧解決方案重新構想通訊方式

生成式AI：將成資安新戰場 【台灣二版資安防禦術】協助企業構建資安治理新藍圖

相關文章

數位及平面

關注社群

合作夥伴

關於我們

CIO Taiwan 歡迎你回來！

歡迎註冊 CIO Taiwan 網站會員

找回密碼

7/28 活動延期通知

您已閒置超過 3 分鐘了，為您推薦其他文章！點擊空白處、ESC 鍵或關閉回到網頁

文章分類

熱門標籤

活動

影音

思科WebexOne大會發布全新Webex人工智慧策略以一系列Webex人工智慧解決方案重新構想通訊方式

生成式AI：將成資安新戰場【台灣二版資安防禦術】協助企業構建資安治理新藍圖