許多資訊長在具有突破性進展的人工智慧模型上面看到契機,從撰寫行銷文案到軟體程式等眾多領域,皆可利用人工智慧來提高生產力,但前提是企業必須先做好正確的防範措施,以避免新科技帶來的風險。
文/Robert Mitchell‧譯/曾祥信
資訊長 Vince Kellen 清楚知道,ChatGPT、DALL-E 與其他生成式人工智慧(generative AI)技術的局限所在 ─ 有充分證據顯示:人工智慧回答的答案可能不是事實,生成的圖像可能缺乏構圖完整性,還有輸出內容可能帶有偏見 ─ 儘管如此,他還是決定繼續使用這項技術。Kellen 是聖地牙哥加州大學的資訊長,他表示,該校員工已在用 ChatGPT 撰寫程式和職缺說明書。
OpenAI 的文字生成器 ChatGPT 及其圖像生成兄弟 DALL-E,無疑是眾多大型語言模型(又稱為生成式語言模型或生成式人工智慧)當中最突出者,它們在去年席捲全球,引發世人無限想像。這些模型能根據輸入的文字問題,產生出各式各樣的回應內容,從文件、圖像到程式都難不倒它們。
Kellen 將 ChatGPT 產生出來的程式,視為一種生產力提升工具,如同當年編譯器(compiler)為組合式語言(assembly language)帶來的重大改進。他表示:「產生函式庫和軟體的工具,其實跟搜尋 GitHub 沒什麼兩樣。此外,我們也用它來撰寫符合我們內容與格式的職缺說明書,這樣我們可以迅速地展開編輯工作,尋找內容中錯誤及虛構的部分」。雖然 ChatGPT 技術發展還在早期階段,對某些企業應用情境來說,例如內容與工作流程密集的情境,它已發揮無可否認的影響力 ─ 但是,務必要謹慎使用。
準備就緒的應用情境
德國運輸公司 DB Systel GmbH 是德國鐵路(DB AG)的全資子公司,同時也是所有集團公司的數位合作夥伴,該公司的資訊長兼產品負責人 Oliver Wittmaier 表示,生成式人工智慧已經可以用在編寫程式、行政工作流程、資料精煉(data refinement)以及簡單的使用情境,例如預先填寫表單。對於運輸企業而言,他說:「人工智慧將直接或間接地影響:運輸的中斷、控制與管理層面」。
內容生成亦是 Michal Cenkl 特別有興趣的一塊領域,Cenkl 是 Mitre 集團公司的創新及實驗部門總裁,他說:「我想要的是,透過對話方式,對文章脈絡做出總結並改進文字內容,這正是這些大型語言模型提供的功能」。目前他的團隊正在研究知識與專家領域中的兩項應用案例,「第一項應用,發生在撰寫電子郵件給我們的贊助者時,我希望在郵件中,總結我們完成的工作當中與他們有關的部分,同時以我們過去與他們溝通過的風格及方式來撰寫。在此應用情境裡,內容自動生成的強大威力令人難以置信」。
第二項應用是專案人力招募。通常,Cenkl 在檢視履歷時會搜尋技能標籤,以尋找適合某項專案的人選。生成式人工智慧有助於加速這項工作。「例如,我可能會問:『Michael 在這個專案上能做什麼事情』,人工智慧能根據他履歷上目前的工作,做出一份總結說明他能帶來的貢獻,而不需要我親自細讀履歷來製作總結」。
[ 2023年企業IT投資重點為何?資安、人才、ESG如何部署?下載 CIO大調查報告 立即揭曉!]
二手汽車零售公司 CarMax 使用生成式人工智慧已有一年之久,他們利用 OpenAI 的應用程式界面(API),將顧客評論整合成更容易掌握及閱讀的總結內容。CarMax 資訊長 Shamim Mohammad 表示,他的團隊已經將這項技術的應用擴展到其他領域。
其中一項應用是汽車圖像,普遍認為是改進顧客體驗的一種方式。Mohammad 說,他們用人工智慧來最佳化公司資料庫的每輛汽車圖片,他們任何時候都有 5 萬到 6 萬張的圖片。他說:「我們儘可能讓每張圖像看來逼真卻又不失合法性」。例如,他們的資料科學家創造出「數位清潔工」(digital sweeper)模型,可將汽車圖像裡髒汙的地面替換成潔淨光亮的地板。他說:「這仍是同一台車,只是它現在看起來更棒了,對顧客來說,這就是更好的體驗」。
Forrester 研究顧問公司分析師 Rowan Curran 表示,Nike 也在做類似的事,他們用生成式人工智慧來產生產品原型的圖像,他說:「你可以用文字轉換成 3D 模型建立圖像,再進行 3D 測試,這種作法可以深刻感受產品原型在真實世界裡的樣貌 ─ 重點是人工智慧讓這一切變得非常容易」。
潛在回報最大的應用情境
Mohammad 表示,目前 CarMax 公司利用生成式人工智慧優勢的主要領域,在於建立程式碼與改善顧客體驗,就效率提升而言,這些是潛在回報最大的項目。
金融服務公司 TruStone Financial Credit Union 執行副總裁兼資訊長 Gary Jeter 表示,這些也是他的開發人員正在致力的領域,他們用的是 OpenAI Codex 模型在 GitHub 上的實作程式碼。他提到,用生成式人工智慧撰寫軟體程式的成果相當理想。Cenkl 補充道,比起人類語言,生成式人工智慧更擅於處理程式碼,因為程式語言具有更嚴謹的結構。Cenkl 說:「由於程式語言的高度結構化特性,人工智慧可以由龐大混亂資訊中找出關鍵資訊,也就是說它可以「梳理」這種結構,這是為什麼它處理程式碼極有效的原因」。
CarMax 正在試驗 GitHub Copilot(GitHub 和 OpenAI 合作開發的人工智慧工具),Mohammad 說在某些情況下,它能為軟體工程師自動產生出高達 40% 的程式碼。Mohammad 說:「這項技術發展相當迅速,但是如果你用它來創造軟體,必須確保生成的程式碼當中,沒有違反著作權,也沒有偽造內容或惡意軟體(malware)」。
分析師 Curran 表示,目前已臻成熟可供企業應用的領域還有:產生行銷文稿、圖像、設計,以及為既有資料建立更好的總結,讓人們可以更有效地消化資料內容。他說:「有些人甚至將這些大型語言模型作為清理非結構化資料的方式」。接下來幾年內,生成式人工智慧也許會開始出現在企業軟體之中,從 IT 支援軟體到 Microsoft Office 軟體都有可能。
必須確認而非盲目信任
CarMax 的 Mohammad 警告,雖然生成式人工智慧能帶來許多好處,但是資訊長在運用這項技術時,務必要注意生成內容當中潛藏的智慧財產權問題。像 DALL-E 這種生成式模型是利用網路上的資料進行訓練,產生出來的內容可能會侵犯具有著作權的內容,圖片交易公司 Getty Images 最近控告 Stability AI 機構的人工智慧藝術生成工具 Stable Diffusion,正是由於侵犯著作權的緣故。
這項科技同時也需要人類的監督,Cenkl 說:「像 ChatGPT 這類系統對於自己寫出來的內容根本毫無概念,但是它們很擅於說服你,它們講的是對的,即使是事實不然時」。現在還沒有人工智慧保證 ─ 沒有任何歸因或參考資訊能讓你得知它所回應內容的來源出處,也沒有人工智慧解釋能力,去說明為什麼它會這樣寫。他說:「你無從得知生成內容的基礎何在,也無法知道訓練資料集當中有哪些部分會影響人工智慧模型。你所得到的,只是既有資料集的分析結果,因此你獲得的內容不但可能帶有偏見,甚至可能根本違背事實」。
Wittmaier 對這項科技樂觀其成,但他也認為目前還在早期階段,不能部署在面對顧客的應用情境。他表示,短期內我們可將技術運用在辦公室軟體套件、顧客服務聊天機器人、服務台功能(IT 支援)及一般文件,但是在運輸公司業務中與安全有關的領域,他的答案是 ─ 絕對不行。他說:「要在如此敏感的領域中使用生成式人工智慧,我們還有很多要學習和改進之處」。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]
Jeter 也有相似的顧慮,雖然他的團隊利用 ChatGPT 找出修復程式缺陷的方式,並且可在 30 分鐘內部署到網站 ─ 「要是沒有 ChatGPT 的協助肯定會花上長很多的時間」 ─ 而且他認為在起草合約的條款和條件時也有幫助,但 ChatGPT 不是完美的。他說:「我們不會曝露任何生成式人工智慧給外部會員,TruStone 不會在顧客領域使用潛藏風險的超尖端科技」。
他補充道,當 TruStone 最終使用這項科技為其會員帶來好處時,他們會透過人工和自動檢閱方式來監控人工智慧的對話,以保護他們的會員與自家品牌。
聖地牙哥加州大學的 Kellen 表示,目前成功部署的關鍵仍在於人為的介入,我們必須檢視生成內容的正確性,以及是否符合法規。他說:「確保電腦做出正確決策,已成為訴訟時的關鍵因素。在企業組織將生成式人工智慧用在任何具有高風險的工作以前,例如醫療診斷,我們還有很長的一段路要走」。不過在人為監督下,用生成式人工智慧來產生某些內容,像是顧客評論總結,是沒有問題的。他說:「人為介入會稍微拖慢進度,但這是正確的作法。最終,我們會找到確保品質的自動化方法,但是現在,你必須要有檢閱流程來確保生成內容正確無誤」。
除了正確性之外,另一項證據充足的風險是潛在的偏見,這是由用來訓練人工智慧模型的資料所帶來的。當生成式人工智慧用的是公開網路上的資料內容時,這項問題會特別嚴重,例如 ChatGPT 的做法,但是如果你訓練模型的來源是企業私有的資料,讓你得以檢查內容是否帶有潛在偏見的話,這個問題的嚴重性就會減輕很多。Kellen 說:「如果資料來源有越多來自企業,也就是資料的種類較有限制且較平凡無奇的話,生成式人工智慧反而越能發揮威力」。
Cenkl 表示:「你要明白,某方面來說大型語言模型就像精通特定技能的學者,他們不了解所有事物,但是他們很擅長運算」。
對工作職責和角色帶來的改變
「科技確實帶來進步,但同時也為我們創造出很多額外的工作」,Mohammad 如此說道。儘管如此,他相信生成式人工智慧會不一樣,他說:「這項科技令人感到興奮,因為它會處理掉人類不愛做的事情,讓我們變得更有智慧。它會讓人類更加進步」。
不過 Curran 指出,短期內生成式人工智慧還不足以完全取代任何工作角色,他說:「它也許能減少執行某個職責的人數,例如內容發展、產品資訊管理、或是軟體開發,但是永遠會有人為介入的需要」。Mohammad 也補充道,即使這項科技能夠撰寫及總結文字,我們永遠都需要人類的智慧來確保品質,並掌控生成的內容,使其更加完善。
著手開始的步驟
現在就是開始試驗生成式人工智慧技術的時機,Kellen 如此表示,「資訊長必須在被供應商以天花亂墜宣傳之詞迷惑以前,事先深入了解這項科技之謎,因為供應商可能會將此技術植入他們提供的企業軟體」。他說:「如果你接下來一年都還裹足不前,就會處於落後局勢了」。
Curran 說,很重要的一點是學習 ChatGPT 背後原理,理解必須比公眾討論的程度更加深入,以了解這項科技的複雜程度遠超過任何單一應用軟體。接著,開始思考有什麼使用情境,是生成式人工智慧有機會提升既有流程的效率或品質的。最後,自問你需要何種類型的人工智慧能力,評估是否可以從供應商手中取得這種能力,抑或自己建立。
接下來的重點就是測試這項科技,同時謹慎思考可能的使用案例。Cenkl 說:「無論系統使用的是結構化或非結構化資料,你的很多系統必定具有某個處理自然語言與對話介面的元件。仔細思考你手中握有的資料,有哪些部分是可以利用人工智慧技術去加強的,然後透過實驗來證明其潛力」。例如,Jeter 提到他用人工智慧產生出一份條款和條件的範本,寄給他的法規遵循部門,向他們展示如何使用這項科技。
Curran 表示,生成式人工智慧模型極為龐大,從頭訓練模型的成本非常昂貴,因此最理想的方式是由某個雲端服務開始著手。以 CarMax 為例,他們使用微軟提供、配載 GPT 3.5 模型的 Azure OpenAI 服務,Mohammad 說:「我們在模型載入的資料為我們所有,不會與他人共享。我們可以擁有數量龐大的資料,且非常快速地處理資料以執行我們的模型。如果生成式人工智慧科技有可能為你的團隊或商業問題帶來幫助,不妨放手一試」。
(本文授權非營利轉載,請註明出處:CIO Taiwan)