益博睿(Experian)信用評等公司旗下的資料實驗室(DataLabs)正利用資料推企業創新與轉型。
文/Thor Olavsrud‧譯/高忠義
跨國消費者信用評等公司 Experian(益博睿),非常自豪該公司能夠利用資料來推動業務。直接負責資料應用與分析的部門,是該公司的 Experian DataLabs 團隊,該團隊透過先進的資料分析與研發,來幫助企業解決戰略行銷和風險管理問題,並以此來尋找推動顛覆性創新與轉型的各種機會。
北美 Experian DataLabs 資深副總裁暨首席資料科學家 Kevin Chen 說,如果看到相信能為客戶帶來高度利益與回報的機會,Experian DataLabs 就會投入研究資源在該項領域上,並努力設計出能夠投產的系統原型。
DataLabs 的團隊獲得來自主管們的授權,可以進行實驗並做長期規畫。團隊將概念落實而得出成果之後,將解決方案交給業務單位營運,之後重新投入在新的專案上。
Chen 表示,團隊總是有新點子可以進行嘗試,而且真的是讓 Experian DataLabs 能吸引市場上專業人才關注的重點。
無程式碼人工智慧的吸引力
Experian DataLabs 聚焦在找出 Chen 所提到的「有高度影響的問題」,針對這些問題找出解決方案,將可以協助事業轉型。
舉例而言,Chen 提到 Experian DataLabs 有一項專案,是關於連接來自 Experian 許多業務單位的資料。那些資料不只有消費者的信用資料,也還包括企業的信用,其目標同時包括線上與線下行銷,甚至也涉及醫療保健 IT 事業。
Chen 說明 Experian 資料事務之前的狀況,像是資料全部分散在公司各個單位,而且各單位似乎不太互相溝通,要將這些資料全部連結起來絕非容易之事。某個單位可能在資料組合中,採用不同方式呈現。DataLabs 採用機械學習來研究這些資料,並將個體進行配對來處理前述問題。
Chen 表示,一旦建立起解決方案,其中就可能包含 15 或 16 種不同的應用程式。
[ 2022年度CIO大調查報告下載 ]
現在無程式碼人工智慧是 DataLabs 重要的研究領域。無程式碼人工智慧宣稱的效益是能用拖放式介面配置機械學習模型,讓非技術背景的使用者也能利用人工智慧,而不需仰賴資料科學家。Chen 目前還並不完全相信這樣的承諾已經能實現:即使採用無程式碼人工智慧,組織還是需要在資料準備工作上依重專業人才,也需要資料處理的技能。
Chen 說,有了無程式碼人工智慧,Experian DataLabs 的目標,就是讓非技術人員也能調用資料,但那並不表示資料就會自動出現。就這點而言,一旦提及無程式碼人工智慧,事實上說的是如何讓公司裡的每個人都有分析資料的能力。讓一般人員都可以從資料中獲得重要知識,而且不需要專業人員幫他們拉出資料,就能自己進行資料分析、查詢,或建立模型。
在過去幾年,Experian 已持續建置 Ascend 分析沙盒,那是以之前 18 年累積的 2 億 2 千萬筆消費者信用資料與商業資料、財產資料與其他替代的資料來源為基礎的先進分析沙盒。
Chen 表示,Ascend 分析沙盒基本上是 Experian 所擁有的消費者信用行為資料藏寶庫。那是完全匿名的。目前 Ascend 分析沙盒已經建立起來,所以不論是 Experian 內部的,或外部的資料科學家,都可以探索這些資料。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球CIO同步獲取精華見解 ]
但無程式碼人工智慧可以讓此一概念能有更多的發展。藉此讓企業的決策者,例如風險經理人,有機會可以直接開啟沙盒與其中的資料。
Chen 透露道,分析人員可以查詢資料以瞭解顧客的趨勢,以及了解與其他顧客有何不同,以及其他類似的比較分析。團隊希望讓分析人員能夠進入沙盒,並直接用白話式英文查詢資料,且提出相關問題。
這個專案也被稱為 Ascend 互動專案,嘗試運用深度學習、自然語言理解(NLU),與自然語言處理(natural language processing)等技術,讓企業的決策者,有能力與 Experian 的大量資料藏寶庫直接互動。在不需要先將需求轉委託給資料專家小組的前提下,可直接添加企業組織的資料。
Chen 表示,目前已經不再只能將資料移轉給顧客的資料科學家,現在可以與多種不同的使用者分享這些資料;而使用者也可時常利用資料本身,立刻進行更直接的決策,同時資料科學家必要時還是可以協助支援。此種動態關係上的改變,基本上讓決策者重新獲得掌控權,所以決策者不再需要一直倚賴資料科學家。
瞭解意圖
不過該項計畫專案,目前尚處於研究開發的階段。Chen 表示,Experian 正從兩個角度進行這項專案。一個是 MLOps ,藉此對軟體工程與資料科學進行跨領域的整合,讓機械學習模型投入生產的過程,以及讓嗣後監督與維護的工作更加順暢。
如果從 MLOps 這個角度處理問題,就會找到聚焦在 AutoML 概念的解決方案,這能協助使用者將機械學習的程序自動化。
另一個角度則是商業智慧(BI)角度,著重在儀表板功能上,尤其是利用無程式碼人工智慧提供,以使用者當時需求為基礎的動態儀表板。
Chen 認為,目前重大的挑戰,在於如何確切瞭解使用者想要什麼。
團隊已經提供許多以深度學習為基礎的解決方案,嘗試藉此瞭解使用者想要什麼。需要能夠將使用者的意圖,與資料中真正具有的東西建立起關聯性。然後團隊需要能夠建置編碼,讓深度學習能真正地執行使用者想要的成果。
在此一挑戰當中,有一個重要部分,就是獲取領域專有的知識。Chen 提到,使用者時常已經對資料庫裡的資料,具有一定程度的領域專有知識。無程式碼人工智慧解決方案需要能呈現類似層級資料的相關領域專有知識,才能讓使用者感受到這是專家之間的對談。
(本文授權非營利轉載,請註明出處:CIO Taiwan)