著名披薩業者達美樂 (Domino’s) 利用新興的MLOps,協助企業資料科學團隊更新資料模型;並在沒有IT部門協助的情形下,直接放上正式營運環境進行運作。
文/Clint Boulton‧譯/葉庭筠
與許多全球知名品牌公司一樣,達美樂 (Domino’s Pizza) 相當仰賴資料來提升客戶服務。但這家全球最大披薩業者的資料科學團隊,還採用了一項支援決策的祕密武器:機器學習 (machine learning, ML) 代管平台,協助企業更快產出資料模型,並將模型上線至正式營運環境。
該公司團隊利用ML平台來執行、精進和驗證多種ML與人工智慧 (artificial intelligence, AI) 模型,並減少依靠IT部門取得運算資源,而後者向來會引發部門之間摩擦的問題,達美樂資料科學與AI主管 Zack Fragoso 如此說。
[ ????推薦閱讀: 數位客戶體驗:在疫情中奮戰成功的關鍵 ]
「披薩大大受到消費者歡迎,因此我們必須要處理大量的訂單,」Fragoso說。「我們在披薩生產上的當務之急,就是將AI模型上線至正式的營運環境。」
利用分析技術產出商業洞見就已經是一項很具挑戰的任務,但資料科學人員還必須應付從IT部門取得資源的延遲狀況,像是從伺服器到軟體開發環境的供應等。這類延遲對必須以最即時的資料模型,來協助決策及達成必要業務產出的資料科學團隊而言,會造成很大困擾,Fragoso說道。
達美樂走向MLOps之路
一年營業額達140億美元的達美樂,解決這項挑戰的方式之一,是找來成軍甫五年的新創公司Datatron協助。Datatron提供平台,協助企業讓ML模型更容易進入正式營運環境,即所謂MLops。Datatron在這方面的競爭者,則包括了DataRobot與Google等公司。
Datatron是達美樂強化資料科學實力的最新工具之一。Fragoso在2018年剛加入達美樂時,只是資料科學團隊的第7號成員。達美樂以前的電子商務系統模型產出方式相當傳統,必須每天從公司各地分店蒐集資料,向IT部門申請取得資源,再放入最新資料來執行、更新模型。但即使從模型到營運分析只產生了24至48小時的延遲,但還是減損了資料的精準性。
「我們面對的困難是,有很多接觸點,還是多耗費了不必要的時間來更新。」Fragoso說。
時至今日,達美樂的資料科學團隊擁有63名員工,負責在達美樂私有雲上執行Datatron與Kubernetes容器協作軟體部署、執行和校正ML模型。這些軟體的虛擬化能力,可協助資料科學團隊了解顧客體驗和分店作業長期以來的變遷,使他們能夠根據最新資料來更新模型,Fragoso說明。
[ 下載 2020-21 CIO大調查報告,掌握ML運用最新趨勢 ]
像是Datatron可讓達美樂執行A/B測試,將一小批流量導流至B測試網站以驗證新模型可行性,而完全不會影響到電子商務或分店營運部門。「隨著新資料的加入,我們得以不斷改進、開發和更新模型。」
最後達美樂和Datatron合作,藉由預測每家分店的員額需求改善勞動排程、最佳化送貨司機的車輛路線,並找出適合設立新分店的地點等等。Datatron更協助達美樂追蹤,是否有產生資料模型漂移 (drift) 的情形,這種現象會讓店面營運常因時間推移,而發生模型預測不準的現象,Fragoso解釋道。
在企業開始導入最新的複雜科技專案時,有可能造成部門之間的緊張氣氛,需要大量居間協調工夫,這也是變更管理中常見的議題。在達美樂導入Datatron時也不例外,該公司資料科學團隊的營運產出,在過去十分需要IT部門協助。但是Datatron專案的成果,讓資料科學部門大量減少了「合情合理的懷疑」,Fragoso這麼認為。
「對資料科學和IT兩個團隊來說算是雙贏;資料科學團隊現在變得更積極投入,而IT部門也不用被迫因應資料科學團隊的需求,而必須特地擠出資源。」
ML在真實營運中奮戰
達美樂資料科學部門面對建立資料模型,以及將模型應用到正式營運環境的挑戰,在各企業裡其實是很普遍的問題。根據2020年Gartner所公布的一項研究顯示,到2023年,有 50% 的IT主管,無法將預測式專案由測試階段推升至正式營運環境,主要原因在於技術門檻、資料品質不良及其他相關問題。部門間衝突也讓這種情形雪上加霜,需要資料科學家、資料來源系統專家、資料架構師、應用開發人員等不同方面專家的共同努力合作。
雖然許多資料科學家來自四面八方,包括了統計學家、物理學家和其他領域的專家,但這些人大部分都沒有資訊科系背景或程式撰寫經驗,更不要說具備軟體基礎架構和流程的能力,但他們卻能推動ML模型擴充能力,Datatron執行長 Harish Doddi 如此表示。
[ 加入 CIO Taiwan 官方 LINE 與 FB ,與全球CIO同步獲取精華見解 ]
相反的,大部份基礎架構工程師也欠缺建立資料模型的經驗,這也是為什麼資料科學需要和IT部門合作與協調。在成立Datatron前,Doddi在知名企業如線上汽車共享平台Lyft(Uber競爭者)、通訊軟體商Snap和社群平台Twitter擔任軟體工程師,在工作期間都觀察到了這類知識鴻溝。
在一般AI模型的生命周期中,是由資料科學家先開發模型,接著交給基礎架構工程師,由後者將之套用到正式營運環境。Datatron的軟體,則把大部份科技限制都以自動化方式完成,讓資料科學團隊得以專心執行他們的SAS、R、ML和迴歸模型。Datatron也會監控正式營運環境下的模型,並防止模型漂移,因資料漂移現象會讓資料變更造成模型預測能力減弱。
「AI模型只有在應用在正式營運環境時,才能真正發揮生產力。」Doddi說。而MLOps,則可協助資料科學家,順利渡過這段過程。
( 本文授權非營利轉載,請註明出處:CIO Taiwan )