美國航空航太製造廠洛克希德馬丁(Lockheed Martin)企業營運資料暨分析長 Matt Seaman 表示,國防承包商賦予其資料科學家自助式服務和集中式建模功能。
文/Clint Boulton 譯/徐立馨
企業資料科學家對於無止盡地重複著,致力於取得建構資料模型所需的技術資產感到洩氣。但這並不是唯一的困境。因諸多計劃在各自為政的狀態下進展緩慢,使得資料科學團隊一般都會付出雙倍的努力。這是種擺盪在冗餘與困境中令人惱怒的狀態。
大家對於這類異議並不陌生,國防承包商洛克希德馬丁公司安裝了一個軟體平台,以提升機器學習(ML)和人工智慧(AI)模型開發的效率。洛克希德馬丁企業營運資料暨分析長 Matt Seaman 表示,該平台將建構資料模型所需的資產集中化,進而讓企業支出於機器學習和人工智慧計劃的成本每年降低了2000萬美元。
[ 加入 CIO Taiwan 官方 LINE 與 FB ,與全球CIO同步獲取精華見解 ]
Seaman表示,自助式服務能力對於企業利用資料民主化的方式是不可或缺的。我們正在減少開啟與執行新計劃的障礙,這將有助於我們能利用資料制定更佳與更快的決策。
自助式服務技術的採用正受到越來越多的關注,這表示著下一個階段的IT消費者化現象。而此現象在十幾年前已讓數百萬名工作者應用行動式電腦和應用程式取得服務。或許資料科學所帶來的利益無處不在,進階的分析潛力有益於發現商業洞察。然而其亦受限於冗餘的流程,而這些流程長期以來使得企業無法發揮其潛力。
清除配置障礙
Seaman表示,洛克希德馬丁在企業資料科學管理平台 Domino Data Lab 的協助下解決了這個問題,Domino Data Lab 的協作平台證明該公司的300多名資料科學家不僅能更有效率地建構資料模型,還為將來新進的資料科學家奠定了基礎。
在使用 Domino Data 之前,洛克希德馬丁的資料科學家花費了大量時間確定所需的運算資源,並向IT部門提出請求。這些員工們總是等待著IT人員在伺服器上建構、安裝和配置整合性的開發環境(IDE)和其他相關的程式設計工具,並在每次存取各自所屬的計劃和資源時登入該伺服器。但有許多的資料科學家正從事著多項計劃,這些計劃通常需要多個系統、伺服器和IDE,這導致他們得週期性地花費時間來處理連接性問題。
[CIO都在讀: 資料治理-資料資產管理的最佳實踐框架 ]
花費時間購買基礎建設,或從事軟體工程花費較少時間建構資料模型的資料科學家們。洛克希德馬丁並無法確定資料科學家展開作業時的痛點,更不用說追蹤計劃的狀態了。
Seamans表示,我們對有哪些人正試圖驅動創新並不清楚,更不用談有誰需要被激勵。這是要從各自獨立資訊不流通的地方取出資料,並以更有效率的方式將其移交給需要的人。
資料建模平台是有門檻的
Domino Data 將這些功能整合到以瀏覽器為基礎的圖形化使用者介面(GUI)中,使用者可以透過軟體、機器學習庫和基礎建設的樣版功能表利用開發資源。他們可以選擇程式設計語言(Python、R、SAS等)和隨選運算資源(CPU、GPU或Spark叢集)建構模型。員工們可以選擇使用私有雲或公有雲系統,以避免資源被鎖定。
為了與公司的DevSecOps策略保持一致,撰寫程式集及其相依性皆自動分發,同時針對程式碼、資料及工具的追蹤和稽核功能提供了防護欄,以確保可見度與合規性。Seaman表示,由於資料科學家可以利用所需的工具和基礎建設,過去已指派給支援相關工作流的90%的工程師現在則支援其他的商業計劃。
[CIO都在讀: 科技如何協助零售供應鏈 ]
資料科學團隊正在建構新的ML模型,以模擬新型航空產品的設計。其他模型則有助於取得更佳的工廠生產線的產能可見度,包括追蹤從組裝到製造的物料流程,及檢測瑕疵和維護等問題。其他計劃則聚焦於緩和供應鏈風險的深度學習模型。
Seaman表示,該軟體將應用於建構資料模型並將其投入生產,而時間將從數周縮短至數分鐘,且由於對資源的善用使得生產率提升了十倍之多。資料科學領導者對計劃取得了較佳的能見度、最佳化協作及知識共享,而IT團隊則可以管理和治理基礎架構的使用和成本。Seaman強調,平台將原本混亂的情況變得井然有序。
資料科學知識仍是不可或缺的
有商業使用者表示就易用性來看,Domino Data 是應用於分析的一種低程式碼解決方案,但事實並非如此。儘管有許多資料科學建模工具能讓技術能力有限的員工也可以透過滑鼠點擊和行動運算資產,但我仍不諱言 Domino Data 需要具備一些撰寫程式的知識。
Domino Data 首席資料科學家 Joshua Poduska 表示,從事有意義的資料科學工作的組織,將依靠程式優先(code-first)的資料科學來完成這項工作。故對於想摸索門道的公民資料科學家們,則 Domino Data Lab 可能非他們選擇入門的首站。
[ 下載 2020-21 CIO大調查報告,掌握最新企業IT採購趨勢 ]
即洛克希德馬丁的 Domino Data 使用者們正朝著ML或AI工程師前進。Seaman預估該平台的使用率將會成長。
Seaman坦承 Domino Data 並非適合所有人,且指出整合資料策略是不可或缺的,範圍包括從低階資料建模工具到較複雜的演算法和深度神經網路。儘管如此,他仍表示程式庫解決方案總會帶來的進階的創新。
產業市場觀察家傾向認同。依據IDC的研究顯示,隨著越來越多的企業期望能大規模培養商業洞察力,全球在人工智慧技術上的支出將從2020年的501億美元成長到2024年超過1,100億美元的規模。
(本文授權非營利轉載,請註明出處:CIO Taiwan)