文/顏良修 Anna Yen‧炬識科技執行長
AI 熱潮的崛起讓各界意識到資料的有效應用將成為推動 AI 革命的燃料,而資料治理正是讓企業資料能被有效應用的關鍵,對於企業商業決策而言,重要性亦日漸提升。有心做好資料治理的企業,除以「自動化產製資料目錄」作為起點外,根據國際資料治理協會(DAMA)發佈的資料治理框架,監控並優化資料品質正是企業得以實踐資料治理的重要手段之一。
筆者認為,企業在評估資料品質時的思維,應如同餐廳主廚在採購食材一樣,包含「標準」與「期望」的制定(如同廚師在判斷食材風味、外觀等)、「檢驗」實作(依照標準與期望來驗貨)等階段。同樣地,為幫助同一份資料能在各方不同單位間共同流通使用,資料品質不能依照各單位的主觀標準判斷,而是需要經過事先分類驗證品質的標準,才能透過統計結果確定同一個物品在特定維度下的狀況,藉由掌握分項的資料品質,並進一步進行資料特定方面的優化作業。反之,欠缺品質的資料,就如同餐盤上不該出現的雜物一般。導入資料治理的企業,就像具備食材管理制度的餐廳,客戶體驗才能得到控制。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]
如何才能正確掌握資料品質?首先,建立評價標準以量化標的所具備的特性;其二,透過檢驗行為,以抽樣、掃描等統計方式計算數量,其三,藉此前建立的標準評價統計的結果,達成將標的特性量化的目標。透過三道程序將品質量化成每個人都能以相同標準理解並檢驗的數字,並依照格式準確性(Syntactic Accuracy)、完整性(Completeness)、及時性及唯一性(Timeliness & Uniqueness)、關聯一致性(Consistence)、合規性及內容準確性(Validity & Semantic Accuracy)等維度進行驗證。
透過一次次持續、定時、定點的驗證,企業得以持續性地監控資料品質。然而根據筆者與各企業的合作經驗,企業在監控資料品質的實務上仍須注意,需避免把資料品質管理團隊的工作指標,設定為提升總體資料品質的綜合評分,其原因在於管理團隊若將注意力放在提升總體資料品質的綜合評分,容易造成團隊優先處理品質百分比較容易被提升的項目,而可能忽略了既有的資料產品或公司政策的推動方向,導致資料治理的目標本末倒置。資料治理的重點應跟隨企業內部所訂定的共同目標,無論是資安、AI 模型效益、尋找新興資料題目等,並將資料治理的指標與企業目標互相結合,避免資料團隊忙於治理相對不重要的資料,使資料治理成果難以與實際收益關聯,而影響資料團隊的效率及目標達成度。
被妥善管理的資料才能在 AI 時代發揮效益,而「資料治理」正是針對「資料管理」的「管理」,包含組織、規範與流程等。企業的資料治理成效,可從企業資料的準確性、可靠性和連結性等衡量。企業不只要建立健全的資料治理架構,更需要落實正確的資料驗證及監測方法,持續關注和優化資料品質,確保企業資料價值最大化,從而在 AI 驅動的競爭環境下保持優勢,進一步脫穎而出。
(本文授權非營利轉載,請註明出處:CIO Taiwan)