資料科學家角色因產業而異,但有些通用技能、經驗、教育與訓練,能在資料科學職涯上助你一臂之力。
文/Sarah K. White 與 Thor Olavsrud‧譯/Nica
何謂資料科學家
資料科學家是精通資料的專家,利用資料科學從大量結構性與非結構性資料中探索洞見,協助塑造或達成業務需求與目標。資料科學家對商業營運已越來越重要,因為企業日異仰賴資料分析推動決策的制定,依靠自動化與機器學習作為 IT 策略的核心元素。
資料科學家職務概述
資料科學家主要目標在於組織與分析資料,通常利用專門為此任務設計的軟體。資料科學家分析的最終結果必須簡化到所有投資的持股人都能瞭解 ─ 尤其是工作非 IT 領域的那些。
資料科學家處理資料分析的方式因所處產業與業務或部門的特定需求而有所不同。在資料科學家能夠在結構化與非結構化資料裡找到意義前,企業領導者與部門主管必須溝通他們所求為何。因此,資料科學家必須擁有足夠的業務領域專業,有能力將公司或部門目標轉換成資料型式的可交付成果,例如預測引擎、模式偵測分析、最佳化演算法等等。
資料科學家 vs. 資料分析師
資料科學家通常與資料分析師一起工作,但職責差異相當大。資料科學家多半從事長期研究與預測,資料分析則尋求透過報告支持商業領導者制定戰術決策,及以當下與歷史資料為基礎,針對企業現有狀態實際狀況的描述進行特定查詢。
因此,資料分析師與資料科學家工作上的差異通常歸結於持續時間。資料分析師幫助企業更瞭解顧客此時此刻使用產品的狀況,而資料科學家則利用資料分析產生的洞見,預期未來顧客的需求協助設計新產品。
資料科學家薪資
資料科學是個成長快速的領域,BLS 預測從 2020 年到 2030 年就業將成長 22%。Glassdoor 全美最佳五十種工作中,資料科學家排名第三最佳職業,證明資料科學家也是令人滿意的長期職涯方向。
Robert Half 的 2021 Technology and IT Salary Guide 薪資指南內容提到,依經驗指出,資料科學家平均薪資細分如下:
- 第 25 百分位:$109,000 美元
- 第 50 百分位:$129,000 美元
- 第 75 百分位:$156,500 美元
- 第 95 百分位:$185,750 美元
資料科學家職責
資料科學家主要職責為資料分析,從資料收集開始,最後以分析結果為基礎作出商業決策。
資料科學家分析的資料來源很多,包括結構化、非結構化或半結構化資料。提供給資料科學家的資料品質越好,就能有越多參數納入指定模組,資料科學家手上也能擁有更多資料訓練模組。
結構化資料是有組織條理的,通常經由分類而易於透過電腦自動排序、讀取或組織。這包括由服務、產品與電子裝置所搜集的資料,但很少透過人為輸入搜集而來。從你手機所搜集的網站流量資料、銷售數字、銀行帳號或 GPS 座標,這些都是結構化資料型式。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]
成長最快的資料型式是非結構化資料,多半來自人為輸入:顧客評論、電子郵件、影片、社交媒體文章等等。這些資料很難理清,而且利用科技難以有效整理,因此需要投資更多才能維護與分析。企業營運通常仰賴關鍵字為非結構化資料賦與意義,利用可搜尋字詞找出相關資料。
半結構化資料界於兩者之間。它與資料模型不一致,但有相關詮釋資料(metadata)可供分類。電子郵件、二進制可執行檔、壓縮檔、網站等等即為此例。
一般情況下,企業雇用資料科學家處理非結構性資料與半結構性資料,而由其他 IT 員工管理與維護結構性資料。資料科學家當然也會處理許多結構性資料,但企業漸漸開始尋求充份利用非結構性資料達到營收目標,這讓處理非結構性資料的方式,成為資料科學家職務的關鍵。
資料科學家必要條件
各個產業都有自有資料型態需要資料科學家分析。據 BLS 所述,以下是幾個資料科學家在各產業可能實施的常見分析型式:
- 商業經營:營運資料的資料分析,可以提供效益、投資、產品誤差、顧客忠誠度等決策的相關資訊。
- 電子商務:時下網站收集的不只是購買資料,資料科學家可以幫助電子商務企業提升客戶服務、找出趨勢,進而開發服務或產品。
- 金融:帳戶資料、信用與簽帳交易及類似財務資料對企業正常營運來說至關重要。但對處於金融產業的資料科學家而言,安全性與合規性 ─ 包括詐欺偵測,也是重要考量。
- 政府機關:巨量資料協助政府形成決策、幫助選民並監控整體滿意度。如同金融領域,安全性與合規性乃此領域資料科學家首要考量。
- 科學:拜近代 IT 進步所賜,現代科學家可以更輕鬆從實驗中收集、共享與分析資料。資料科學家能在此過程中提供協助。
- 社交網路:社交網路可以為針對性廣告、改善消費者滿意度、確立位置資料的趨勢,以及強化功能與服務提供相關資訊。
- 健康醫療:電子病歷需要專屬的巨量資料、安全性與合規性。資料科學家可協助改善健康服務,還能發現先前可能忽略的趨勢。
資料科學家技能
Quora 資料科學經理 William Chen 表示,資料科學家最重要的五項技能裡含括了軟技巧與硬技能的混合:
- 程式:資料科學家最基礎的技能 ─ 程式,可以提升你的統計能力,協助「分析大量資料集」,讓你擁有創造自有工具的能力,Chen 如此表示。
- 定量分析:定量分析可提升執行實驗分析、擴展資料策略的能力,還有助於實施機器學習。
- 產品直覺:瞭解產品有助於執行定量分析,也更能預測系統行為、建立指標,並改善除錯技能。
- 溝通:可能是所有產業最重要的軟技能,絕佳溝通能力有助於「充份利用以上所述的技能。」Chen 指出。
- 團隊合作:團隊合作與溝通極為類似,同樣是成功的資料科學家職涯不可或缺的一部份。這需要無私、接納回饋意見,並與團隊共享知識,Chen 表示。
Intelligent World 的執行長(CEO) Ronald Van Loon 在這個清單加上商業敏銳度。Van Loon 認為,強大的商業敏銳度是引導資料科學家技術能力的最佳方式。找出企業成長必須解決的問題與潛在挑戰是必要技能。
資料科學家教育訓練
成為資料科學家的方式很多,但最傳統的途徑仍是取得學士學位。許多資料科學家甚至擁有碩士學位或更高,據 BLS 的資料指出,並非每位資料科學家皆如此,因為還有許多其他方式可以發展資料科學技能。在投入更高學歷課程前,你要知道即將投入於哪種產業,找出對此而言最重要的技能、工具與軟體。
由於資料科學需要一些商業領域的專業,職務也因產業而異,若投身高科技產業,你可能需要進階訓練。舉例來說,處於健康醫療產業、政府機關或科學領域,你需要的是不同於行銷、商業或教育的技能組合。
若你想發展某種技能滿足特定產業需求,有線上課程、職訓營與專業發展課程可以幫助你磨練技能。考慮唸研究所的人,以下是可供選擇的優質資料科學碩士課程:
- 統計學科學碩士:史丹佛大學資料科學
- 資訊與資料科學碩士:柏克萊資訊學院
- 計算資料科學碩士:卡內基梅隆大學
- 資料科學理學碩士:哈佛大學 John A. Paulson 工程與應用科學學院
- 資料科學理學碩士:華盛頓大學
- 資料科學理學碩士:約翰霍普金斯大學懷廷工學院
- 分析理學碩士:芝加哥大學葛拉漢學院
資料科學認證
除了職訓專班與專業發展課程外,另有許多有用的巨量資料認證與資料科學認證,能強化履歷提升薪資。
- 認證分析專家(CAP)
- Cloudera 資料平台全能認證
- 美國資料科學委員會(DASCA)資深資料科學家(SDS)
- 美國資料科學委員會(DASCA)首席資料科學家(PDS)
- IBM 資料科學專家認證
- Microsoft 認證:Azure 人工智慧基礎
- Microsoft 認證:Azure 資料科學家夥伴
- Open 認證資料科學家(Open CDS)
- SAS 認證人工智慧與機器學習專家
- SAS 認證 SAS 9 進階分析專家
- SAS 認證資料科學家
- Tensorflow 開發人員認證
其他資料科學職務
資料科學家只是資料科學領域延伸出來的其中一個工作職稱,並非所有使用資料科學的公司都會雇用資料科學家。據 PayScale 資料所述,以下是一些與資料科學相關熱門職稱與平均薪資:
- 分析管理師:$100,099 美元
- 營運情報分析師:$70,868 美元
- 資料分析師:$62,723 美元
- 資料架構師:$122,882 美元
- 資料工程師:$93,145 美元
- 研究分析師: $57,615 美元
- 研究科學家:$82,957 美元
- 統計學家:$77,545 美元
(本文授權非營利轉載,請註明出處:CIO Taiwan)