公民數據科學家

公民數據科學家(CDS)是指一些非專業人士利用進階分析或預測能力去建立模型,但是他自身的工作不是統計或數據分析範疇。Gartner在2016預測CDS數據分析生產力會在2019超過專業的數據科學家,但是這個預測未必準確。

 

Google最近公佈的AutoML平台重燃了CDS在未來趨勢的討論。AutoML提供了最佳化的機器學習演算法,而用家不需要有任何數據科學知識。

 

然而,CDS的概念存在一個問題:用家的期望,這是因為現在CDS的焦點是在有限及重覆性的工作,但用家的期望不止於此。

 

一個機器學習的解決方法未必能解決不同方面的商業問題,用家要透過反複試驗從中學習。然而,直接招募專業數據科學家去尋求正確的訓練策略是更為有效率的。因此,在短期內我們仍需要數據科學家主動參與並支援開始發展的CDS。

 

總結而言,我們要擴展數據科學的定義並把數據科學看成一種服務 :「知識作為服務」,這是邁向真正公民數據科學家的一步。

 

https://insidebigdata.com/2018/08/01/citizen-data-scientists-yet/

Leave a Reply