首頁技術(shù)文章正文

在數(shù)據(jù)處理中哪些場景可以使用Spark?

更新時間:2021-03-12 來源:黑馬程序員 瀏覽量:

1577370495235_學IT就到黑馬程序員.gif


在數(shù)據(jù)科學應(yīng)用中,數(shù)據(jù)工程師可以利用Spark進行數(shù)據(jù)分析與建模,由于Spark具有良好的易用性,數(shù)據(jù)工程師只需要具備一定的SQL語言基礎(chǔ)、統(tǒng)計學、機器學習等方面的經(jīng)驗,以及使用Python、Matlab或者R語言的基礎(chǔ)編程能力,就可以使用Spark進行上述工作。


在數(shù)據(jù)處理應(yīng)用中,大數(shù)據(jù)工程師將Spark技術(shù)應(yīng)用于廣告、報表、推薦系統(tǒng)等業(yè)務(wù)中,在廣告業(yè)務(wù)中,利用Spark系統(tǒng)進行應(yīng)用分析、效果分析、定向優(yōu)化等業(yè)務(wù),在推薦系統(tǒng)業(yè)務(wù)中,利用Spark內(nèi)置機器學習算法訓練模型數(shù)據(jù),進行個性化推薦及熱點點擊分析等業(yè)務(wù)。

1615515557964_Spark應(yīng)用場景.jpg


Spark擁有完整而強大的技術(shù)棧,如今已吸引了國內(nèi)外各大公司的研發(fā)與使用,淘寶技術(shù)團隊使用Spark來解決多次迭代的機器學習算法、高計算復雜度的算法等,應(yīng)用于商品推薦、社區(qū)發(fā)現(xiàn)等功能。騰訊大數(shù)據(jù)精準推薦借助Spark快速迭代的優(yōu)勢,實現(xiàn)了在“數(shù)據(jù)實時采集、算法實時訓練、系統(tǒng)實時預測”的全流程實時并行高維算法,最終成功應(yīng)用于廣點通投放系統(tǒng)上。優(yōu)酷土豆則將Spark應(yīng)用于視頻推薦(圖計算)、廣告等業(yè)務(wù)的研發(fā)與拓展,相信在將來,Spark會在更多的應(yīng)用場景中發(fā)揮重要作用。



猜你喜歡:    
實時計算Spark Streaming工作原理是什么?

Spark有哪些特點,Spark的生態(tài)系統(tǒng)包含哪些組件?

Spark Mllib分層抽樣操作步驟

黑馬程序員大數(shù)據(jù)開發(fā)培訓

分享到:
在線咨詢 我要報名
和我們在線交談!