2022-07-29
數(shù)據(jù) 分析 進(jìn)行
想往大數(shù)據(jù)方向發(fā)展,改怎準(zhǔn)備?需要具備那些技能?
想往大數(shù)據(jù)方法發(fā)展,首先得確認(rèn)你在轉(zhuǎn)之前是一個純小白,還是一個已經(jīng)具備一定開發(fā)經(jīng)驗(yàn)的程序員.如果是有一定經(jīng)驗(yàn)的,相對來說會比較容易些,因?yàn)檎Z言都是相通的.對于純小白,首先要做好充足的思想準(zhǔn)備,學(xué)習(xí)編程本就是一件枯燥的事情,很磨練心智的.其次如果自學(xué)會比較難,比較慢,最好找個地方進(jìn)行快速的學(xué)習(xí)(個人建議).不過對于大數(shù)據(jù)開發(fā)未來的前景還是不錯的,包括就業(yè)前景,就業(yè)薪資,所以如果你想以后將大數(shù)據(jù)作為長期從事的工作,還是可以的.
下面我介紹一些大數(shù)據(jù)相關(guān)的,希望對你有用:
一 大數(shù)據(jù)相關(guān)工作介紹
大數(shù)據(jù)方向的工作目前主要分為三個主要方向:
1. 大數(shù)據(jù)工程師
2. 數(shù)據(jù)分析師
3. 數(shù)據(jù)倉庫(數(shù)倉)
4. 其他(數(shù)據(jù)挖掘等)
二 必須掌握的技能20條 (按照這個順序進(jìn)行學(xué)習(xí))
1. Java基礎(chǔ)
2. Linux 基本操作
3. Hadoop(HDFS+MapReduce+Yarn)
4. Hive(Hql基本操作和原理理解)
5. Hbase(JavaAPI操作+Phoenix)
6. Flume/Sqoop(數(shù)據(jù)采集/傳輸工具)
7. Kafka(分布式總線系統(tǒng))
8. Storm(分布式的實(shí)時計算框架)
9. Scala(編程語言,用于Spark開發(fā))
10. Redis(非關(guān)系型數(shù)據(jù)庫)
11. SparkCore(主要數(shù)據(jù)清洗,分析)
12. SparkSQL(相關(guān)數(shù)據(jù)分析)
13. SparkStreaming(實(shí)時統(tǒng)計分析)
14. Spark內(nèi)核編碼
15. Flink(開源流式框架,進(jìn)行實(shí)時統(tǒng)計分析)
16. ElasticSearch(搜索引擎,進(jìn)行數(shù)據(jù)存儲分析)
17. Logstash(動態(tài)地采集,轉(zhuǎn)換和傳輸數(shù)據(jù))
18. Kibana(可視化監(jiān)控管理及分析)
19. Mongodb(非關(guān)系型數(shù)據(jù)庫)
20. 輔助小工具(Oozie/Hue/azkaban等)
三 高級技能9條
1. 機(jī)器學(xué)習(xí)算法以及mahout庫加MLlib
3. Lambda 架構(gòu)
4. Kappa 架構(gòu)
5. Kylin(數(shù)據(jù)預(yù)處理工具)
6. Alluxio(數(shù)據(jù)存儲)
7. Python(輔助數(shù)據(jù)分析)
8. 可視化工具(superset/vue/grah)
9. Kudu(分布式數(shù)據(jù)存儲)
開班時間:2021-04-12(深圳)
開班盛況開班時間:2021-05-17(北京)
開班盛況開班時間:2021-03-22(杭州)
開班盛況開班時間:2021-04-26(北京)
開班盛況開班時間:2021-05-10(北京)
開班盛況開班時間:2021-02-22(北京)
開班盛況開班時間:2021-07-12(北京)
預(yù)約報名開班時間:2020-09-21(上海)
開班盛況開班時間:2021-07-12(北京)
預(yù)約報名開班時間:2019-07-22(北京)
開班盛況Copyright 2011-2023 北京千鋒互聯(lián)科技有限公司 .All Right 京ICP備12003911號-5 京公網(wǎng)安備 11010802035720號