[怎样进行大数据的入门级学习?](https://www.zhihu.com/question/24761255)
必须技能10条:
- 01.Java高级(虚拟机、并发)
- 02.Linux 基本操作
- 03.Hadoop(此处为侠义概念单指HDFS+MapReduce+Yarn )
- 04.HBase(JavaAPI操作+Phoenix )
- 05.Hive(Hql基本操作和原理理解)
- 06.Kafka
- 07.Storm
- 08.Scala需要
- 09.Python
- 10.Spark (Core+sparksql+Spark streaming )高阶技能6条:
- 11.机器学习算法以及mahout库加MLlib
- 12.R语言
- 13.Lambda 架构
- 14.Kappa架构
- 15.Kylin
- 16.Aluxio
二、学习路径由于本人是从Java开发通过大概3个月的自学转到大数据开发的。
所以我主要分享一下自己的学习路劲。
第一阶段:
- 01.Linux学习(跟鸟哥学就ok了)
- 02.Java 高级学习(《深入理解Java虚拟机》、《Java高并发实战》)
第二阶段:
- 03.Hadoop (董西成的书)
- 04.HBase(《HBase权威指南》)
- 05.Hive(《Hive开发指南》)
- 06.Scala(《快学Scala》)
- 07.Spark (《Spark 快速大数据分析》)
- 08.Python (跟着廖雪峰的博客学习就ok了)
第三阶段:对应技能需求,到网上多搜集一些资料就ok了,我把最重要的事情(要学什么告诉你了),
剩下的就是你去搜集对应的资料学习就ok了当然如果你觉得自己看书效率太慢,你可以网上搜集一些课程,
跟着课程走也OK 。这个完全根据自己情况决定。如果看书效率不高就很网课,相反的话就自己看书。
三,学习资源推荐:
- 01.Apache 官网
- 02.Stackoverflow
- 04.github
- 03.Cloudra官网
- 04.Databrick官网
- 05.过往的记忆(技术博客)
- 06.CSDN,51CTO
- 07.至于书籍当当一搜会有很多,其实内容都差不多。
最后但却很重要一点:要多关注技术动向,持续学习。
- 在看的书和文章
- Java程序员手册
- 思维方式
- 面向服务
- Dubbo
- StringBoot
- 001.应用部署
- 002.注解学习
- SpringCloud
- SpringCloud入门
- Dbs
- 分布式
- Ffp
- 多线程
- 多线程小知识
- Java锁认识
- Netty
- Netty学习目录
- 读写事件流程分析与相关API
- 数据
- 大数据学习
- 学习目录
- Hadoop学习
- Hadoop组建安装
- ssh配置免密登陆
- Hadoop伪集群模式
- HBase伪集群模式
- Hive安装
- 常用操作命令
- 问题记录
- DOLIST
- 学习资料
- Spark
- 一些概念介绍
- 数据库
- Oracle相关
- 批量测试数据生成
- MySQL相关
- Redis
- 常用操作
- 机器学习
- 认识
- Kafka
- 监控
- 分布式相关
- RPC
- 中间件
- ElasticSearch
- ES环境搭建
- Python客户端创建索引
- Es的api常用操作
- SQL查询引擎
- Es数DB的数据同步
- ActiveMQ
- ActiveMQ介绍
- 分享
- Skyeye
- 组件安装配置
- Dubbo服务Demo应用部署
- Kafka安装配置
- RabbitMq配置
- Docker
- Docker学习文章
- Docker的大数据平台之路
- Docker环境搭建
- ubuntu16安装docker
- Docker镜像加速
- 使用Docker快速搭建中间件
- Docker环境使用mysql
- Docker环境的中间件搭建汇总
- Docker镜像容器管理
- Docker镜像创建
- Docker创建可用的系统容器
- Kubernetes
- etcd安装
- flanneld安装
- kubernetes环境安装
- kubernetes源码编译
- Linux相关
- Linux操作系统
- Deepin操作系统
- 新系统环境准备
- Linux系统小工具
- Linxu配置时间服务器同步
- DNS服务器dnsmasq
- Linux命令
- 常用命令
- 计算机基础
- README
- 数据结构
- 面试题总结
- 计算机组层原理
- 计算机组层原理
- 其它语言
- Python
- Python环境搭建
- Python学习总结
- Python语法学习
- Python模块学习
- MySQLdb
- scrapy
- Python的exception
- PythonNLP入门
- Go
- 工具组件
- Jenkins
- Jenkins认识
- Jenkins安装配置
- Jenkins插件使用
- Jenkins项目常用配置
- Git
- Git使用说明
- NLP
- 入门级别
- 一些概念
- faiss介绍
- WMD介绍