第一阶段:Linux + 搜索 + Hadoop 体系
本阶段主要介绍Linux基础、Shell编程、高并发架构、Lucene和Solr搜索以及Hadoop体系。Linux是大数据领域的基础,学习Linux有助于更好地掌握Hadoop、HBase、NoSQL、Spark、Storm、Docker、KVM和OpenStack等技术。由于企业广泛使用Linux搭建和部署项目,本阶段将帮助学员掌握Linux的基础知识和常用命令。
Linux基础
高并发架构
Lucene
Solr
Hadoop
本阶段将带领学员进入机器学习领域,通过R语言和Mahout的学习,掌握机器学习的基本理论和实际应用。
R语言
Mahout
本阶段重点介绍Kafka、Storm和Redis的应用,帮助学员掌握流式计算的相关技术和工具。
Kafka
Storm
本阶段详细介绍Spark的生态系统、编程模型、计算原理、内存管理和容错处理等内容,使学员能够掌握Spark的各项功能和技术。
Spark
Spark Streaming
Spark MLlib
本阶段重点介绍Docker、KVM和OpenStack,帮助学员掌握云计算平台的构建和管理。
Docker
KVM
OpenStack
项目实战
某大型电商日志分析和订单管理
微博营销数据挖掘项目
中国移动基站保障平台
智慧城市大数据分析项目
手机软件推荐系统项目
网络流量异常检测项目
通过以上五个阶段的学习,学员将全面掌握大数据、机器学习、流式计算、内存计算和云计算平台的关键技术和应用。