大数据学习道路图 让你精准掌握大数据技术学习(附赠学习材料)
作者头像
  • 信烁良金
  • 2020-05-26 19:01:06 1

大数据:全面解析与应用

大数据是指一种不再依赖于传统的随机分析法,而是采用所有数据进行分析处理的方法。在互联网时代,每家企业每天都会产生大量数据,存储和有效利用这些数据需要依靠大数据技术。大数据课程通常采用真实商业数据源,结合云计算和机器学习,使学员具备进入一线互联网企业的能力。

学习阶段概览

阶段一:Java语言基础

  • Java开发介绍
  • Eclipse开发工具熟悉
  • Java语法基础
  • 流程控制
  • 字符串处理
  • 数组与类和对象
  • 数字处理类与核心技术
  • I/O与反射
  • 多线程
  • Swing程序与集合类

阶段二:HTML、CSS与JavaScript

  • PC端网站设计
  • HTML5与CSS3基础
  • WebApp页面设计
  • 原生JavaScript交互功能开发
  • Ajax异步交互
  • jQuery应用

阶段三:JavaWeb与数据库

  • 数据库基础
  • JavaWeb开发核心
  • JavaWeb开发内幕

阶段四:Linux与Hadoop生态系统

  • Linux系统
  • Hadoop离线计算
  • 分布式数据库HBase
  • 数据仓库Hive
  • 数据迁移工具Sqoop
  • Flume分布式日志框架

阶段五:实战项目

  • 数据获取
  • 数据处理
  • 数据分析
  • 数据展示
  • 数据应用

阶段六:Spark生态系统

  • Python编程
  • Scala编程
  • Spark大数据处理
  • Spark Streaming
  • Spark MLib机器学习
  • Spark GraphX图计算
  • 实战项目:基于Spark的推荐系统
  • 实战项目:新浪网数据处理

阶段七:Storm生态系统

  • Storm技术架构
  • Storm原理与基础
  • Kafka消息队列
  • Redis工具
  • Zookeeper详解
  • 实战项目:日志告警系统
  • 实战项目:猜你喜欢推荐系统

阶段八:大数据分析与AI

  • 数据分析基础
  • 数据可视化
  • Python机器学习
  • 图像识别神经网络
  • 自然语言处理
  • 社交网络处理
  • 实战项目:户外设备识别分析

大数据是一个神奇的领域,掌握它意味着能够涉足互联网的多个领域。区块链、人工智能等热门技术都与大数据息息相关。每一个想要学习大数据的人都将成为未来的宝贵人才,用技术征服世界。

Hadoop入门指南

Hadoop入门

  1. Hadoop的历史背景
  2. Hadoop在大数据和云计算中的角色
  3. 国内外Hadoop应用案例
  4. 国内Hadoop就业情况分析及课程大纲
  5. 分布式系统概论
  6. Hadoop生态系统简介
  7. 核心组件MapReduce实例说明

分布式文件系统HDFS

  1. HDFS简介
  2. 系统组成
  3. 组件详解
  4. 副本存储策略及路由规则
  5. NameNode Federation
  6. 命令行接口
  7. Java接口
  8. 客户端与HDFS数据流
  9. HDFS高可用性

初级MapReduce

  1. 理解Map和Reduce模型
  2. 伪分布式下的MapReduce执行过程
  3. Yarn模型
  4. 序列化
  5. MapReduce类型与格式
  6. 开发环境搭建
  7. 应用开发
  8. 示例讲解

高级MapReduce

  1. 运用压缩分隔减少输入规模
  2. 使用Combiner减少中间数据
  3. 编写Partitioner优化负载平衡
  4. 自定义排序规则
  5. 自定义分组规则
  6. MapReduce优化
  7. 编程实战

Hadoop集群管理

  1. 集群搭建
  2. 集群监控
  3. 集群管理
  4. 运行MapReduce程序

ZooKeeper基础知识

  1. ZooKeeper结构
  2. 安装与操作

HBase基础知识

  1. HBase定义
  2. HBase与传统数据库对比
  3. 数据模型
  4. 系统架构
  5. HBase上的MapReduce
  6. 表设计

HBase集群管理

  1. 集群搭建
  2. 监控
  3. 管理

HBase客户端

  1. HBase Shell操作
  2. Java客户端代码演示

Pig基础知识

  1. Pig概述
  2. 安装与使用
  3. 手机流量统计业务实现

Hive基础知识

  1. 数据仓库概论
  2. Hive定义
  3. 系统架构
  4. 客户端简介
  5. HiveQL定义
  6. HiveQL与SQL对比
  7. 数据类型
  8. 表与表分区概念
  9. 表操作演示
  10. 数据导入与导出演示
  11. 查询数据演示
  12. 用户自定义函数(UDF)开发与演示

Sqoop基础知识

  1. 配置与使用
  2. 数据导入与导出

Storm基础知识

  1. Storm基础概念
  2. 体系结构与基本原理
  3. Storm与Hadoop对比
  4. 集群搭建
  5. 组件介绍
  6. 消息可靠性
  7. 集成YARN

希望以上内容能帮助你更好地理解大数据和Hadoop的相关知识。如果你有兴趣进一步学习,可以关注并私信回复“材料”,即可获得一份精心准备的学习资料。

    本文来源:图灵汇
责任编辑: : 信烁良金
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
数据技术学学习材料附赠精准掌握道路学习习(
    下一篇