知识改变命运 学习成就未来!

北京博雅环球教育科技集团|大学生就业创业培训|云计算|大数据|人工智能|java|Python人工智能|H5全栈|安卓开发|青少年人工智能编程|学历提升

010-53652048


大数据课程大纲(26周)


基础阶段一 计算机基础 1、认知行业,岗位,介绍Hadoop大数据课程体系,就业趋势以及行业未来展望
2、中英文输入
3、Word文档编辑
4、Excel电子表格处理
5、PowerPoint幻灯片制作
6、走进计算机技术世界
7、操作系统基础知识
8、算法与数据结构
9、网络和Internet
10、软件开发过程
 
基础阶段二 Java初中高 1、初识JAVA
2、变量、数据类型和运算符
3、选择结构
4、循环结构                         
5、循环结构进阶                      
6、一维和二维数组
7、类和对象
8、类的无参和带参方法
9、字符串的操作
10、JAVA的特性之继承、封装、多态
11、JAVA异常处理
12、内部类、包装类、常用类
13、JAVA垃圾回收机制与枚举类型
14、String正则表达式
15、StringBuffer与StringBuilder类的常用方法
16、集合、泛型
17、java文件I/O流
18、类加载和反射
19、多线程
20、网络编程
21、数据库简介、安装及基本概念
22、数据库表操作、约束
23、DNL语句与事务处理
24、SQL查询
25、JDBC编程
 
基础阶段三 Web前后端 1、HTML语言与基础标签
2、表格基础、表单和框架
3、CSS样式、网站设计和页面布局技术
4、JavaScript语法
5、DOM编程-Window对象
6、Jquery和Ajax
7、Servlet和JSP
2周
大数据 大数据基础阶段 1、大数据课程介绍、VMware虚拟机安装和使用
2、Linux安装、Linux系统命令
3、Hadoop介绍,Google三大论文
4、HDFS工作流程、YARN工作流程、MapReduce工作流程
5、Hadoop伪分布式安装,Hadoop的目录介绍,运行wordeount程序
6、Hadoop的集群安装,SSH通讯协议
7、FileSystem.Shell集群命令
8、Hadoop集群静态和动态增删集群节点,历史服务器,集群灾难恢复
9、Java调用Hadoop API 开发HDFS(使用lib开发)
10、Java调用Hadoop API 开发HDFS(使用Maven开发)
11、项目:云网盘需求分析,用户登录注册模块,Hdfs文件存储模块(上传、下载、显示、删除等)
12、RPC原理,NIO原理,阶段复习和讲解Hadoop源码
 
大数据续 大数据离线阶段一 1、Mapreduce原理知识
2、Shuffie原理知识
3、Mapreduce练习
4、项目:手机流量计费系统
5、Zookeeper理论,Zookeeper集群,安装
6、Zookeeper.shell集群命令
7、基于Zookeeper中Na的HA和YARN的HA(灾难恢复)
8、Hive理论、Hive安装、基本数据类型、复杂数据类型
9、HQL查询语句
10、分区、分桶、索引、复杂类
11、内置函数
12、UDF自定义函数,Hive优化
13、Hbaon理论、Hbaon表的设计和内存结构,存储格式
14、Hbaon集群安装
15、Hbaon的shell集群管理命令
16、Java操作Hbaon.shell数据操作
17、Flomn收集数据
18、Sqoop对mysql、hdfa、hive、HBase之间的数据导入和导出
19、Qoize和Azbaban任务管理
 
大数据离线阶段二 1、项目:运动微博shell+hive+MR+Hbaon
2、项目:电商用户数据分析shell+hive+MR+Hbaon+S+Myaql
   
大数据在线阶段一 1、Scala环境安装设置
2、Scala基础语法
3、Scala数据类型
4、Scala变量
5、Scala访问修饰符
6、Scala运算
7、Scala   IF……ELSE语句
8、Scala循环类型
9、Scala while循环
10、Scala函数
11、Scala闭包
12、Scala字符串
13、Scala数组
14、Scala集合
15、Scala类与对象
16、Scala模式匹配
17、Scala正则表达式
18、Scala异常处理
19、Scala提取器
20、Scala文件I/O
 
大数据在线阶段二 1、Spark基本理论和计算方法
2、Spark五大功能组件
3、Spark特点和应用场景
4、Spark与MapReduce的比较和集群安装
5、交互模式
6、使用Spark处理Hadoop Datasets分布式数据集
7、设置共享变量
8、了解Mesos
9、Spark工作原理
10、Spark运行机制和作业调度
11、Spark编程模型和架构设计
12、Spark的Local、YARN、Mesos、Deploy模式架构
13、Spark创建RDD方式
14、Spark RDD中的Runtime流程
15、Spark中Tranaformation信息
16、Spark中Job的Stage划分
17、Spark常见问题
18、Spark内核揭秘
19、Spark程序优化1
20、Spark程序优化2
21、MLlib基本数据类型
22、MLlib数理统计基本概念
23、协同过滤
24、相似度度量
25、MLlib中的交替量小二乘法(ALS算法)
26、随机梯度下降算法
27、MLlib回归的过拟合
28、MLlib线性回归实战
29、决策树
30、保序回归
31、聚类与分类
32、MLlib中的Kmeans算法
33、Apriori频繁项集算法
34、FP-growth算法
35、奇异值分解(SVD)
36、主成分分析(PCA)
37、TF-IDF
38、词向量化工具
39、基于卡方检验的特征选择
 
大数据在线阶段三 1、项目:Sp电商指标分析平台
2、总复习、简历指导、面试辅导等
   

就业案例

右侧通用报名广告[2017-08-17 21:41:11]

本周精华

香港地下6合9期高手