当前,我国大数据产业正从起步阶段迈入黄金时期,已经成为数据资源大国。据媒体报道,大数据人才缺口巨大,位列十大高薪职业之一,供需比例超过1:14。在政策、技术和市场的推动下,大数据产业的发展潜力不容忽视。
自2020年3月起,教育部批准了137所高校设立“数据科学与大数据技术”本科专业,51所高校设立“大数据管理与应用”本科专业。“数据科学与大数据技术”专业自2015年开始申报,至今已有668所高校成功申请。“大数据管理与应用”专业自2017年开始申报,至今已有83所高校成功申请。
此外,截至现在,全国共有1355所职业院校成功申报了“大数据技术与应用”专业,为培养大数据应用型和实战型人才打下了坚实基础。
为了促进产教融合、协同育人,突破校企间人才培养的壁垒,探索新的培养机制和模式,培养具有创新能力、符合产业发展需求的复合型和创新型人才,已成为许多院校探讨的重点方向。
针对高校在课程设置、师资力量、科研支持和成果转化等方面面临的问题,云创专业共建计划可以为合作院校提供12项免费服务,包括共同制定人才培养方案、建设教材体系、高质量培训师资、全套专业课高质量在线直播教学、设计实验室建设方案、帮助学生实习、帮助学生高质量就业、共建教育部协同育人项目、联合科研项目申报与研究、联合发表高质量论文、联合申报科研成果奖项、助力科研成果转化。这些服务在教育领域引起了强烈反响。
其中,高质量培训师资和全套专业课高质量在线直播教学这两项服务受到了广泛好评。全套专业课高质量在线直播教学采用“双师模式”——直播间教师负责授课,现场助教教师负责辅导,有效解决了大数据和人工智能师资短缺的问题,提升了教学质量。
为了帮助高校快速推进大数据专业建设,培养创新人才,云创大数据将从2020年5月25日开始,推出《大数据》和《大数据导论》免费在线直播课程,欢迎各高校选修。
《大数据》适用于本科高校大数据专业必修课程和非大数据专业选修课程,《大数据导论》适用于高职高专院校大数据专业必修课程和非大数据专业选修课程。同时,为了保证高校的教学效果,云创大数据还将为选修以上两门课程的高校提供免费的大数据实验平台(本科与高职两大平台,金融、电子商务、数学统计等多个版本,共计424个大数据实验),让高校享受直播授课、答疑解惑和实验实战等个性化服务。
有兴趣选修课程(可同时选择两门)的师生只需扫描下方小程序码,提交联系人、单位和联系方式等信息,即可享受云创大数据提供的全套专业课高质量在线直播教学服务。
《大数据》选课小程序码:
[align=center][/align]
《大数据导论》选课小程序码:
[align=center][/align]
云创大数据还计划从下学期9月份开始提供9门大数据和人工智能专业的专业直播课程,敬请期待!具体课程如下:
大数据(本科):《大数据》、《Python程序设计》、《云计算》
大数据(专科):《大数据导论》、《Python语言》、《云计算导论》
人工智能(本科):《人工智能导论》、《Python程序设计》、《人工智能数学基础》
人工智能(专科):《人工智能概论》、《Python语言》、《云计算导论》
如有疑问,请联系宋倩:
邮箱:songqian@cstor.cn
手机:13905177044
大数据(适合本科高校)
一、课程性质、目的与要求
课程性质:本科高校大数据专业必修课程、非大数据专业选修课程。
课程目的:通过介绍大数据的相关知识,使学生掌握大数据的概念和原理,熟悉大数据的理论与算法,了解大数据未来发展趋势,能够运用所学知识进行大数据应用和算法设计,培养学生运用大数据技术解决大数据行业应用问题的能力。
课程要求:本课程系统介绍了大数据的理论知识和实战应用,包括大数据概念与应用、数据采集与预处理、数据挖掘算法与工具、R语言、深度学习以及大数据可视化等内容,并深入分析了大数据在互联网、商业和典型行业的应用。期望学生对大数据处理技术有较深的理解,能够从具体问题或实例入手,运用所学的大数据知识在应用中进行数据分析和数据挖掘。
二、教学内容
总学时:36学时
第1章 大数据概念与应用 2学时
基本要求:熟悉大数据的概念与意义、大数据的来源、大数据应用场景及大数据处理方法等内容。
重点:大数据的定义、研究内容与应用。
难点:无。
第2章 数据采集与预处理 4学时
基本要求:熟悉常用的大数据采集工具,特别是Apache Kafka数据采集应用方法;熟悉数据预处理原理和方法,包括数据清洗、数据集成、数据转换;掌握数据仓库概念与ETL工具Kettle的实际应用。
重点:Apache Kafka数据采集、数据清洗、数据仓库与ETL工具。
难点:ETL工具Kettle的实际应用。
第3章 数据挖掘算法 6学时
基本要求:熟悉常用的数据挖掘算法,从分类、聚类、关联规则和预测模型等常用数据挖掘分析方法出发,掌握相应的算法,并能熟练进行数据挖掘算法的综合应用。
重点:分类算法、聚类算法、关联规则、时间序列预测。
难点:数据挖掘算法的综合应用。
第4章 大数据挖掘工具 4学时
基本要求:熟练掌握机器学习系统Mahout和大数据挖掘工具Spark Mllib下的分类算法、聚类算法、协同过滤算法的应用,并对其他数据挖掘工具有所了解。
重点:Mahout安装与应用、Spark Mllib工具的应用。
难点:Mahout和Spark Mllib工具的应用。
第5章 R语言 4学时
基本要求:了解R语言的发展历程、功能和应用领域;熟悉R语言在数据挖掘中的应用;掌握R语言在分布式并行实时计算环境Spark中的应用SparkR。
重点:R语言基本功能、R语言在数据挖掘中的应用、SparkR主要机器学习算法。
难点:R语言与数据挖掘。
第6章 深度学习 4学时
基本要求:了解深度学习的发展过程和实际应用场景,并结合人脑的工作原理,了解深度学习的相关概念和工作机制,做到能够熟练运用常用的深度学习软件。
重点:人脑神经系统与深度学习、卷积神经网络、深度信念网络、循环(递归)神经网络、TensorFlow和Caffe。
难点:人工神经网络。
第7章 大数据可视化 4学时
基本要求:熟悉大数据可视化的基础知识;掌握文本可视化、网络可视化、时空数据可视化、多维数据可视化等常用的大数据可视化方法,可以通过Excel、Processing、NodeXL和ECharts软件完成数据的可视化。
重点:数据可视化流程、大数据可视化方法、大数据可视化软件与工具。
难点:时空数据可视化、多维数据可视化。
第8章 互联网大数据处理 4学时
基本要求:掌握互联网信息抓取技术,可以通过互联网信息抓取、文本分词、倒排索引与网页排序这四个主要步骤完成互联网大数据处理,并能够熟练运用。
重点:Nutch爬虫、文本分词、倒排索引、网页排序。
难点:倒排索引。
第9章 大数据商业应用 2学时
基本要求:熟悉用户画像和精准营销的构建;熟悉广告推荐系统的建设;熟悉互联网金融的应用方法。
重点:用户画像构建流程、用户标签、广告推荐、互联网金融应用方向。
难点:信用评分算法、分类模型的功能评估。
第10章 行业大数据 2学时
基本要求:通过地震大数据、交通大数据、环境大数据和警务大数据等例子,熟悉行业大数据的应用,学会利用数据创造价值。
重点:了解数据和数据分析在业务活动中的具体表现。
难点:无。
三、课程安排
通过在线直播方式进行授课。授课时间为:2020年5月25日开课
具体课程安排如下:
[align=center][/align]
四、课时分配
[align=center][/align]
五、建议教材与教学参考书
[align=center][/align]
大数据导论(适合高职高专院校)
一、课程性质、目的与要求
课程性质:高职高专院校大数据专业必修课程、非大数据专业选修课程。
课程目的:本课程旨在加深学生在程序设计方法上的理解和掌握,通过相关案例让学生逐步了解并掌握各知识点。整个过程融“教、学、练”于一体,增强学生的实际操作能力和独立解决问题的能力,达到灵活运用操作系统各知识点解决相关问题的目的,并为后续专业基础课程和专业课程的学习奠定扎实的基础。
课程要求:在教学过程中,根据高职院校培养应用型人才的特点,以典型工作任务为主线、以各种资源管理为核心,以培养能力和提高兴趣为目标,变应试为应用,注重在新形势下新方法、新规则和新思想的传授。着重培养学生能够灵活运用这些思想和方法的能力。课程教学中要遵循实际来源于实际的原则,融“教、学、练”于一体,体现“在做中学,在学中做,学以致用”,以增强知识点的实用性,激发学生的学习兴趣。在实际教学环节中融入相关理论知识,突出实际来源于实际和指导实际的作用,使学生在学习中提升知识运用水平。
具体目标:
知识目标
技能目标
第1章 大数据基本概念和应用 2学时
基本要求:了解大数据的基本概念,了解大数据的来源、特点和意义,了解大数据的表现形式和应用场景。
重点:大数据的定义、大数据的市场应用。
难点:无。
第2章 大数据架构 4学时
基本要求:掌握大数据的分类,了解数据类型,了解大数据的处理方案、了解Hadoop的核心设计,了解Hadoop的平台搭建。
第3章 大数据采集和预处理 8学时
基本要求:熟悉常用的大数据采集工具,特别是Apache Kafka数据采集应用方法;熟悉数据预处理原理和方法,包括数据清洗、数据集成、数据转换;掌握数据仓库概念与ETL工具的实际应用。
重点:Apache Kafka数据采集、数据清洗、数据仓库与ETL工具。
难点:数据挖掘算法的综合应用。
第4章 大数据存储 6学时
基本要求:了解大数据存储的相关概念,了解数据仓库的概念,了解数据仓库的构成和构建方式,掌握大数据存储技术的应用。
重点:云存储系统的结构模型、分布式文件系统、数据库。
第5章 大数据分析 8学时
基本要求:了解大数据分析的相关概念,了解大数据分析的技术,通过上机项目实例进行练习。
重点:数据分析方法、数据挖掘算法。
第6章 大数据可视化 6学时
第7章 大数据商业应用 2学时
基本要求:了解国内外大数据应用的经典案例,以地震大数据、交通大数据、环境大数据和警务大数据为例,熟悉行业大数据的应用,学会利用数据创造价值。
四、课时分配
[align=center][/align]
五、建议教材与教学参考书
[align=center][/align]