0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据建模、分析、挖掘技术应用研修班的通知

li1234567890123 来源:li1234567890123 作者:li1234567890123 2022-02-19 16:37 次阅读

大数据建模、分析、挖掘技术应用研修班的通知

随着2015年9月国务院发布了《关于印发促进大数据发展行动纲要的通知》,各类型数据呈现出了指数级增长,数据成了每个组织的命脉。今天所产生的数据比过去几年所产生的数据大好几个数量级,企业有了能够轻松访问和分析数据以提高性能的新机会,如何从数据中获取价值显得尤为重要,也是大数据相关技术急需要解决的问题。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。数据建模不仅仅是任意组织数据结构和关系,还必须与最终用户的需求和问题联系起来,并提供指导,帮助确保正确的数据正确使用正确的方法获得正确的结果。

为响应科研及工作人员需求,根据《国务院关于推行终身职业技能培训制度的意见》提出的“紧跟新技术、新职业发展变化,建立职业分类动态调整机制,加快职业标准开发工作”要求,特举办“大数据建模、分析、挖掘技术应用研修班”。本次培训采用实战培训模式。

2022年3月10日 — 2022年3月14日 北京(同时转线上直播)

联系人:任老师 13331040142

一、大数据概述

1.大数据及特点分析

2.大数据关健技术

3.大数据计算模式

4.大数据应用实例

二、大数据处理架构Hadoop

1.Hadoop项目结构

2.Hadoop安装与使用

3.Hadoop集群的部署与使用

4.Hadoop 代表性组件

三、分布式文件系统HDFS

1.HDFS体系结构

2.HDFS存储

3.HDFS数据读写过程

四、分布式数据库HBase

1.HBase访问接口

2.HBase数据类型

3.HBase实现原理

4.HBase运行机制

5.HBase应用

五、MapReduce

1.MapReduce体系结构

2.MapReduce工作流程

3.资源管理调度框架YARN

4.MapReduce应用

六、Spark

1.Spark生态与运行架构

2.Spark SQL

3.Spark部署与应用方式

案例:

1.Python Spark 安装

2.本地运行pyspark程序

3.在Hadoop YARN 运行pyspark

4.Spark Web UI

七、IPython Notebook运行Python Spark程序

1.Anaconda

2.IPython Notebook使用Spark

3.使用IPython Notebook在Hadoop YARN模式运行

案例:

1.在不同模式运行IPython Notebook运行Python Spark命令

2.Python 程序开发

八、Python Spark集成开发环境

1.Python Spark集成开发环境部署配置

2.Spark数据分析库MLlib的开发部署

九、Python Spark决策树二分类与多分类

1.决策树原理

2.大数据问题

3.决策树二分类

4.决策树多分类

案例:

1.搜集数据

2.数据准备:导入并转换数据、提取特征字段、提取标签

3. Python Spark建模,训练模型

4.预测数据

5.评估数据,给出评价指标并得到评估结果

十、Python Spark支持向量机

1.支持向量机SVM 原理与算法

2.Python Spark SVM程序设计

案例:

1.数据准备

2.建立SVM模型,训练模型

3.评估参数并找出最优参数

4.根据模型进行预测

十一、Python Spark 贝叶斯模型

1.朴素贝叶斯模型原理

2.Python Spark贝叶斯模型程序设计

案例:

1.建模贝叶斯模型,并进行对参数估计

2.训练模型,得到最优参数

3.根据模型进行预测

十二、Python Spark逻辑回归

1.逻辑回归原理

2.Python Spark逻辑回归程序设计

案例:

1.Python Spark逻辑回归建模

2.根据模型进行分类

十三、Python Spark回归分析

1.大数据分析

2.数据集介绍

3.Python Spark回归程序设计

案例:

1.数据准备

2.训练回归模型

3.建立评估指标

4.训练回归模型,并找到最优参数

5.根据模型进行预测

十四、Spark ML Pipeline 机器学习流程分类

1.机器学习流程组件:StringIndexer、OneHotEncoder、VectorAssembler等

2.使用Spark ML Pipeline 机器学习流程分类程序设计

案例:

1.数据准备

2.建立机器学习Pipeline流程

3.使用Pipeline流程训练

4.使用PipelineModel预测

5.评估模型准备率

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 建模
    +关注

    关注

    1

    文章

    293

    浏览量

    60631
  • 机器学习
    +关注

    关注

    66

    文章

    8300

    浏览量

    131767
  • 大数据
    +关注

    关注

    64

    文章

    8801

    浏览量

    136968
收藏 人收藏

    评论

    相关推荐

    龙芯中科成功举办全国高校教师教学能力培养高级研修班

    近日,龙芯中科携手云南大学信息学院联合举办了为期两天的全国高校教师教学能力培养高级研修班。昆明理工大学、西南科技大学、西安工业大学、信息工程大学等十余所高校,共四十余名教师参与此次培训。
    的头像 发表于 08-21 11:37 374次阅读

    2024年新能源车载磁性元件研修班成功开班!

    车载磁性元件研修班再度来袭!8位业内资深大咖携手,他们将带来哪些新的技术和设计方法? 5月29日,为期3天的2024年新能源汽车中磁性元件技术与应用高级研修班(第一期)在山西省太原理工
    的头像 发表于 06-12 09:39 214次阅读
    2024年新能源车载磁性元件<b class='flag-5'>研修班</b>成功开班!

    gis建模与空间分析的区别

    进行比较和解析。 首先,GIS建模是指将现实世界的地理实体和现象通过计算机技术和方法表达出来,用数字化的方式模拟、描述和分析。GIS建模可以分为两个方面,即地理
    的头像 发表于 02-25 14:57 679次阅读

    【电磁兼容技术案例分享】某显示屏因结构缝隙泄漏导致辐射发射超标案例

    上海3月15日-16日《产品EMC设计分析与风险评估技术》高级研修班,报名火热进行中!2024.1.25深圳3月21日-23日《硬件电路设计、调试与工程案例分析》公开课即将开始!202
    的头像 发表于 02-22 08:16 240次阅读
    【电磁兼容<b class='flag-5'>技术</b>案例分享】某显示屏因结构缝隙泄漏导致辐射发射超标案例

    数据挖掘的应用领域,并举例说明

    数据挖掘(Data Mining)是一种从大量数据中提取出有意义的信息和模式的技术。它结合了数据库、统计学、机器学习和人工智能等领域的理论和
    的头像 发表于 02-03 14:19 2105次阅读

    大数据技术是干嘛的 大数据核心技术有哪些

    的核心技术,包括数据采集、存储与管理、处理与分析等方面。 一、大数据技术背景和概念 1.1 背景 随着互联网
    的头像 发表于 01-31 11:07 2236次阅读

    百度生成式AI如何助力医疗应用升级?

    1月6日,小寒节气来临之日,2024年北京大学医院管理、医疗产业、投融资领军人才研修班(以下简称:“研修班”)开学典礼正式在“燕园”举办。北京大学政府管理学院院长燕继荣,百度集团资深副总裁、大健康事业群(HCG)总裁何明科等出席开学典礼,何明科作为导师代表发表致辞。
    的头像 发表于 01-10 09:30 1535次阅读

    大数据技术如何为精益管理赋能?

    管理提供数据支持 精益管理强调以数据为基础,通过数据分析挖掘,发现企业运营中的问题和瓶颈,进而优化流程、提高效率。大数据
    的头像 发表于 12-19 09:58 472次阅读

    Get职场新知识:做分析,用大数据分析工具

    综合分析。但现在有了大数据分析工具,一切问题都可迎刃而解。 大数据分析工具,顾名思义就是专门为分析海量数据而开发的一类工具。这类工具具有极强
    发表于 12-05 09:36

    电梯物联网大数据平台是什么意思?

    电梯物联网大数据化平台是将电梯的使用时间和管理中的各项数据进行采集,整合及利用大数据分析能力和计算机视觉技术、结合关联分析、空间
    的头像 发表于 11-23 11:01 627次阅读

    先楫半导体 江苏电源学会,南航研修班成功举办

    2023年11月18日-19日,由江苏省电源学会主办的“宽禁带半导体器件与高频电力电子变换器高级研修班技术培训活动在南京航空航天大学(南航)自动化学院成功举办。国产高性能微控制器厂商上海先楫半导体
    的头像 发表于 11-21 08:17 702次阅读
    先楫半导体 江苏电源学会,南航<b class='flag-5'>研修班</b>成功举办

    清华大学-新疆商贸物流集团管理创新与领导力提升高级研修班一行赴软通动力参观交流

    11月8日,清华大学-新疆商贸物流集团管理创新与领导力提升高级研修班(一期)一行走进软通动力信息技术(集团)股份有限公司,参观了软通动力数字创新中心,并围绕企业数字化建设和转型相关内容开展学习交流
    的头像 发表于 11-09 10:15 312次阅读
    清华大学-新疆商贸物流集团管理创新与领导力提升高级<b class='flag-5'>研修班</b>一行赴软通动力参观交流

    首期“数据要素资产入表理论高级研修班”圆满结业

    10月22日,由中国财政科学研究院培训中心与易华录联合举办的首期“数据要素资产入表理论高级研修班”在北京圆满结业。 本次研修班为期两天,聚集了来自全国各地数据要素型企业高管、
    的头像 发表于 10-23 10:00 519次阅读
    首期“<b class='flag-5'>数据</b>要素资产入表理论高级<b class='flag-5'>研修班</b>”圆满结业

    机器学习与数据挖掘方法和应用

    机器学习与数据挖掘方法和应用(经典)
    发表于 09-26 07:56

    基于大数据分析的5G智能工厂如何实现

    、应用和未来的发展前景,以及它们如何相互结合,推动智能制造的未来发展。 大数据分析是指通过对海量数据进行分析挖掘出其中有价值的信息和知识,以指导业务决策和创新的过程。与传统
    的头像 发表于 09-25 17:08 450次阅读