资料介绍
软件简介
Big Whale 巨鲸任务调度平台为美柚大数据研发的分布式计算任务调度系统,提供 Spark、Flink 等批处理任务的 DAG 调度和流处理任务的运行管理和状态监控,并具有Yarn应用管理、重复应用检测、大内存应用检测等功能。 服务基于 Spring Boot 2.0 开发,打包后即可运行。
概述
1.架构图
2.特性
- 基于SSH的脚本执行机制,部署简单快捷,仅需单个服务
- 基于Yarn Rest Api的任务状态同步机制,对Spark、Flink无版本限制
- 支持失败重试
- 支持任务依赖
- 支持复杂任务编排(DAG)
- 支持流处理任务运行管理和监控
- 支持Yarn应用管理
部署
1.准备
- Java 1.8+
- Mysql 5.1.0+
- 下载项目或git clone项目
- 为解决 github README.md 图片无法正常加载的问题,请在hosts文件中加入相关域名解析规则,参考:hosts
2.安装
- 创建数据库:big-whale
- 运行数据库脚本:big-whale.sql
- 根据Spring Boot环境,配置相关数据库账号密码,以及SMTP信息
- 配置:big-whale.properties
- 修改:$FLINK_HOME/bin/flink,参考:flink(因flink提交任务时只能读取本地jar包,故需要在执行提交命令时从hdfs上下载jar包并替换脚本中的jar包路径参数)
- 打包:mvn clean package
3.启动
- 检查端口17070是否被占用,被占用的话,关闭占用的进程或修改项目端口号配置重新打包
- 拷贝target目录下的big-whale.jar,执行命令:java -jar big-whale.jar
4.初始配置
-
打开:http://localhost:17070
- 输入账号admin,密码admin
- 点击:权限管理->用户管理,修改当前账号的邮箱为合法且存在的邮箱地址,否则会导致邮件发送失败
-
添加集群
-
集群管理->集群管理->新增
- “yarn管理地址”为Yarn ResourceManager的WEB UI地址
- “程序包存储目录”为程序包上传至hdfs集群时的存储路径,如:/data/big-whale/storage
- “支持Flink任务代理用户”“流处理任务黑名单”和“批处理任务黑名单”为内部定制的任务分配规则,勿填
-
集群管理->集群管理->新增
-
添加集群用户
-
集群管理->集群用户->新增
- 该配置的语义为:平台用户在所选集群下可以使用的Yarn资源队列(--queue)和代理用户(--proxy-user)
-
集群管理->集群用户->新增
-
添加代理
-
集群管理->代理管理->新增
- 可添加多个实例(仅支持IP地址,可指定端口号,默认为22),执行脚本的时候会随机选择一个实例执行,在实例不可达的情况下,会继续随机选择下一个实例,在实例均不可达时执行失败
- 选择集群后,会作为该集群下提交Spark或Flink任务的代理之一
-
集群管理->代理管理->新增
-
添加计算框架版本
-
集群管理->版本管理->新增
- 同一集群下不同版本的Spark或Flink任务的提交命令可能有所不同,如Spark 1.6.0版本的提交命令为spark-submit,Spark 2.1.0版本的提交命令为spark2-submit
-
集群管理->版本管理->新增
使用
1.离线调度
1.1 新增
- 目前支持“Shell”、“Spark Batch”和“Flink Batch”三种类型的批处理任务
-
通过拖拽左侧工具栏相应的批处理任务图标,可添加相应的DAG节点
-
支持时间参数
${now} ${now - 1d} ${now - 1h@yyyyMMddHHmmss}
等(d天、h时、m分、s秒、@yyyyMMddHHmmss为格式化参数) - 非“Shell”类型的批处理任务应上传与之处理类型相对应的程序包,此处为Spark批处理任务打成的jar包
- “资源选项”可不填
- 代码有两种编辑模式,“可视化视图”和“代码视图”,可互相切换
- 点击“测试”可测试当前节点是否正确配置并可以正常运行
- 为防止平台线程被大量占用,平台提交Saprk或Flink任务的时候都会强制以“后台”的方式执行,对应spark配置:--conf spark.yarn.submit.waitAppCompletion=false,flink配置:-d,但是基于后台“作业状态更新任务”的回调,在实现DAG执行引擎时可以确保当前节点所提交的任务运行完成后再执行下一个节点的任务
-
支持时间参数
- DAG节点支持失败重试
-
将节点按照一定的顺序连接起来可以构建一个完整的DAG
-
DAG构建完成后,点击“保存”,完成调度设置
1.2 操作
- 打开离线调度列表
-
点击左侧操作栏“调度实例”可查看调度实例列表、运行状态和节点启动日志
- 点击左侧操作栏“手动执行”可触发调度执行
2.实时任务
2.1 新增
-
目前支持“Spark Stream”和“Flink Stream”两种类型的流处理任务
-
启用监控可以对任务进行状态监控,包括异常重启、批次积压告警等
2.2 操作
- 打开实时任务列表
- 点击左侧操作栏“日志”可查看任务启动日志
- 点击左侧操作栏“执行”可触发任务启动
3.任务告警
- 正确配置邮件或钉钉告警后在任务运行异常时会发送相应的告警邮件或通知,以便及时进行相应的处理
<巨鲸任务告警> 代理: agent1 类型: 脚本执行失败 用户: admin 任务: 调度示例1 - shell_test 时间: 2021-03-05 15:18:23
<巨鲸任务告警> 集群: 集群1 类型: spark离线任务异常(FAILED) 用户: admin 任务: 调度示例1 - spark_test 时间: 2021-03-05 15:28:33
<巨鲸任务告警> 集群: 集群1 类型: spark实时任务批次积压,已重启 用户: admin 任务: sparkstream_test 时间: 2021-03-05 15:30:41
- 除上述告警信息外还有其他告警信息此处不一一列举
Change log
- v1.1开始支持DAG
- v1.2开始支持DAG节点失败重试
- v1.3调度引擎进行重构升级,不支持从旧版本升级上来,原有旧版本的任务请手动进行迁移,离线调度移除“Python”类型脚本支持
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- 分布式电源对配电系统的影响分析
- 基于Simulink的电子对抗分布式仿真系统 26次下载
- 基于KingSCADA的分布式运动控制监测系统 10次下载
- MapReduce框架下分布式编码计算容错算法 2次下载
- 一种分布式网络扫描架构和任务调度算法 19次下载
- 如何通过YARN设计分布式资源动态调度协同分配系统 12次下载
- 分布式智能电网控制系统的设计与实现 2次下载
- 基于MapReduce架构的分布式母线保护 1次下载
- 电力系统分布式经济调度 10次下载
- 分布式系统进程调度方法研究
- 三层分布式计算网格任务调度系统 25次下载
- 分布式计算的新闻自动编目系统
- 基于Multi-Agent的分布式测控系统任务调度算法
- 基于实数编码免疫算法的分布式任务调度
- 分布式多媒体计算机系统教程 0次下载
- 分布式SCADA系统的特点的组成 324次阅读
- 任务调度系统设计的核心逻辑 602次阅读
- Java手写分布式锁的实现 424次阅读
- tldb提供分布式锁使用方法 761次阅读
- 深入理解redis分布式锁 763次阅读
- 如何使用分布式存储系统促进AI模型训练 494次阅读
- 利用NI VeriStand 2010实现分布式同步系统的设计 3154次阅读
- 基于Jini互联技术实现分布式嵌入式系统的设计 3008次阅读
- 详谈分布式系统的定义及属性 3689次阅读
- 分布式光纤传感器原理_分布式光纤传感器的应用 8424次阅读
- 分布式控制系统的介绍 5216次阅读
- 存储分布式系统中如何从CAP转到PACELC 2692次阅读
- 基于 FPGA 客户端的分布式计算网络设计 1177次阅读
- 深度解读分布式存储技术之分布式剪枝系统 1773次阅读
- 基于CAN总线的分布式网架健康状态监测系统的设计 963次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多