4 亿用户，7W+ 作业调度难题，Bigo 基于 Apache DolphinScheduler 巧化解

阅读原文时间：2023年07月08日阅读：3

点击上方蓝字关注我们

✎ 编者按

成立于 2014 年的 Bigo，成立以来就聚焦于在全球范围内提供音视频服务。面对 4 亿多用户，Bigo 大数据团队打造的计算平台基于 Apache DolphinScheduler 调度系统日均处理 7W+ 作业。

Bigo 如何基于 Apache DolphinScheduler 打造离线计算服务平台？Bigo 计算平台负责人在 Apache DolphinScheduler Meetup 2021 上进行了用户案例分享，现将演讲整理如下：

建设背景

疫情催生了音视频需求快速上涨，加上 5G 技术的推广，让技术积淀深厚的音视频行业迎来了全新的发展机遇。IDC 数据显示，2020上半年，中国视频云基础设施市场规模达到26.3亿美元，预计到 2024 年将超过 191 亿美元，应用场景主要包括长短视频点播、直播、音视频通信、媒体处理、智能内容等。

成立于 2014 年的 Bigo，成立以来就聚焦于在全球范围内提供音视频服务，如今其旗下全球视频直播社区 Bigo live，短视频内容创作平台 Likee，音视频通讯 imo 服务于全球150 个国家的 4 亿多用户，覆盖实时多人语音/视频+直播+点播场景。

Bigo 内部成立了大数据团队来服务 4 亿多用户，并在其下设立计算平台，为整个公司提供大数据计算服务，支持离线、OLAP、实时等多种业务场景。当前，Bigo 计算平台维护着 2000 台离线集群，每天处理着 7W+ 作业，服务上千个用户。

面对如此大规模的任务，Bigo 计算平台使用了 Apache DolphinScheduler、Oozie、Airflow（主要用于机器学习）、Crontab 等多种调度方式，作业以 Spark 为主，覆盖了 Hive、Python、MR、Shell、Sqoop 等。但基于日常业务实践中的使用体验出发，Bigo 计算平台决定不久后将所有调度任务逐步迁移至 DolphinScheduler。

为什么迁移到 DolphinScheduler

多种调度方式既为 Bigo 计算平台带来很多选择，但同时也因为调度框架过多，导致用户的入口分散，而且各种调度系统都存在不同程度的缺点，比如 Oozie 使用起来不友好较难上手，Airflow 基于镜像，对于机器学习用户来说很便利，但是稳定性较差。

Bigo 计算平台的目标很明确，就是要搭建一个离线服务平台，作为用户的统一入口。这个服务平台对调度系统的要求是扩展性、易用性要好，且要有完善的API和活跃的社区支持。

综合调研对比 Oozie、Airflow、DolphinScheduler、Livy、DataSphereStudio、DataWorks 后，Bigo计算平台最终得出结论，DolphinScheduler 在各方面比较优秀，尤其是 API 支持和中文社区的支持。

提升用户体验的改进

虽然 DolphinScheduler 在各方面都比较适合使用，但仍有改进的空间，以保证用户体验，尽量兼容用户的使用方式。

用户管理

接入 DolphinScheduler 之后，Bigo计算平台第一件事就是打通 OA，免去了注册的步骤，可以更好管理人员流动。

此外，Bigo 计算平台还屏蔽了租户概念，因为群组级别的权限控制在管理员手中，而当实际作业规模较大时，管理员权限控制会带来诸多提交上的不便，因此 Bigo 计算平台屏蔽了租户概念，改用个人账号提交作业。

项目管理

原来 DolphinScheduler 要求项目名全局唯一，用户名不能重名，而当项目成千上万时，这个要求会带来不必要的麻烦。对此，Bigo计算平台允许不同项目、资源和数据源重名，去掉了全局唯一。

另外，DolphinScheduler 只能在管理员层面进行项目分享，分享的成本较高，Bigo计算平台针对这一点，将权限下放至个人，非 admin 用户也可以分享资源。

工作流管理

工作流页面完成开发、上线、查看一站式操作

原来在 DolphinScheduler 工作流列表页面才能进行上下线，用户在不同页面之间跳转才能完成上线操作，其他平台工作流嵌入到页面更是繁琐。

在此之上，Bigo计算平台进行改进，让用户可以在工作流页面就完成开发、上线、查看一站式操作，免去跳转的麻烦。

工作流历史聚合

工作流随时间的运行状况，在 DolphinScheduler 原来的树形结构上需要把鼠标放在上面才能查看。为优化用户体验，Bigo计算平台在树形图下方添加了一个工作流运行列表，直观地展示工作流每日运行状态，一段时间内的工作运行状况一览无遗。

用户可直达App

点击 link 可以跳转到App，查看页面的真正的日志和执行情况。

各种任务开发

除了工作流查看外，Bigo 还进行了各种任务开发改造。

比如支持多种资源方式，不仅支持资源中心上传，还支持直接输入 HDFS 路径，本地上传文件。

支持 sub process 个性化参数，用户在引用子工作流时可以设置个性化参数，更方便开发作业。

内核改造，以适应实际业务需求

除了在用户体验上的优化，DolphinScheduler 还进行了内核层面的改造，以更适应其实际业务需求。

目前，Bigo 基于 DolphinScheduler 的计算服务主要面向公司内部用户，包括了 BI 分析、机器学习、音视频处理、数仓等几乎所有技术团队。处理场景需求的特殊性要求 Bigo 从内核层面上进行优化，以适应实际场景需求。

具体来说，Bigo 计算平台所做的 DolphinScheduler 内核改造包括：

任务提交去中心化

DolphinScheduler 是通过 worker fork 进程提交作业，提交之后任务等待运行。Worker 作为 client 限制了worker 同时运行任务的上限，SQL依赖hive server/ spark thrift server等，提交都要通过中心化的 server，这会影响系统稳定性和规模性。对此，Bigo 计算平台将提交方式改为分布式提交，将 Spark/Spark SQL/MR 直接提交为Yarn 的任务，Shell/Sqoop 等运行在自己开发的一个APP中，将集中在 worker 上的任务分散到整个集群中，而不是等待任务完成。

Worker 支持 Failover

DolphinScheduler worker重启后，作业要杀掉重新提交，但由于作业可能长达十几小时，限制了 worker 同时运行任务的上限，升级重启也会受到一定影响。

在任务提交优化基础上，Bigo 计算平台对任务管理进行了优化，Worker 提交任务到 Yarn 之后，记录 application 信息，Worker 后台异步追踪 application 运行信息，不用重新提交作业。而当一个 worker 失联后，其他 worker 可以接管原先的 application，继续追踪。

工作流并发度限制

工作流有一些常见的运行场景，比如部分工作流要求同时只能有一个在运行；部分工作流可以并发运行，但需要设置并发上限；补数时，可能需要补较长区间，以及限制上限，以免对集群造成冲击等。

这些都会对调度系统形成挑战，Bigo 计算平台在后台做的另一件事，是增加了并发度配置。原来，如果当前运行的工作流实例已达上限，需要等待前面的运行结束才能启动新的实例，而加了并发度配置后，可以避免占用过多资源。

补数支持触发下游

补数也是常见的场景，这时可能下游数据也需要重算，DolphinScheduler 目前是通过 dependency 设置上下游关系，这会导致补数时下游知道上游，但上游不知道下游，从而导致下游调度受阻。因为对补数有强需求，Bigo 对补数进行了重点改造，包括记录工作流之间依赖关系，补数时可选上游是否触发下游，以及自动计算下游需要何时触发，准确地计算补数。

其他改动

其他重要但不详述的改动还包括日志清理，磁盘目录清理，接入电话、微信告警打通等。

未来计划

Bigo 计算平台负责人徐帅 表示，考虑到 DolphinScheduler 2.0 对 Master 的优化将对Bigo 计算平台性能提升产生较大的积极影响，因此 Bigo 计划将于近期更新至 DolphinScheduler 2.0 版本，并与机器学习平台打通，完成调度的无感知迁移。

Bigo 计算平台负责人徐帅

社区与用户之间互相成就，是 DolphinScheduler 始终秉持的初衷。Bigo 也表示，未来会将对 DolphinScheduler 普适的改动回馈给社区，减少私有代码，紧跟社区，社区也将为 Bigo 顺利实现迁移提供全面的支持。

06

加入社区

随着国内开源的迅猛崛起，Apache DolphinScheduler 社区迎来蓬勃发展，为了做更好用、易用的调度，真诚欢迎热爱开源的伙伴加入到开源社区中来，为中国开源崛起献上一份自己的力量，让本土开源走向全球。
参与 DolphinScheduler 社区有非常多的参与贡献的方式，包括：

贡献第一个PR(文档、代码)&nbsp;我们也希望是简单的，第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。
社区汇总了以下适合新手的问题列表：https://github.com/apache/dolphinscheduler/issues/5689
进阶问题列表：https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22
如何参与贡献链接：https://dolphinscheduler.apache.org/zh-cn/docs/development/contribute.html

来吧，DolphinScheduler开源社区需要您的参与，为中国开源崛起添砖加瓦吧，哪怕只是小小的一块瓦，汇聚起来的力量也是巨大的。
参与开源可以近距离与各路高手切磋，迅速提升自己的技能，如果您想参与贡献，我们有个贡献者种子孵化群，可以添加社区小助手微信(Leonard-ds)&nbsp;手把手教会您( 贡献者不分水平高低，有问必答，关键是有一颗愿意贡献的心 )。添加小助手微信时请说明想参与贡献。
来吧，开源社区非常期待您的参与。

社区官网

https://dolphinscheduler.apache.org/

代码仓地址
https://github.com/apache/dolphinscheduler

您的&nbsp;Star，是&nbsp;Apache DolphinScheduler&nbsp;为爱发电的动力️&nbsp;～

添加小助手微信

(Leonard-ds)

加入社区

Apache DolphinScheduler

Apache DolphinScheduler 是 Apache 基金会孵化的顶级项目。作为新一代大数据任务调度系统，致力于“解决大数据任务之间错综复杂的依赖关系，使整个数据处理流程直观可见”。DolphinScheduler 以 DAG(有向无环图) 的方式将 Task 组装起来，可实时监控任务的运行状态，同时支持重试、从指定节点恢复失败、暂停及 Kill 任务等操作，并专注于可视化 DAG、调用高可用、丰富的任务类型依赖、任务日志/告警机制和补数 6 大能力。

迄今为止，Apache DolphinScheduler 社区已经有 260+ 位代码贡献者，70+ 位非代码贡献者，其中也不乏其他 Apache 顶级项目的 PMC 或者 Committer。开源社区也在不断发展壮大，微信用户群近 6000 人。截止 2021 年 9 月，已经有 600 + 家公司及机构在生产环境中采用 DolphinScheduler。

欢迎更多伙伴也能参与到开源社区建设中来，让未来 DolphinScheduler 的规划中也有你的一份贡献！

☞在生鲜零售业，DolphinScheduler 还能这么玩！☞荔枝机器学习平台与大数据调度系统“双剑合璧”，打造未来数据处理新模式！
☞最佳实践｜联通数科基于 DolphinScheduler 的二次开发
☞DolphinScheduler 荣获 2021 中国开源云联盟优秀开源项目奖！
☞重构、插件化、性能提升 20 倍，Apache DolphinScheduler 2.0 alpha 发布亮点太多！☞巨变！a16z 关于新一代数据基础设施架构的深度洞察☞手把手教你 Apache DolphinScheduler 本地开发环境搭建 | 中英文视频教程☞Apache&nbsp;DolphinScheduler使用规范与使用技巧分享

点击阅读原文，报名预约！

点个在看你最好看

手机扫一扫

移动阅读更方便

你可能感兴趣的文章

就在明天，Apache DolphinScheduler Meetup 2021 如约而至！

活动报名｜对话贡献者：DolphinScheduler x Pulsar 在线 Meetup