导读:国内某头部理财服务提供商成立于 2019 年,是股份制银行中首批获准筹建、首家获准开业、首家成立的银行理财子公司。自 2004 年推出国内首支人民币理财产品以来,通过投资模式的不断创新和投资管理能力的持续提升,引领国内银行业理财市场。该企业每天处理的任务量达 1W,内部系统众多,当务之急是需要一个统一的调度和监控平台,支持不同理财业务场景下的需求。
2023 年之前,该企业使用开源版本的大数据调度平台 Apache DolphinScheduler 能基本上满足业务需求,但随着业务量增大和个性化需求的增长,在经过周密的调研之后,决定将所有调度任务迁移到商业版本白鲸调度系统之上。
采用白鲸调度系统让该企业实现了统一调度和监控运维,调度性能大幅提高。本文将详细描述白鲸调度系统为该企业提供的解决方案和相关应用实践。
业务需求
国内某头部理财服务提供商所处的金融行业属于数据密集型行业,随着这个行业的不断发展和技术的不断进步,金融数据的数据量不断增加,数据来源也越来越多样化,其需要对数据质量进行严格的把控,并需要具备高效的数据处理和分析能力。此外,金融市场变化快速,风险控制需要实时响应,这对其数据处理和分析能力提出了更高的要求。同时,保护客户的隐私和机密信息,防范网络攻击和数据泄露等安全问题,都对该企业提出重要的挑战。
具体来说,该企业的产销、投资、风险评估、运营投资等团队都有自己的数据集市(数仓),每个团队都从需要的贴源层获取到自己需要的数据,经过各自团队的ETL 流程,将统计数据输出到各自的集市中,再把自己的集市数据分享给其他人。
由于每个团队都有各自的调度平台,这导致平台的维护成本非常高,运维管理也很不方便,另一方面也不能集中统计和管理所有团队的任务。
因此,统一调度系统的建设在该企业是当务之急。 在建设数据体系过程中,其需要基于信创环境下建设具有高性能、可靠性高、易扩展的调度系统,以满足该企业在数据体系建设中各类数据处理任务的统一调度和监控需求,实现统一调度和监控运维,支持不同场景下实现各自个性化的需求,保障数据体系的基础建设。
接到商业调度需求时,该企业当时的调度集群由 3 台 40C*256G 的机器组成,由两台 API 、3 个 Master 、3 个 Worker组成,每天处理 1 万量级的任务,将来可能到 3 万+/天。
具体到业务线上,该企业对建设调度系统有着如下需求:
- 要支持各部门使用统一的调度系统,使用权限将各部门的资源进行隔离,保证系统运转的隔离性和安全性。
- 要有丰富的监控和统计功能,支持统一的数据监控、运维服务的需求;
- 调度系统要支持多种触发类型,比如事件、自定义日历、依赖调度等方式触发作业,支持用户灵活配置作业及组合工作流,实现在不同场景的调度需求;
- 需要能结合该企业自身需求,支持信创组件、扩展性的任务类型、数据源类型、告警组件及其他扩展需求;
- 支持分布式的架构及资源控制等方法,实现一个高可靠性,高处理性能的调度系统;
- 支持定制化需求,比如和该企业的自身用户系统对接用户及权限数据,对接客户的统一登录平台,以及其他数据处理平台和告警平台。
基于白鲸调度系统的一站式解决方案
白鲸调度系统国产信创化调度平台,就是为了支持客户在数据体系建设中不同场景的任务调度需求,针对企业级用户对系统的稳定性、可靠性、合规性、高性能、支持信创环境等要求而开发出的商业化版本,定位于企业级统一调度平台,为企业的批处理任务制定统一的开发规范、运维方法,对各系统的批量任务进行统一管理、调度和监控。
白鲸调度系统继承了大数据调度平台 Apache DolphinScheduler强大的功能与易用性,同时增加了多项企业级功能以满足实际行业用户需求,让企业可以部署一套调度系统,减少维护成本,拥有强大的调度能力。
在明确需求后,白鲸开源自信白鲸调度系统能够满足客户的全部需求,着手分步骤、分阶段进行解决方案的实施部署。经过了一系列测试后,白鲸开源启动了实施方案,并帮助客户解决了部署前、部署中和部署后的一系列问题,为其交付了完整的解决方案。
整体技术方案
白鲸调度系统主要使用无中心架构的设计思想,通过注册中心发现服务,服务之间可以互为备份,保证了系统的可靠性的同时,也可以做到水平扩展服务数量,能够很好地支持企业千万级别的任务数量,完全满足金融业务场景数据处理量大的需求。
白鲸调度系统主要服务包括 UI 用户界面、接口层 API 服务,MasterServer、WorkerServer、AlertServer 五个模块,其中任务处理服务 MasterServer 和 WorkerServer 是典型的无中心架构,通过注册中心自动发现服务的启动和关闭,能有效支持任务数量激增和减少的场景,同时可以保证任务处理的可扩展性和高性能。
系统所有服务均采用分布式部署,支持高稳定性、高性能和高容错性,保证提供可持续使用的服务,即使客户的数据中心散步在全国各地,白鲸调度系统也能轻松应对来自客户不同部门数据系统的处理需求。
针对客户的需求,白鲸调度系统提供的解决方案让每个团队都拥有了自己的任务执行集群,调度系统是单独的集群,免密登录各自团队的集群,各团队都在调度上使用 shell 任务 的 ssh remote ‘shell command’ 来执行各自集群上的任务。
具体解决方案包括(由于保密需求,只透露部分信息):
多日历管理方便多个市场交易日、工作日、自然日管理
针对企业设计多种日历,支持调度日历、业务数据日历分开,并支持不同时区、日历导入等功能:
- 支持多种日历管理:交易日、工作日、自然日等
- 支持日历 Excel 模板导入
- 支持调度日历与业务日历分开
- 支持多时区设置
- 支持日切时间设置
强大的业务数据日期功能更好满足金融行业需求
针对客户调度当中的业务数据日期单独进行设计,更好地满足金融行业需求:
- 多次调度使用同一业务数据日期(例,最后一个交易日,如果不翻牌,数据指针停止在这一天,例如 ,9.30 不跑 10.1 七天 10.6日开始跑,依然跑的是 9.30 日)
- 强大的业务翻牌任务
- 支持前后自定义翻牌
- 支持自定义脚本直接生成业务日期数值
- 支持定时翻牌和任务结束翻牌
- 配合日历,支持多种复杂函数用于数据处理
- 前后 n 日、月(工作日、交易日、自然日)
- 当前牌所在月、年(工作日、交易日、自然日)
事件驱动满足文件、Kafka、数据库级别灵活触发调度
除了日期时间触发之外,增加事件触发机制,满足企业多系统之间交互的需要:
- 文件触发
- 不同文件接口,根据满足特殊定义文件自动触发
- 可以设置扫描频次与超时报警
- 数据库触发
- 满足特殊数据定义之后,自动触发任务
- Kafka 触发
- 发现符合定义消息息自动触发工作流
专业的权限设置与 Token 管理满足企业级别权限需要
针对企业设置用户、角色、权限为不同部门提供不同功能权限:
- 企业用户管理
- 独立企业用户账号,可以对接现有企业用户
- 项目角色管理
- 管理员角色、不同项目开发人员角色功能分开
- 结合项目角色控制资源权限
- Token 管理可以帮助企业设定 API 调用权限
详细的审计日志满足企业回溯用户行为审计功能
- 审计日志记录用户详细操作对象以及时间:
- 审计日志详细记录用户的操作行为
- 可以设置日志保留时间
- 支持Excel导出以及用户操作查询
高可扩展能力支持组件扩展
- 系统高可靠、易扩展
- 满足定制化需求,比如打通用户权限系统、和其他业务系统对接,扩展新的任务组件、数据源组件、告警组件,并支持对接客户自定义开发的血缘分析功能等。
支持信创环境
白鲸调度系统 在信创合规部署支持方面做到了完全的国产化: 支持国产服务器,国产 CPU、内存、主板、硬盘等,如鲲鹏服务器。
- 支持国产操作系统,如中标麒麟、银河麒麟、红旗 Linux。
- 支持国产数据库,如 达梦数据库、GaussDB、TiDB。
- 支持对系统部署所涉及到的服务器、操作系统、中间件、数据库进行信创化改造,满足信创环境下系统迁移和原有任务调度的需求。
统一监控告警、运维
实现统一的监控和运维是客户统一调度最重要的目标之一,白鲸调度系统 可以提供统一监控告警,统一监控指标,提供丰富的API接口,满足用户定制化监控需求;统一监控告警平台、运维平台,极大减少维护成本;多种监控指标,根据权限智能统计指标,满足不同角色的监控需求;统一告警服务,提供丰富的告警插件,支持多种告警方式同时发送;集中监控工作流、任务运行情况和批量操作,统一管理告警列表、事件列表等。
客户收益
当前,该企业基于白鲸调度系统搭建了统一调度平台,助力管理后台实现了:
- 为客户提供了统一调度平台,提高了数据处理效率,支撑了客户的技术部产销、投资、风险评估、运营投资各个团队的业务,后续将接入更多业务;
- 降低了运维难度,降低非技术人员门槛
- 提高交付效率
- 快速调度
- 灵活的数据分析
客户简介
国内某头部理财服务提供商,为投资者提供了丰富的投资产品,为客户创造了丰厚的投资回报。
本文由 白鲸开源科技 提供发布支持!