首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    OPPO 大数据诊断平台“罗盘”正式开源

    OPPO 大数据平台目前有 20+个服务组件,数据量超 1EB,离线任务数近百万,实时任务数千,数据开发分析师超千人。这也带来了系统复杂度的问题,一方面是用户经常对自己的任务运行状况“摸不着头脑”,不管是性能问题,还是参数配置问题,甚至是一些常见的权限报错问题,都需要咨询平台给出具体的解决方案;另一方面是平台面对各类繁杂任务,运维人员经常需要对任务故障定位和排除,由于任务链路长,组件日志多,运维压力大。因此急需对任务进行实时监控和诊断,不仅要能够帮助用户快速定位异常问题,还需给出具体的建议和优化方案,同时还能治理各类“僵尸”和不合理任务,从而达到降本增效的目的。据调研,目前业界尚无成熟的开源任务诊断平台。为此我们开发了大数据诊断平台,通过诊断平台周优化任务实例数超2 万,取得了良好的效果。

    02

    airflow—执行器CeleryExecutor(3)

    本文介绍了Airflow这个开源框架,用于构建、管理和执行工作流。Airflow基于Python开发,利用Django、Flask等后端框架提供的Web接口,支持各种任务调度和错误处理机制。通过使用Python的类、函数和钩子,用户可以自定义和管理自己的工作流。Airflow还提供了丰富的客户端API,可以方便地与其他工具集成。同时,Airflow支持多租户,每个租户有自己的DAG和Task。Airflow还支持通过Celery将Task分布到多个机器上运行,以支持大规模并发处理。此外,Airflow还有丰富的监控和报警功能,可以实时监控Task和DAG的运行状态,并支持邮件报警。总之,Airflow是一个强大、灵活、易用的工作流框架,在数据科学和大数据处理领域具有广泛应用。

    06
    领券