1、 自动化运维工具和平台的设计和开发;
2、 应用性能监控,资源监控平台的设计和开发;
3、理解业务需求,识别系统风险,设计稳定性方案。负责高可用体系建设,如监控体系完善、故障定位、自动恢复等 ;
4、参与基础架构优化,优化工具平台:发布平台、运维自动化平台、配置管理平台等
5. 有行业眼光,持续提升运维效率和系统稳定性,引入优秀理念和工具。推动DevOPS文化理念,不断提升运维自动化水平;
1、5年以上系统运维或者运维平台开发工作经验,精通Linux操作系统; 熟悉流行的运维技术和平台建设方案,有较好运维系统方案设计能力;具有分析大型应用系统架构并进行改进的能力,拥有快速排查系统瓶颈的能力;
2、熟悉Docker、k8s等虚拟化技术的部署使用,有项目实践经验的优先;
3、熟悉CI/CD流程,熟练掌握主流CI/CD系统工具的使用,有基于以上系统进行过二次开发的优先考虑;
4、熟悉主流自动化运维工具,如Ansible、Saltstack等;
5、熟悉Java并有较全的知识面,熟悉Spring、Struts、MyBatis等主流框架,使用Java开发过相关运维平台的优先;
6、精通Python,有Go开发经验的优先;
寻访要求
Base上海,职级S5、S6 对标P6-P8 T3.1 - T3.3 联系微信:a689250 (注明stanley推荐加持)
Base上海,职级S5、S6 对标P6-P8 T3.1 - T3.3 联系微信:a689250 (注明stanley推荐加持)
1、负责制定业务及系统的监控预警管理、应急机制和保障方案,并落实执行。
2、保障系统正常高效运行,设计自动化运维方案,制定管理策略。
3、日常运营过程中的故障处理、优化,保障服务质量。
4、负责运维团队的管理,制定团队工作目标,培养运维人才。
1、本科学历以上, 5年以上运维经验,至少3年以上互联网、电商系统运维工作经验。
2、具有丰富的系统管理、故障处理与性能调优经验。
3、熟练掌握MySQL、Nginx、JDK、Kafka等常用软件的安装、配置和使用,熟悉sql语言,精通Shell/Python/Ruby/Perl等至少一门脚本语言。
4、熟悉网络、应用、DB安全及容灾、业务可持续性方案、故障及应急响应处理。
5、精通Linux操作系统以及服务器群的网络搭建、设置和维护、网络的安全监控、系统性能管理和调试、网络性能管理。
6、具有参与设计/审核/优化各应用系统的体系架构经验,具有设计/实施系统的安全/分布架构/集成的经验。
7、有ITIL认证,或有ITIL体系实践经验,有体系化思维能力。
8、有AWS、Azure等云服务的系统稳定性保障经验。
9、有项目管理经验优先。
10、有良好的沟通与团队合作精神,具备很强的问题分析和解决能力,能适应较大的工作压力。
base 杭州 对标P7-P8 联系微信:chocoolate99 (注明stanley推荐加持)