T厂职责部门按各种YD运维专业分为维保、管理服务......这样划分可以跟运营商的部门分工能对齐,每个部门的方向是比较明确。而对于T厂而言,除了日常运维任务外,还担负着科技创新的职责,因此设立了智能运维部,负责运营商运维专业的技术产品自产创新。
针对YD的运维创新,主要面向智能化方向,而智能化发力点主要集中在算法软件上。如何减少运维成本?如何提高运维故障排查准确率?这两个问题是YD运维专业的头号问题。
当时T厂已经部署了公有云,在公有云上要设计一层MaaS层,这层全部是模型,“模型即服务”。对于运维只有普通的excel表格来计算日常运维成本和记录流水账。这个excel表里数据非常丰富,运维需要每天执行任务包括日常固定路线设备巡检、定点安排运维人力,这种人线匹配必须准确,否则会造成成本浪费,同时造成巡检目标未达成。
把每条路线和人力资源首先导入数据库,做成数据集后,就可以用写好的算法首先模拟预训练一次。得出一个初步的巡检人力排班表后,人为检查一次。这是初检,这个预训练的准确率并不高,只是把常见明显的问题排除了,但出现了一条线上同时安排两个人的新问题。
这是过拟合了,这个排班表作为SFT数据进行人为干预,修正后再次输入模型进行微调,这次把过拟合的场景找出来,减少一个人力投入,相当于削去过拟合的波峰,留下1个人力并且让他完成巡检任务才能退出。这是防止欠拟合。
经过这样的类似Deepseek的SFT数据微调使用,智能运维模型的结果准确率提升了。
欢迎点赞和关注公众号“科技江河”,如果喜欢,打赏下呗,感谢。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。