部署DeepSeek模型,进群交流最in玩法!
立即加群
发布
社区首页 >专栏 >T市YD智能运维模型一体化应用实战“术”分享-类似Deepseek一样加上Agent的翅膀

T市YD智能运维模型一体化应用实战“术”分享-类似Deepseek一样加上Agent的翅膀

原创
作者头像
爱艺江河科技
发布2025-02-09 23:53:51
发布2025-02-09 23:53:51
1080
举报

众所周知,模型为了追求召回率和求全率,必须设计得非常专业,意味着它只会一门知识,虽然非常精通,但如果这门知识没有足够的语料来训练它,它的智力水平跟幼儿园没有区别。

在YD智能运维模型设计之初,MaaS层能力非常单一,几乎没有任何AI能力,只有一个运维模型,还是在缺少训练语料的阶段。它不像R1,673B的参数量,足够把DS训练成高中智力水平,智能运维模型参数量不超过8B,同时预训练时间也才2个月。

在智能运维模型运行时候,它缺少其他各种能力,比如爬虫能力和多模态语义识别能力,在MaaS层后来开发了互联网爬虫模型和LLM,在模型层上这些都是原子能力。在之前的讨论中,我们曾经把基础模型能力称之为原子能力,但是智能运维模型并不是从LLM发展而来,因此它不具备LLM原子能力,需要调用LLM原子能力。智能运维模型本身类似R1,也就是一个基础模型。

当时我们为了给他更好的继承其他原子能力,设计了Agent模式,给它配置了Agent,作为中间层负责调度其他模型原子能力,形成能力集合统一供用户使用。

在Agent这双翅膀的辅助下,智能运维模型添加了很多能力,也使得它能获取互联网外界的知识,尤其是训练智能运维模型时候,对天气权重的测试,有了外界知识后,模型不断加大天气权重,从而使得智能运维模型排班计划时,对于不同天气安排的路线有了更科学的计算,避免了天气恶劣到不了站点的问题发生。

欢迎点赞和关注公众号“科技江河”,如果喜欢,打赏下呗,感谢

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档