众所周知,模型为了追求召回率和求全率,必须设计得非常专业,意味着它只会一门知识,虽然非常精通,但如果这门知识没有足够的语料来训练它,它的智力水平跟幼儿园没有区别。
在YD智能运维模型设计之初,MaaS层能力非常单一,几乎没有任何AI能力,只有一个运维模型,还是在缺少训练语料的阶段。它不像R1,673B的参数量,足够把DS训练成高中智力水平,智能运维模型参数量不超过8B,同时预训练时间也才2个月。
在智能运维模型运行时候,它缺少其他各种能力,比如爬虫能力和多模态语义识别能力,在MaaS层后来开发了互联网爬虫模型和LLM,在模型层上这些都是原子能力。在之前的讨论中,我们曾经把基础模型能力称之为原子能力,但是智能运维模型并不是从LLM发展而来,因此它不具备LLM原子能力,需要调用LLM原子能力。智能运维模型本身类似R1,也就是一个基础模型。
当时我们为了给他更好的继承其他原子能力,设计了Agent模式,给它配置了Agent,作为中间层负责调度其他模型原子能力,形成能力集合统一供用户使用。
在Agent这双翅膀的辅助下,智能运维模型添加了很多能力,也使得它能获取互联网外界的知识,尤其是训练智能运维模型时候,对天气权重的测试,有了外界知识后,模型不断加大天气权重,从而使得智能运维模型排班计划时,对于不同天气安排的路线有了更科学的计算,避免了天气恶劣到不了站点的问题发生。
欢迎点赞和关注公众号“科技江河”,如果喜欢,打赏下呗,感谢
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。