前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2023国家网络安全周|腾讯吴运声:AIGC浪潮下,大模型应用的机遇与挑战

2023国家网络安全周|腾讯吴运声:AIGC浪潮下,大模型应用的机遇与挑战

作者头像
小腾资讯君
发布2023-09-27 17:44:30
2960
发布2023-09-27 17:44:30
举报
文章被收录于专栏:资讯分享资讯分享

9月11日,由中央宣传部、中央网信办、教育部、工业和信息化部、公安部、中国人民银行、国家广播电视总局、全国总工会、共青团中央、全国妇联等十部门联合举办的2023国家网络安全宣传周在福建省福州市开幕。今年的网络安全宣传周继续以“网络安全为人民,网络安全靠人民”为主题,全面营造全社会共筑网络安全防线的浓厚氛围。

在当天的主论坛活动上,腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声发表主题演讲,分享了在 AIGC浪潮下,大模型应用的机遇与挑战。他表示,国内大模型“百花齐放”,AI 的奇点时刻已然到来。但大模型的部署和应用面临众多挑战,企业自行构建专属模型是不现实的。最近,腾讯正式公布了自研的腾讯混元通用大模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力,可助力企业构建专属模型,实现真正的“人机协同”。

图片
图片

以下为演讲全文:

尊敬的各位嘉宾、专家、观众,大家好!我是来自腾讯的吴运声。

当 ChatGPT 在去年年底发布面世的时候,没有人会意识到,新一代人工智能浪潮将在接下来的这段时间里给人类社会带来一场眩晕式的变革。从某种程度上说,随着这一轮 AI 的爆发,所有人都回到了同一个起跑线上。无论你是一个普通的劳动者或创作者,还是一家企业的管理者或决策者,把握对 AI 的认知及对趋势的判断都成为了一张通向未来的船票。

今天,我也想跟在座的各位专家老师们一起分享下我们对人工智能的一些实践和看法。

ChatGPT 最初以聊天机器人的形式出现,但很快我们发现LLM的能力远不止如此。创作诗歌、小说、剧本甚至商业报告只是它的基础技能,阅读、分析、总结与翻译也都不在话下。

我们发现,AI大模型呈现出涌现的特征,正在向 AGI(通用人工智能)快速进化的趋势。自2010年代初深度学习问世以来,人工智能进入到第三次高潮。而2017年Transformer算法将深度学习推向了大模型时代。OpenAI基于Transformer的Decoder部分建立起来了GPT家族。ChatGPT一经面世便风靡全球,人们惊讶于其能够进行连贯、有深度对话的同时,也惊异地发现了它涌现了推理、思维链等体现智能的能力。

大模型正在向多模态的方向进化。多模态AI是指能够处理和理解多种类型信息的人工智能,如文本、图像、音频、视频等。这种AI不仅能够处理单一数据类型的任务,而且可以在不同数据类型间建立联系和融合,从而实现一个综合、全面的理解。AI能够对各种不同类型的数据进行关联分析,为解决复杂问题提供支持。未来,在诸多领域,多模态技术的发展将带来创新应用的蓝海。

传统的AI,是一种判别式智能,举个例子,我们给AI一个任务,例如识别某种病体,然后用很多医生标注的片子训练机器以获得模型,这个模型就是人工智能的模型。我们给它的任务是识别这种病体,所以这个模型只有这唯一的作用。传统的AI泛化能力较差,只会完成单一的任务。

新的通用人工智能,是以现在的生成式人工智能为代表,对应的模型叫预训练大模型。预训练大模型是先让机器学习海量知识,后布置下游任务,然后做少量的微调,甚至不去微调,即可做出比较理想的结果。现在以大模型为代表的生成式AI具有泛化性和一定的通用性,已经迈进了通用AI的门槛;我们认为AI的奇点时刻已然到来,并且这股浪潮会持续不断去帮助各行各业去实现更多的创新可能性。

但是大模型这个东西,它和我们以往的IT技术领域的很多东西不一样。大模型是技术密集和资源密集型的,既需要懂专业技术的人才,还需要海量的计算资源。中间还涉及很多很复杂的事情。训练一个大语言模型,会发生很多大家想得到和想不到的事情,数据怎么来,数据是否合法合规,训练出来的模型还要调整,训练以后还要测,模型是不是符合监管的要求。会有一系列的问题。大模型虽然好,我们如果想获得一个行业的专属模型,由每个企业自己做是不太现实的。所以很多的公司也在这方面做努力。

当前,国内大模型发展可谓是“百花齐放”,据不完全统计,参数在10亿规模以上的大模型就超过70个;经过过去一段时间的发展,企业在大模型方向的探索已经度过了“尝鲜期”,“产业落地”成为评估大模型价值的重要标准。最近,我们也正式公布了自研的腾讯混元通用大模型,为我们行业大模型服务提供坚实的底座能力。它是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。

而随着大模型在金融、零售、文旅、政务、出行等各个领域的深度应用,其“提质增效”的效果已逐步显现,大模型的应用场景也涵盖了对话类客服、营销内容创造、跨模态检索、风控等企业核心生产和经营环节,表现出更强的能力、更高的效率、更广的场景、更深的应用。一场由“大模型”驱动的效能革命正在发生。比如,通过大量的专业知识学习、加上强大的推理能力,构建的专属行业大模型,在特定领域的表现力及适应性更强。

依托腾讯云多年深耕产业互联网的经验,我们从产业客户需求场景出发,基于自研腾讯混元大模型,同时支持业内主流开源模型应用,从技术底座、平台能力、智能应用三个维度持续升级MaaS能力,助力客户构建专属大模型及智能应用,加速模型产业落地。

腾讯在AI技术领域有长期投入和积累。过去我们非常多的AI能力,都是率先在内部产品中应用,这是腾讯AI的文化与内生动能。今天,我们的大模型能力,也正在重塑腾讯云广泛的PaaS、SaaS产品。这些探索实践,也进一步验证了我们MaaS能力的可用性、易用性。

在文旅领域,我们联合一家线上旅游 OTA 公司,共同探索了文旅行业大模型的应用。其传统智能客服需要人工进行对话配置,且知识维护量大、耗时长,但运营人力有限、人力配置成本高,且涉及订单等复杂业务场景,在无配置的情况下无法通过机器人闭环解决问题。精调后的客户专属模型,无需配置对话流程,即可实现端到端解决业务问题。提升任务完成率,降低对话构建成本。

我们的一个客户,是家科技公司,如果自行搭建大规模建模平台,需要投入大量人力、物力、资源,同时需要关注底层算力、存储问题。而客户的算法团队精力有限、模型迭代节奏快。此外,基于 TB 级数据进行多机多卡训练,算力资源也有限,训练速度也有瓶颈。

我们为客户提升了在自动驾驶领领域的,2D 感知、3D 感知类建模任务的训练性能,实现轻量化运维和接入。在训练性能方面,提供高性能算力集群及训练加速能力,训练性能提升 40%;并打通高性能分布式文件存储和高性能计算节点,让客户的算法人员能够一键提交训练任务的同时,提供自动任务调度及资源隔离机制,大幅提升算力资源利用率。

某税务部门的传统智能客服,受制于知识边界,遇到不在知识库的问题,客服常常无法答复或答非所问,问题拦截率、覆盖率低,亟需扩展客服的问答边界。此外,政策法规、办事指南持续迭代,需不断投入人力梳理,造成效率低下等问题。

我们帮助客户打造了专属政务大模型,做“税务领域的知识专家”和“紧跟法规、指南的税务助手”。从知识采集到知识运营实现智能化升级,大大扩展税务领域的知识边界,领域内的问题答有所依。同时提供动态 batch 和自动服务调度机制,大幅提高服务吞吐量,并在模型优化和部署模块,一键加速和发布模型,支持模型推理加速的过程中动态加载不同的 LoRA 模型。

刚刚提到很多产业界的例子,但是在实际的社会应用里面,我相信目前,很多人还没有使用过大模型,未来可能也是这样。之前,我们把类似的现象称为“信息鸿沟”,那么未来,“智能鸿沟”是否会出现?我们如何通过更普适的方式让更多的人提升去接轨AI时代?我们如何以浅显易懂的方式介绍大模型,并教大众去使用?

这里,我相信重点围绕在于,如何做到真正意义上的人机协同?我认为,人类与AI互动需要“两心两力”。第一是好奇心。好奇心非常重要,我们的知识和认知的边界就是每个人世界的边界,所以人需要好奇心,不断地去扩展和探索世界的边界。第二是同理心。尤其在行业服务领域,同理心的重要性不言而喻。第三个是表达力。与大模型交互,考验的是个人的表达能力,优秀的表达力能更有效地挖掘大模型的智能。最后,也是最重要的,是判断力。在大规模提供的众多答案里,我们需要有自己的判断,挑选最佳答案。

总而言之,人工智能的发展需要以人为本,做到科技向善,更好地为人类服务,这是技术发展的初衷和未来努力的方向。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对话机器人
对话机器人(Conversation Robot,ICR),是基于人工智能技术,面向企业场景的 AI 服务,可应用于智能客服、服务咨询、业务办理等场景。本产品旨在帮助企业快速构建,满足自身业务诉求的对话机器人,从而减少企业人力成本或解决服务不及时问题。用户可通过对话机器人用户端引擎,实现高准确率的对话服务。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档