首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

智工动态|国产多模态大模型智工迎来重磅推新,可媲美谷歌Gemini

2023年12月11日,国产多模态大模型智工迎来重磅推新。

中工互联(北京)科技集团有限公司创始人、董事长智振表示:此次更新,智工·工业大模型不仅在模型深度训练上进入了新的阶段,还在多模态融合上进行了一系列引领式的创新。

智工·工业大模型迎来重磅更新

2023年,我国在人工智能领域取得了令人瞩目的成就,尤其是在大模型行业应用领域。随着大数据和计算能力的不断提升,多模态智能成为了人工智能领域的热点之一。毕马威、中关村产业研究院共同发布的《人工智能全域变革图景展望:跃迁点来临(2023)》报告中指出,多模态预训练大模型将逐渐成为人工智能产业标配。这一次,中国人工智能创新领域再次传来了振奋人心的消息。

国产多模态大模型智工被寄予了与谷歌Gemini一较高下的期望。

智工·工业大模型VS Bard(谷歌Gemini)

智工多模态大模型表现如何?通过三个问题,智工·工业大模型和Bard(谷歌Gemini)展开了比拼。

问题01:蓝球和橙色球哪个球更大?

蓝球和橙色球哪个球更大?

智工·工业大模型回答:在这个场景中,一个较大的球(蓝色)与一个较小的球(橙色)相互比较。蓝色球比橙色球大,因此蓝色球是更大的球。

智工回答1号问题

Bard(谷歌Gemini)回答:从图像中可以明显看出,橙色篮球比蓝色篮球更大。橙色篮球的直径约为8英寸,而蓝色篮球的直径约为6英寸。这意味着橙色篮球的体积约为蓝色篮球的1.7倍。

Bard(谷歌Gemini)的答案有待商榷。

谷歌Gemini回答01号问题

问题02:在地图上,飞机模型压在了哪个国家上面?

飞机模型压在了哪个国家上面?

智工·工业大模型回答:在这幅世界地图中,飞机模型压在了美国上面。

智工回答02号问题

Bard(谷歌Gemini)回答:从图片中可以看到,飞机模型的尾翼正好位于美国西海岸。因此,可以推断飞机模型压在了美国上面。

谷歌Gemini回答02号问题

问题03:在这个场景下发生了什么?我们应该做些什么?

在这个场景下发生了什么?

智工·工业大模型回答:在这个场景中,一个大火焰在黑暗中燃烧着,形成了一个巨大的火焰。如果火灾是由人为引起的,我们应该立即通知当地消防部门,以便他们能够快速响应并防止火灾扩散。如果火灾是自然的,我们应该立即离开火场并寻求帮助,以避免受到伤害或死亡。无论是哪种情况,我们都应该保持冷静,遵循当地的安全规定,并尽快向当地消防部门或其他相关机构寻求帮助。

智工回答03号问题

Bard(谷歌Gemini)回答:图片显示了一场火灾。火焰从黑暗中燃烧起来,看起来非常危险。根据图片的背景和标题,这场火灾可能是野火或火灾。如果这场火灾是野火,我们应该立即报警。野火非常危险,可能造成生命财产损失。如果这场火灾是火灾,我们应该立即采取措施灭火。火灾可能会造成严重的损失,甚至危及生命。如果您看到这场火灾,您应该立即拨打当地消防部门的电话。

谷歌Gemini回答03号问题

实测发现,智工·工业大模型的表现与谷歌Gemini相比难分轩轾。

更强大的全能型“数字工人”

国产多模态大模型的崭露头角,成为业界和学术界关注的焦点。

第一,智工·工业大模型在多模态融合方面进行了深入研究。通过有效地融合图像、文本和语音等多种数据类型,使得模型能够更全面地理解和处理信息。这种融合不仅提升了模型的综合智能水平,还为智工·工业大模型在工业领域的应用提供了更加强大的支持。智工·工业大模型将更好地适应不同工业场景和企业个性化的需求,成为全能型的“数字工人”。

第二,多模态大模型智工在模型预训练方面进行了精心设计。借助大规模的数据集和先进的训练技术,智工·工业大模型在模型参数数量和训练效果上都取得了显著的突破。这使得智工·工业大模型在处理复杂工业任务时表现出色,同时也为其在多领域应用中展现出了强大的通用性。

第三,在性能上,智工·工业大模型的表现也让人眼前一亮。从自然图像到工业语言推理上,多模态大模型智工都堪称当前最先进的工业领域大模型产品。

众议智工多模态大模型

智工·工业大模型研发总监鲁曼女士透露,在世界范围内,美国、中国、欧洲等是多模态大模型研究和应用的领先者。中工互联在多模态大模型的研究上布局较早,在文本、图像、视频、音频、工业代码等多个任务上开展了多模态大模型的研究。智工在多模态领域新的突破,对于提升产品在工业领域中的应用至关重要。

智工·工业大模型研发总监鲁曼

在研发过程中,智工·工业大模型注重对于工业领域复杂、专业化语义的理解和上下文推理能力的培养。通过引入“增量预训练+知识编辑+向量数据库”学习方法,智工大模型在和利时领域问答、ST代码知识等方面的问答准确度,实现了对ChatGPT的超越。中工互联进行的Agent模式的研发,也处于行业领先地位。

中工互联首席科学家、复旦大学自然语言实验室教授张奇教授表示:多模态大模型可以用于回答包含图像、音频、视频等信息的开放式问题。面向未来,国产多模态大模型智工的应用领域非常广泛,可以在工业视觉质检、产品设计、实验模拟、设备故障预警等场景下一展所长,赋能工业企业。

中工互联创始人、董事长智振表示:随着智工多模态大模型的推出,国产大模型在世界人工智能领域内的领先地位将进一步巩固,中国将拥有真正服务于高端智能制造的大模型产品。智工不仅代表了我国在大模型和多模态智能领域的技术实力,更为我国在人工智能创新和发展方面注入了新的活力。国产多模态大模型智工将为“工业互联网+大模型”领域带来新的发展契机,成为国产智能科技的亮丽名片,为新型工业化充分赋能。

中工互联创始人、董事长智振

未来应用前景

作为工业领域更强大的多模态大模型,智工·工业大模型将工业企业提高生产效率、降低成本、提升产品质量,实现智能化转型。

在生产制造领域,智工多模态大模型可以提高生产制造的效率和准确性,可以用于工业视觉检测,识别生产线上的产品是否存在缺陷;可用于工业机器人控制,提高机器人的操作精度和灵活性。

智工具身智能工厂演示系统

在工业研发设计领域,智工多模态大模型可以辅助产品研发和设计,可以用于分析产品的性能数据、识别产品设计图纸缺陷,进行产品的优化设计。

此外,在工业经营管理、供应链管理方面,智工多模态大模型也将发挥重要的作用。随着智工多模态大模型技术的不断发展,这些潜在的应用场景将逐步实现。在人工智能时代,传统工业企业将迎来新的范式革命。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OFmY-1ke9CVAawH8dOmanr0w0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券