前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >豆包模型能力大幅提升,中国版Vision Pro正式发布!今年大模型市场份额第一还会是百度吗?|AI日报

豆包模型能力大幅提升,中国版Vision Pro正式发布!今年大模型市场份额第一还会是百度吗?|AI日报

原创
作者头像
机器智能社区
发布2024-08-23 10:32:20
460
发布2024-08-23 10:32:20
举报
文章被收录于专栏:社区动态

文章推荐

上线一天销售额超15亿!《黑神话:悟空》火爆全网的技术秘诀!

昆仑万维推出全球首款AI短剧平台SkyReels!中国首个接入大模型Linux开源操作系统正式发布!|AI日报

今日热点

IDC首次发布大模型平台及应用市场份额报告,百度、商汤、智谱排名前三

国际数据公司(IDC)于8月21日首次发布了《中国大模型平台市场份额,2023:大模型元年 —— 初局》。

数据显示,2023年中国大模型平台及相关应用市场规模达17.65亿元人民币。

报告中2023年中国大模型平台及应用市场份额如下:

  • 受益于多年来在AI领域的大力投入以及大模型的早期投入,百度智能云在2023年大模型市场规模达3.5亿元人民币,位居市场第一,市场份额达19.9%;
  • 商汤科技也受益于其对大模型的专注投入,以及其所建设的上海AIDC能够为客户提供一体化的大模型计算与应用解决方案,位居市场第二,市场份额达16.0%;
  • 智谱AI则是2023年初创企业中的胜出者,位居市场第三;

报告还提到,大语言基础模型的创新已经接近收敛阶段,而多模态大模型、视频大模型应用场景更为广泛但技术尚不成熟,市场需要该类产品。

https://www.ithome.com/0/790/060.htm

豆包大模型综合能力提升20.3%,火山引擎成立零售大模型生态联盟

8月21日,2024火山引擎AI创新巡展在上海举办,展会中展示了如下内容:

豆包大模型综合能力提升20.3%

豆包大模型公开及内部测评集显示,最新版豆包大语言模型相比发布初期综合能力提升了20.3%。其中,角色扮演能力提升了38.3%,具备了更强的上下文感知,让对话情境更连贯、角色更拟人化。

语言理解能力提升了33.3%,让豆包大模型在信息分类、抽取、摘要、理解和问答等NLP方面都有了显著提升,能够在更多生产力场景中得到应用。

此外,模型在长文任务、数学、专业知识、代码能力上也有不同程度的增强。

火山引擎携手多点DMALL成立零售大模型生态联盟

大模型应用落地不仅需要技术成熟度,还要有适配的商业组织和商业生态。为此,火山引擎携手多点DMALL成立零售大模型生态联盟。

通过融合豆包大模型与AI能力,让零售企业能够以极低的试错成本将大模型技术应用到业务场景中,推动零售行业的智能化升级,提升行业的整体效能和创新能力,以适应不断变化的市场需求和消费者行为,加速零售行业的创新步伐。

全栈AI服务升级

火山引擎智能算法负责人、火山方舟负责人吴迪介绍,一站式大模型服务平台火山方舟最新推出全周期安全可信方案,支持身份认证、数据保密、环境隔离等,构建大模型安全“堡垒”。

联网、内容插件能力再升级,提升搜索能力、可获取更多优质内容,RAG知识库插件进一步强化,更强知识库文档解析与检索能力,支持丰富场景,令企业应用更为灵活自如。

https://mp.weixin.qq.com/s/nzNkPQqSTSA07OVytSOs7w

“中国版Vision Pro”:PICO推出首款MR混合现实一体机PICO 4 Ultra

近日,字节跳动旗下XR平台PICO推出首款MR混合现实一体机PICO 4 Ultra,硬件上搭载全新高通骁龙XR2 Gen2计算平台,拥有12GB超大内存,GPU性能相比前代XR1提升2.5倍,AI性能比XR1提升8倍。

PICO 4 Ultra还配备双目3200万像素彩色透视摄像头和iToF深度感知摄像头,支持MR并且系统层面引入全景屏工作台,以及支持体感追踪器。

全新PICO 4 Ultra支持MR观影、裸手手势、空间视频等功能。目前,PICO生态拥有MR应用已经超过50款,VR 游戏超过600款,非游戏 VR 应用超过300款。

接下来,PICO还与佳能共同推出空间视频创作者计划,并将利用MR 互动剧《达芬奇:狂想之翼》、三体游戏“远征”,提升PICO的生态内容质量和产品体验。

https://www.tmtpost.com/7217755.html

视频帧数扩展到1024,准确率99.5%。英伟达LongVILA:为长视频扩展长上下文视觉语言模型

长上下文能对于长视频理解至关重要,因此通过设计算法和系统推出 LongVILA,这是一种用于长上下文视觉语言模型的全栈解决方案。

对于模型训练,通过合并两个额外阶段(即长上下文扩展和长监督微调)升级现有的VLM以支持长视频理解。

然而,长视频训练需要大量计算和内存。因此引入了长上下文多模态序列并行 (MM-SP) 系统,该系统可有效并行化长视频训练和推理,在256个GPU上实现 2M上下文长度训练,而无需任何梯度检查点。

LongVILA有效地将VILA的视频帧数从8扩展到1024,将长视频字幕得分从2.00提高到3.26(满分5),在1400帧(274k 上下文长度)视频中实现99.5%的准确率。

https://www.arxiv.org/abs/2408.10188

深度伪造拜登音频的电信公司将向联邦通信委员会支付100万美元民事罚款

今年早些时候,新罕布什尔州的选民收到了由人工智能生成的拜登总统的虚假音频。

美国联邦通信委员会迅速反击,认定作案者是总部位于德克萨斯州的 Life Corporation,该公司多年来一直在实施类似的诈骗,并对其及其相关个人处以600万美元罚款。

但诈骗者还寻求了一家曾涉嫌不正当行为的电信公司的帮助。现在,Lingo Telecom将支付100万美元的民事罚款。

Lingo等电信公司不应该通过向已知的不良运营商提供服务来助长诈骗行为。联邦通信委员会主席Jessica Rosenworcel表示:“通信服务提供商是抵御这些威胁的第一道防线,他们必须被追究责任。”

https://techcrunch.com/2024/08/

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章推荐
  • 今日热点
    • IDC首次发布大模型平台及应用市场份额报告,百度、商汤、智谱排名前三
      • 豆包大模型综合能力提升20.3%,火山引擎成立零售大模型生态联盟
        • “中国版Vision Pro”:PICO推出首款MR混合现实一体机PICO 4 Ultra
          • 视频帧数扩展到1024,准确率99.5%。英伟达LongVILA:为长视频扩展长上下文视觉语言模型
            • 深度伪造拜登音频的电信公司将向联邦通信委员会支付100万美元民事罚款
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档