机器之心-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

机器之心

专栏成员

9145

文章

6879814

阅读量

281

订阅数

中国AGI能否重演移动互联网的故事？

数据企业工作互联网模型

6 月中旬，微软发布了一个出人意料的消息，他们将于 7 月份停止其推出仅三个月的 Copilot GPTs 服务。

2024-06-28

1360

国产大模型新高度！讯飞星火4.0发布：整体超越GPT-4 Turbo，8个国际权威测试集测评第一

语音医疗 gpt 测试模型

6月27日，科大讯飞正式对外发布讯飞星火大模型V4.0，以及在医疗、教育、商业等多个领域的人工智能应用。

2024-06-28

3120

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

视频通信分布式测试模型

本周三，新加坡国立大学尤洋团队提出了业内第一种可以实时输出的，基于 DiT 的视频生成方法。

2024-06-28

1920

ICML 2024 | 揭示非线形Transformer在上下文学习中学习和泛化的机制

模型数据测试工作论文

本文作者李宏康，美国伦斯勒理工大学电气、计算机与系统工程系在读博士生，本科毕业于中国科学技术大学。研究方向包括深度学习理论，大语言模型理论，统计机器学习等等。目前已在 ICLR/ICML/Neurips 等 AI 顶会发表多篇论文。

2024-06-28

2080

将图像自动文本化，图像描述质量更高、更准确了

it 框架论文模型数据

张鉴殊：武汉大学本科三年级学生，目前在张潼教授的指导下担任研究实习生，主要研究方向是大语言模型，多模态大语言模型以及持续学习。当下在寻找 2025 fall 博士入学机会。

2024-06-28

3260

史上最快AI芯片「Sohu」，速度10倍于B200，哈佛辍学生打造

服务器模型内存芯片性能

今天凌晨，科技圈迎来了一个重要新闻。美国芯片创业公司 Etched 推出了自己的第一块 AI 芯片 Sohu，它运行大模型的速度比英伟达 H100 要快 20 倍，比今年 3 月才推出的顶配芯片 B200 也要快上超过 10 倍。

2024-06-27

1720

ICML 2024 | 信号表征指数级强、内存节省超35%，量子隐式表征网络来了

神经网络模型内存数据网络

本文作者是天津大学智能与计算学部张鹏教授及其硕士生赵佳铭，博士生乔文博、高珲。该项研究工作受到国家自然科学基金委、天津大学 - 中科闻歌联合实验室资助。

2024-06-27

980

昆仑万维携手南洋理工大学抢发Q*算法：百倍提升7B模型推理能力

论文模型数据算法开源

自 OpenAI 的 Q* 项目曝光后，引发业内众多讨论。据现有信息汇总，Q* 项目被视作 OpenAI 在探索人工通用智能（Artificial General Intelligence, AGI）道路上的一次重大尝试，有望在包括数学问题解决能力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。

2024-06-27

1240

太全了！苹果上新视觉模型4M-21，搞定21种模态

模型苹果数据性能论文

当前的多模态和多任务基础模型，如 4M 或 UnifiedIO，显示出有希望的结果。然而，它们接受不同输入和执行不同任务的开箱即用能力，受到它们接受训练的模态和任务的数量（通常很少）的限制。

2024-06-27

1090

跟骑手学习送外卖，这家具身智能公司的机器人已经上岗挣钱了

机器人产品数据系统自动驾驶

在深圳、上海等一线城市，让无人机给自己送个外卖已经不是什么新鲜事。但它送的方式可能和你想的不太一样。

2024-06-27

1180

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonnet vs. GPT-4o？

gpt 测试模型数学性能

上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。‍

2024-06-27

1860

为什么都放弃了LangChain？

设计测试工具框架日志

看好 LangChain 的人欣赏它丰富的工具和组建和易于集成等特点，不看好 LangChain 的人，认为它注定失败 —— 在这个技术变化如此之快的年代，用 LangChain 来构建一切根本行不通。

2024-06-27

2070

导师爆料：这篇CVPR最佳学生论文，从想法到成稿只用一个月，源自业余灵感

论文模型渲染工作解决方案

北京时间 6 月 20 日凌晨，CVPR 2024 正式公布了最佳论文、最佳学生论文等奖项。其中，获得最佳论文的有两篇文章 ——BioCLIP 和 Mip-Splatting。

2024-06-27

1210

华为盘古大模型5.0技术解密：更多模态，复杂推理

模型数据通信华为集群

该大模型体系分为 10 亿级参数的 Pangu E 端侧模型，百亿级参数的 Pangu P，千亿级的 Pangu U，以及万亿级的 Pangu S 版本，在全系列、多模态、强思维三个方面实现了升级。

2024-06-27

2560

不做数值运算、纯靠嘴炮也能机器学习？基于自然语言的全新ML范式来了

数据优化机器学习函数模型

本文作者肖镇中是德国马克思普朗克-智能系统研究所和图宾根大学的博士生，Robert Bamler 是图宾根大学机器学习方向的教授，Bernhard Schölkopf 是马克思普朗克-智能系统研究所的所长，刘威杨是马普所剑桥大学联合项目的研究员。

2024-06-27

980

无论真实还是AI视频，「摩斯卡」都能重建恢复4D动态可渲染场景

论文模型视频优化渲染

雷嘉晖，美国宾夕法尼亚大学计算机系博士生 (2020 - 今), 导师为 Kostas Daniilidis 教授，目前主要研究方向为四维动态场景几何的建模表示和算法以及应用。他在计算机视觉和机器学习顶会 (CVPR、NeurIPS、ICML、ECCV) 以第一或共一作者身份发表文章 7 篇。此前他本科 (2016-2020) 以专业第一名的成绩毕业于浙江大学控制系，竺可桢学院混合班。

2024-06-27

1000

超越CVPR 2024方法，DynRefer在区域级多模态识别任务上，多项SOTA

数据系统性能编码模型

为了实现高精度的区域级多模态理解，本文提出了一种动态分辨率方案来模拟人类视觉认知系统。

2024-06-27

870

从高考到奥林匹克竞技场：大模型与人类智能的终极较量

数据数学人工智能测试模型

上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。团队主页：https://plms.ai/

2024-06-27

950

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推理和操作

效率机器人工作模型数据

本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台，长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航，北京大学计算机学院研究员、博士生导师、博雅青年学者。从事多模态大模型与具身智能研究，取得了一系列重要研究成果，在人工智能顶级期刊和会议上发表论文 80 余篇，谷歌引用 9700 余次。荣获世界人工智能顶会 AAAI 最佳论文奖，位列世界最大学术源代码仓库 Trending Research 第一位。

2024-06-27

2410

ShareGPT4V作者团队又一力作！百万高质量视频-字幕数据助力社区提升多模态大模型视频理解及生成能力

视频理解模型视频数据性能

继Sora官宣之后，多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来，LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力，文生视频、图生视频的新前沿不断被扩展令大家惊喜不已，抱有期待。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

2024-06-27

1240

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态