腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

机器之心

专栏作者

8914

文章

6244103

阅读量

277

订阅数

除了唱歌，AI还能替你演出？又一AI公司将虚拟人推到新高度

人工智能工具模型苹果视频

用 Suno 十秒写歌，是不是已经很震撼？现在不仅如此，用最新的 AI 工具，我们还可以快速生成歌手唱歌 MV。

2024-04-14

1110

马斯克的首款多模态大模型来了，GPT-4V又被超越了一次

数据图表 gpt 测试模型

自从 2023 年 11 月 Grok 首次亮相以来，马斯克的 xAI 正在大模型领域不断取得进步，向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月，xAI 的首个多模态模型就问世了。

2024-04-14

1120

曾爆火的 InstantID又有了新玩法：风格化图像生成，已开源

论文模型网络开源迁移

风格化图像生成，也常称为风格迁移，其目标是生成与参考图像风格一致的图像。此前基于 diffusion 的方法（比如 LoRA）通常需要批量的同风格数据进行训练，无法迁移到新的风格中，或者基于 inversion（如 StyleAlign），通过将风格图像还原到 latent noise 后，将其前向传播得到的 K、V 用于替换风格图像生成中的 K、V，但这类方法往往由于 inversion 的操作，造成风格退化。

2024-04-14

1050

GPT超越扩散、视觉生成Scaling Law时刻！北大&字节提出VAR范式

gpt scaling var 测试模型

新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了！使 GPT 风格的自回归模型在图像生成首次超越扩散模型，并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task Generalization 泛化能力：

2024-04-13

1030

全球AI顶会NeurlPS开始收高中生论文了

机器学习人工智能论文模型数学

本周五，顶级学术会议 NeurIPS 开设高中生论文 Track 的消息引爆了人工智能社区。

2024-04-13

1420

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

工作模型数据时序预测编程

最近，来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用，并提出了一个全新的视角：高效重编程大语言模型进行通用时序预测 –- 其提出的 Time-LLM 框架无需修改语言模型即可实现高精度时序预测，在多个数据集和预测任务中超越了传统的时序模型，让 LLMs 在处理跨模态的时间序列数据时展现出色，就像大象起舞一般！

2024-04-13

1130

中文OCR超越GPT-4V，参数量仅2B，面壁小钢炮拿出了第二弹

ocr 模型手机性能 gpt

从 ChatGPT 到 Sora，生成式 AI 技术遵从《苦涩的教训》、Scaling Law 和 Emerging properties 的预言一路走来，让我们已经看到了 AGI 的冰山一角，但技术的发展的方向还不尽于此。

2024-04-13

480

直接扩展到无限长，谷歌Infini-Transformer终结上下文长度之争

存储论文模型内存压缩

谷歌又放大招了，发布下一代 Transformer 模型 Infini-Transformer。

2024-04-13

3040

改变LoRA的初始化方式，北大新方法PiSSA显著提升微调效果

数学 LoRa 架构模型数据

为此，北京大学的研究团队提出了一种名为 PiSSA 的参数高效微调方法，在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。

2024-04-13

540

长文本杀不死RAG：SQL+向量驱动大模型和大数据新范式，MyScale AI数据库正式开源

数据库 sql 开源大数据模型

大模型（LLM）的浪潮已经涌动一年多了，尤其是以 GPT-4、Gemini-1.5、Claude-3 等为代表的模型你方唱罢我登场，成为当之无愧的风口。在 LLM 这条赛道上，有的研究专注于增加模型参数，有的疯狂卷多模态…… 这当中，LLM 处理上下文长度的能力成为了评估模型的一个重要指标，更强的上下文意味着模型拥有更强的检索性能。例如有些模型一口气可以处理高达 100 万 token 的能力让不少研究者开始思考，RAG （Retrieval-Augmented Generation，检索增强生成）方法还有存在的必要吗？

2024-04-12

1980

若通过验证可颠覆美国后量子密码设计，清华陈一镭预印论文破解格密码

工作论文密码学设计量子算法

在计算机领域，解决格上的近似最短向量问题（Approximate Shortest Vector Problems in Lattices。Lattice Problems）以及与之等价的容错学习问题（Learning with Errors，LWE）是经典的算法难题，科学界普遍认为它们超出了传统计算机的能力范围。

2024-04-12

620

Meta宣布全新训推一体加速器：完全集成PyTorch 2，性能3倍提升

meta 模型芯片性能 pytorch

Meta 正在不遗余力地想要在生成式 AI 领域赶上竞争对手，目标是投入数十亿美元用于 AI 研究。这些巨资一部分用于招募 AI 研究员。但更大的一部分用于开发硬件，特别是用于运行和训练 Meta AI 模型的芯片。

2024-04-12

570

XAI有什么用？探索LLM时代利用可解释性的10种策略

LLM 模型设计数据系统

你是否也好奇，在大模型时代，可解释性人工智能技术（XAI）有怎样的使用价值？近日，来自佐治亚大学、新泽西理工学院、弗吉尼亚大学、维克森林大学、和腾讯 AI Lab 的研究者联合发布了解释性技术在大语言模型（LLM）上的可用性综述，提出了「Usable XAI」的概念，并探讨了 10 种在大模型时代提高 XAI 实际应用价值的策略。

2024-04-12

380

7B超越百亿级，北大开源aiXcoder-7B最强代码大模型，企业部署最佳选择

数据企业开源部署模型

当下，大语言模型集成至编程领域、完成代码生成与补全任务成为重要趋势。业界已经出现了一批引人瞩目的代码大模型，比如 OpenAI 的 CodeX、谷歌 DeepMind 的 AlphaCode、HuggingFace 的 StarCoder，帮助程序员更迅捷、更准确、更高质量地完成编码任务，大幅提升效率。

2024-04-12

2480

全面突围，谷歌昨晚更新了一大波大模型产品

企业产品工具模型性能

当地时间本周二，谷歌在 Google’s Cloud Next 2024 上发布了一系列 AI 相关的模型更新和产品，包括 Gemini 1.5 Pro 首次提供了本地音频（语音）理解功能、代码生成新模型 CodeGemma、首款自研 Arm 处理器 Axion 等等。

2024-04-12

580

Llama架构比不上GPT2？神奇token提升10倍记忆？

模型数据存储 token 架构

一个 7B 规模的语言模型 LLM 能存储多少人类知识？如何量化这一数值？训练时间、模型架构的不同将如何影响这一数值？浮点数压缩 quantization、混合专家模型 MoE、以及数据质量的差异 (百科知识 vs 网络垃圾) 又将对 LLM 的知识容量产生何种影响？

2024-04-12

1060

英伟达竞品来了，训练比H100快70%，英特尔发最新AI加速卡

内存芯片性能硬件连接

今天凌晨，英特尔在 Vision 2024 大会上展示了 Gaudi 3，这是其子公司 Habana Labs 的最新一代高性能人工智能加速器。

2024-04-12

780

不牺牲算法，不挑剔芯片，这个来自中科院的团队正在加速国产AI芯片破局

算法芯片编译编译器模型

在《沙丘》构建的未来世界里，「得香料者得天下」。但在生成式 AI 席卷的智能世界里，得 GPU 者得天下。

2024-04-12

940

纯C语言手搓GPT-2，前OpenAI、特斯拉高管新项目火了

数据 gpt openai 模型内存

众所周知，大语言模型还在快速发展，应该有很多可以优化的地方。我用纯 C 语言来写，是不是能优化一大截？

2024-04-12

1680

杨笛一新作：社恐有救了，AI大模型一对一陪聊，帮i人变成e人

系统工具框架论文模型

在人类的社交活动中，为了更有效地在工作和生活中与他人沟通，需要一定的社交技能，比如解决冲突。

2024-04-12

780

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态