DeepHub IMBA

代码在线跑，知识轻松学

Python精品学习库

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

博客搬家 | 分享价值百万资源包

往期视频·干货材料·成员作品 最新动态

技术创作特训营·精选知识专栏

新邀入驻腾讯云开发者社区，福利多多！

如何运用「云、端融合的数智化安全体系」高效护航数据安全

左手AI，右手安全 —— 一汽丰田数字化转型之路

Encoder-decoder 模型在序列到序列的自然语言处理任务（如语言翻译等）中提供了最先进的结果。多步时间序列预测也可以被视为一个 seq2seq 任务，可以使用 encoder-decoder 模型来处理。本文提供了一个用于解决 Kaggle 时间序列预测任务的 encoder-decoder 模型，并介绍了获得前 10% 结果所涉及的步骤。

使用 PyTorch 创建的多步时间序列预测的 Encoder-Decoder 模型

Kolmogorov Arnold Networks (KAN)最近作为MLP的替代而流行起来，KANs使用Kolmogorov-Arnold表示定理的属性，该定理允许神经网络的激活函数在边缘上执行，这使得激活函数“可学习”并改进它们。

图神经网络版本的Kolmogorov Arnold（KAN）代码实现和效果对比

长上下文大型语言模型（LCLLMs）确实引起了一些关注。这类模型可能使某些任务的解决更加高效。例如理论上可以用来对整本书进行总结。有人认为，LCLLMs不需要像RAG这样的外部工具，这有助于优化并避免级联错误。但是也有许多人对此持怀疑态度，并且后来的研究表明，这些模型并没有真正利用长上下文。还有人声称，LCLLMs会产生幻觉错误，而其他研究则表明，较小的模型也能高效解决这些任务。

DeepMind的新论文，长上下文的大语言模型能否取代RAG或者SQL这样的传统技术呢?

腾讯最近推出了一个开源项目，名为MOFA-Video，这是一款具有突破性的视频控制技术，它允许用户通过简单的箭头指示来控制视频中的运动方向。这项技术的推出，不仅表明了腾讯在人工智能领域的持续创新，也预示着视频生产与动画制作将迎来一场革命。

MOFA-Video:可以为图片中的物体添加运动效果，还可以通过简单的箭头指示来控制物体的运动方向

与其他算法相比，高斯过程不那么流行，但是如果你只有少量的数据，那么可以首先高斯过程。在这篇文章中，我将详细介绍高斯过程。并可视化和Python实现来解释高斯过程的数学理论。

深入解析高斯过程：数学理论、重要概念和直观可视化全解

LLM Compiler是一个开源模型，旨在优化代码并彻底改变编译器设计。通过在庞大的语料库上训练，包括5460亿个LLVM-IR和汇编代码标记，Meta的研究团队使模型能够深入理解编译器中间表示、汇编语言和优化技术。这种理解的增强使得LLM Compiler能够执行以前仅限于人类专家或专业工具的任务，如代码大小优化、反汇编等。

Meta发布基于大语言模型的编译器LLM Compiler，不仅可以编译成汇编代码，还可以进行反编译

当Transformer模型发布时，它彻底革新了机器翻译领域。虽然最初是为特定任务设计的，但这种革命性的架构显示出它可以轻松适应不同的任务。随后成为了Transformer一个标准，甚至用于它最初设计之外的数据（如图像和其他序列数据）。

Transformer 能代替图神经网络吗?

近日，谷歌公司发布了其最新的大语言模型Gemma 2，向全球研究人员和开发人员开放。新发布的Gemma 2模型有90亿参数（9B）和270亿参数（27B）两种版本。相比于第一代模型，Gemma 2在推理性能和效率方面有了显著提升，同时在安全性上也取得了重要进展。

谷歌发布新一代大语言模型Gemma 2，重新设计了整体架构有9B和27B两种版本

在本文中，我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略，可以提升生成任务的质量和准确性。通过使用一些优化策略，可以有效提升检索增强生成系统的性能和输出质量，使其在实际应用中能够更好地满足需求。

RAG流程优化（微调）的4个基本策略

纽约大学的谢赛宁教授和Yann LeCun团队最近发布了一种开源的多模态大型语言模型（MLLM），名为“Cambrian-1”。这一研究重点探讨了视觉表征学习对于理解语言的重要性，并提出了一种以视觉为中心的方法来设计多模态模型。该团队全面开源了模型权重、代码、数据集以及详细的指令微调和评估方法，这一举措在学术界和工业界均引起了广泛关注。

Yann LeCun团队发布以视觉为中心方法设计的开源多模态大模型 Cambrian-1

Theta方法整合了两个基本概念:分解时间序列和利用基本预测技术来估计未来的价值。

Theta方法：一种时间序列分解与预测的简化方法

OpenAI即将对不支持地区的API用户进行封禁，从7月9日起生效。这一变化引发了开发者和企业客户的广泛关注，尤其是那些依赖OpenAI API进行应用开发和服务的公司。此次封禁不仅影响到位于服务范围之外的用户，甚至一些位于支持国家的用户也报告说收到了警告邮件。这表明OpenAI在加强其服务的合法性和区域限制。

一个简单的解决办法解决 OpenAI 封锁非支持地区 API 使用

知识图谱（关系网络）可以用简单的形状和线条显示复杂的系统，帮助我们理解数据之间的联系。我们今天将介绍15个很好用的免费工具，可以帮助我们绘制网络图。

精选：15款顶尖Python知识图谱（关系网络）绘制工具，数据分析的强力助手

苹果公司与瑞士洛桑联邦理工学院（EPFL）联手打造了一款前沿的全能视觉模型4M-21，该模型通过跨模态的大规模协同训练，实现了在21种不同模态下的优异表现。4M-21模型的推出，标志着从传统单模态优化模型向多模态综合处理能力的重大转变。

苹果和洛桑联邦理工学院发布全新视觉模型4M-21，单模型可以处理21种模态任务

大语言模型（LLMs）在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文，可以让你及时了解最新进展。

2024年6月上半月30篇大语言模型的论文推荐

在机器学习和数据科学的世界里，数据的质量是建模成功与否的关键所在。这就是特征工程和数据预处理发挥作用的地方。本文总结的这些关键步骤可以显著提高模型的性能，获得更准确的预测，我们将深入研究处理异常值、缺失值、编码、特征缩放和特征提取的各种技术。

特征工程与数据预处理全解析：基础技术和代码示例

Anthropic 最新的 AI 模型，Claude 3.5 Sonnet，已成为业界的热点。这款模型被认为是目前最先进的，超越了市场上所有其他 AI 模型。让我们来详细了解一下。

Claude 3.5 Sonnet 超越 GPT-4o成为最智能的模型，新功能artifacts可以实时查看和迭代生成的代码

6月还有一周就要结束了，我们今天来总结2024年6月上半月发表的最重要的论文，重点介绍了计算机视觉领域的最新研究和进展。

2024年6月计算机视觉论文推荐：扩散模型、视觉语言模型、视频生成等

近日，腾讯的混元文生图大模型宣布全面开源训练代码，并对外发布了混元 DiT LoRA 小规模数据集训练方案与可控制插件ControlNet。这标志着全球的企业与个人开发者、创作者们可以基于混元DiT训练代码进行精调，创建更具个性化的专属模型，进而进行更大自由度的创作；或基于混元DiT的代码进行修改和优化，基于此构建自身应用，推动技术的快速迭代和创新。

免费商用！混元文生图大模型全面开源，不仅包括训练的全部过程和文档，附带的插件还可以使用一张图生成定制的专属的模型

虽然有许多用于目标跟踪的算法，包括较新的基于深度学习的算法，但对于这项任务，粒子滤波仍然是一个有趣的算法。所以在这篇文章中，我们将介绍视频中的目标跟踪：预测下一帧中物体的位置。在粒子滤波以及许多其他经典跟踪算法的情况下，我们根据估计的动态进行预测，然后使用一些测量值更新预测。

使用粒子滤波（particle filter）进行视频目标跟踪

文章

问答

视频

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋 

腾讯云代码助手

CODING DevOps

Cloud Studio

SDK中心

API中心

命令行工具

腾讯云开发者社区推出了DeepHub IMBA专栏，为你提供了DeepHub IMBA的相关文章，致力于帮助开发者快速成长与发展。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐