首页
学习
活动
专区
工具
TVP
发布

DeepHub IMBA

不可错过的AI方向干货分享,赶紧关注吧 internet + machine learning +big data +architecture = IMBA
专栏成员
1402
文章
1536321
阅读量
65
订阅数
整合LlamaIndex与LangChain构建高级的查询处理系统
构建大型语言模型应用程序可能会颇具挑战,尤其是当我们在不同的框架(如Langchain和LlamaIndex)之间进行选择时。LlamaIndex在智能搜索和数据检索方面的性能令人瞩目,而LangChain则作为一个更加通用的应用程序框架,提供了更好的与各种平台的兼容性。
deephub
2024-05-22
1170
深入解析xLSTM:LSTM架构的演进及PyTorch代码实现详解
xLSTM的新闻大家可能前几天都已经看过了,原作者提出更强的xLSTM,可以将LSTM扩展到数十亿参数规模,我们今天就来将其与原始的lstm进行一个详细的对比,然后再使用Pytorch实现一个简单的xLSTM。
deephub
2024-05-20
1130
OpenAI 宫斗大戏继续,奥特曼连发2篇小作文,又牵扯出「封口协议」问题,网友也不买账
在近期发生的OpenAI内部风波中,公司首席执行官山姆·奥特曼(Sam Altman)和总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)发布了两篇文章回应前员工和外界关于公司安全政策和股权处理方式的关注。这两篇文章旨在阐明公司的立场,并试图缓解公众和前员工的疑虑,但显然并未完全达到预期效果。
deephub
2024-05-20
1080
DeepSparse: 通过剪枝和稀疏预训练,在不损失精度的情况下减少70%的模型大小,提升三倍速度
这篇论文提出了一种高稀疏性基础大型语言模型(LLMs)的新方法,通过有效的预训练和部署,实现了模型在保持高准确度的同时,显著提升了处理速度。
deephub
2024-05-20
1650
OpenAI宫斗大戏,超级对齐团队解散,安全团队专家吐糟克扣算力
在过去的半年中,OpenAI内部经历了一场剧烈的“宫斗”,结果是其关键的“超级智能对齐团队”宣告解散。这一变化标志着团队创始成员及其领导核心的彻底离散。首席科学家伊利亚·苏茨克沃(Ilya Sutskever)和团队成员詹·莱克(Jan Leike)均于本周宣布离职。
deephub
2024-05-20
1170
扩散模型的多元化应用:药物发现、文本生成、时间序列预测等
AlphaFold3 是 DeepMind 开发的一款蛋白质结构预测软件,它在AlphaFold2的基础上进行了改进。其中最主要的一个改进就是引入了扩散模型,这使得扩散模型不仅仅可以应用于文生图,其实扩散模型早已经在各个领域中都又所发展,今天我们就来研究一下扩散模型的多元化应用。
deephub
2024-05-20
1580
又可以白嫖了,Hugging Face推出ZeroGPU提供共享的40G A100,总计价值1000万美元
在AI领域,获取高性能计算资源常常成为小型开发者和初创企业的一大难题。为了解决这一问题,机器学习领域的领军企业Hugging Face最近推出了名为ZeroGPU的新技术,旨在通过其平台Spaces提供免费且更加灵活的GPU访问服务,支持更多开发者和研究人员推进AI技术的创新和应用。
deephub
2024-05-20
2380
图神经网络入门示例:使用PyTorch Geometric 进行节点分类
基于图的神经网络是强大的模型,可以学习网络中的复杂模式。在本文中,我们将介绍如何为同构图数据构造PyTorch Data对象,然后训练不同类型的神经网络来预测节点所属的类。这种类型的预测问题通常被称为节点分类。
deephub
2024-05-20
1140
ATFNet:长时间序列预测的自适应时频集成网络
ATFNet是一个深度学习模型,它结合了时间域和频域模块来捕获时间序列数据中的依赖关系。引入了一种新的加权机制来调整周期性的权重,增强了离散傅立叶变换,并包括一个复杂关系识别的注意力机制,在长期时间序列预测中优于当前方法(每个模型都这么说)。这是4月发布在arxiv上的论文,还包含了源代码。
deephub
2024-05-20
1430
时间序列预测:探索性数据分析和特征工程的实用指南
时间序列分析是数据科学和机器学习领域最广泛的主题之一:无论是预测金融事件、能源消耗、产品销售还是股票市场趋势,这一领域一直是企业非常感兴趣的领域。
deephub
2024-05-20
1310
AniTalker,一个新的对口型说话视频生成框架
来自上海交通大学X-LANCE实验室与思必驰AISpeech的研究人员联合推出了一款名为AniTalker的先进视频生成框架。此技术允许用户将单张静态人像和输入的音频转化为栩栩如生的动画对话视频,极大地提升了动画视频的生成质量和效率。
deephub
2024-05-20
1160
Transformers 加速的一些常用技巧
Transformers 是一个强大的架构,但模型因其采用的自注意力机制,虽然能够有效地处理序列数据并捕获长距离依赖关系,但同时也容易导致在训练过程中出现OOM(Out of Memory,内存不足)或者达到GPU的运行时限制。
deephub
2024-05-20
1290
ControlNet作者新作品,专业级图像光照调整和AI打光工具IC-Light
在数字图像处理领域,AI技术提供了多种实用的解决方案。ControlNet的作者张吕敏,最近推出了一款名为IC-Light(Imposing Consistent Light)的图像光照处理工具。这款工具可以进行高级光源操纵和光影重构,帮助图像与不同背景更好地融合,提升了视觉效果的自然性和艺术感。
deephub
2024-05-20
1050
You Only Cache Once:YOCO 基于Decoder-Decoder 的一个新的大语言模型架构
这是微软再5月刚刚发布的一篇论文提出了一种解码器-解码器架构YOCO,因为只缓存一次KV对,所以可以大量的节省内存。
deephub
2024-05-20
1440
苹果将携手OpenAI开展合作?下周一直播可能揭示创新AI技术与惊喜新产品
当地时间周五(5月10日),人工智能(AI)领先企业OpenAI宣布,将在下周一(5月13日)通过直播形式展示其ChatGPT和GPT-4的最新更新。该直播将在公司官网进行,尽管有传言和期待,OpenAI首席执行官萨姆·奥尔特曼明确表示,这次更新将不涉及GPT-5和任何新的搜索引擎产品。奥尔特曼在社交媒体上提到:“我们将展示一些我们认为人们会喜欢的新东西,对我来说感觉就像魔术一样神奇。”
deephub
2024-05-20
730
图机器学习入门:基本概念介绍
图机器学习(Graph Machine Learning,简称Graph ML)是机器学习的一个分支,专注于利用图形结构的数据。在图形结构中,数据以图的形式表示,其中的节点(或顶点)表示实体,边(或链接)表示实体之间的关系。
deephub
2024-05-20
960
OpenAI宣布与Stack Overflow合作开发 OverflowAI,帮助技术人员快速找到问题的解决方案
OpenAI 与 Stack Overflow 宣布了一项新的 API 合作伙伴关系,此举将利用 Stack Overflow 作为全球领先的高技术内容知识平台的优势,结合 OpenAI 的流行 LLM 模型,为开发者提供强大支持。通过这次合作,双方希望提高 AI 工具的数据准确性和验证度,帮助技术人员快速找到问题的解决方案,使他们能够集中精力处理优先任务。
deephub
2024-05-10
1130
10个使用NumPy就可以进行的图像处理步骤
图像处理是一种数学计算。数字图像由称为像素的彩色小点组成。每个像素由红、绿、蓝(RGB)三个独立的颜色组成。每个像素中的主色由每个RGB分量的数值决定。
deephub
2024-05-10
1210
Gradformer: 通过图结构归纳偏差提升自注意力机制的图Transformer
这是4月刚刚发布在arxiv上的论文,介绍了一种名为“Gradformer”的新型图Transformer,它在自注意力机制中引入了指数衰减掩码。以下是主要创新点:
deephub
2024-05-10
700
使用PyTorch实现L1, L2和Elastic Net正则化
在机器学习中,L1正则化、L2正则化和Elastic Net正则化是用来避免过拟合的技术,它们通过在损失函数中添加一个惩罚项来实现。
deephub
2024-05-10
750
点击加载更多
社区活动
AI代码助手快速上手训练营
鹅厂大牛带你玩转AI智能结对编程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档