首页
学习
活动
专区
工具
TVP
发布

数据STUDIO

专栏成员
349
文章
608702
阅读量
29
订阅数
时间序列预测中的探索性数据分析
时间序列预测是数据科学和机器学习领域中极其重要的应用场景,广泛运用于金融、能源、零售等众多行业,对于企业来说具有重大价值。随着数据获取能力的提升和机器学习模型的不断进化,时间序列预测技术也日趋丰富和成熟。
数据STUDIO
2024-06-17
990
用 Lag-Llama 进行时间序列预测实战
Lag-Llama 是由 LLaMA 团队开发的时间序列基础模型,于2023年发布后迅速受到人工智能界的关注。这些预训练的模型经过大量时间序列数据的预训练,具备了存储不同频率和长度的时间序列数据的一般数据模式的能力,因此能够识别未见过的数据模式,且无需进行大量的微调。对于大型时间序列基础模型进行进一步微调,可以使它们实现与非基础模型相当的预测能力。
数据STUDIO
2024-06-17
1300
如何理解attention中的Q,K,V?
注意,这里的query, key, value只是一种操作(线性变换)的名称,实际的Q/K/V是它们三个的输出
数据STUDIO
2024-06-17
910
全自动机器学习 AutoML 高效预测时间序列
在本文中,我们探索了如何使用开源库将日常能源消耗的时间序列数据集转换为表格形式。然后,我们尝试了多种机器学习模型,包括梯度提升决策树和自动机器学习(AutoML),将其与Prophet模型的性能进行对比。我们的发现显示:
数据STUDIO
2024-06-04
810
【毕业论文】求解最优的任意宝可梦颜色交换算法
(加个英文标题:A Algorithm for Color Transfer on Pokémon Images
数据STUDIO
2024-06-04
1540
​Python太慢?那是你没用对方法​!
在Python编程中,除了注意循环对内存的影响外,我们还需要关注数据相关项目和面向对象编程中类的内存利用效率。我们常常在设计和编写复杂的类时投入大量精力,却发现这些类在测试或生产环境中由于需要承载大量数据而表现不佳。
数据STUDIO
2024-06-04
1000
一图胜千言!深度掌握 Python 绘图
数据可视化是数据科学家传达洞见和讲述数据故事的关键工具。作为 Python 开发者,我们拥有丰富的可视化库和工具,能够创建各种引人入胜的图表。本文将探索一些鲜为人知但实用的可视化类型,如桑基图(Sankey Diagrams)、脊线图(Ridge Plots)、内嵌图(Insets)、雷达图(Radar Chart)和词云图(Word Cloud Plots)。我们将主要使用流行的 Matplotlib、Seaborn 和 Plotly 这些 Python 库来实现这些有趣的可视化效果,让你的数据讲述更加生动有趣。
数据STUDIO
2024-06-04
1120
要避免的 9 个 SQL 错误
使用描述性且有意义的列名称,清楚地传达它们所代表的数据。这增强了可读性并减少了混乱,特别是在处理复杂查询或与其他人协作时。
数据STUDIO
2024-06-04
890
Python 中 if _ _name_ _ == '_ _main_ _' 到底是什么意思?
当我们用python a.py命令运行a.py时,a.py内的__name__变量会自动被设置为__main__。
数据STUDIO
2024-06-04
720
美亚4.6,写给程序员看的大模型入门实战书来了!
当大家都在热议大模型和生成式AI时,怎么让这些炫酷的技术快速落地,真正帮到商业和社会,成了个大难题。不过,AWS已经把大模型和生成式AI的门槛大大降低了。
数据STUDIO
2024-06-04
630
用于时间序列中的变点检测算法
变点检测是指在时间序列中发生了重大结构性断裂或者转变的点,这些变化可能是由于数据生成、技术或消费者行为等外部因素造成的。检测这些变点非常重要,因为它有助于我们理解和量化变化。我们需要及时准确地检测这些变化并立即发出警报。
数据STUDIO
2024-06-04
2300
大模型入门实战
当大家都在热议大模型和生成式AI时,怎么让这些炫酷的技术快速落地,真正帮到商业和社会,成了个大难题。不过,AWS已经把大模型和生成式AI的门槛大大降低了。
数据STUDIO
2024-06-04
1520
我发现了用 Python 编写简洁代码的秘诀!
作为数据科学家,我们常常使用 Jupyter Notebooks 进行数据探索和模型开发。在这个阶段,我们关注的重点是快速验证想法和证明概念。然而,一旦模型准备就绪,就需要将其部署到生产环境中,这时代码质量就显得尤为重要。
数据STUDIO
2024-06-04
990
这几个高级技巧,让 Python 类如虎添翼
实例方法是以 self 作为第一个参数定义的方法,它将类的实例作为隐式输入,允许用户与类的属性进行交互。实例方法功能强大,因为它们可以访问和修改实例中的数据和配置,从而执行复杂的计算和实现复杂的逻辑,并具有很高的可读性和可维护性。
数据STUDIO
2024-05-23
680
​经典时间序列模型 DeepAR 预测股票趋势
在时间序列预测领域,根据历史数据预测未来值的能力至关重要。因此,先进的机器学习算法已变得不可或缺。DeepAR 是一种功能强大的算法,它在处理复杂的时间模式和生成准确预测方面备受关注。特别适用于需要同时预测多个相关时间序列的场景,使其成为金融、电子商务和供应链管理等各个领域的重要工具。本文将讨论 DeepAR 预测算法,并将其用于时间序列预测。
数据STUDIO
2024-05-22
1470
使用PyTorch实现L1, L2和Elastic Net正则化
L1 正则化的特点是它可以产生稀疏模型,即许多模型参数会被设置为零。这种特性使得L1正则化不仅可以防止过拟合,还可以进行特征选择。
数据STUDIO
2024-05-20
1910
使用 Python 库 tracc 解析城市交通可达性
tracc是一个开源的Python库,专注于城市交通可达性分析。它提供了一套功能强大的工具,能够帮助用户加载、处理和分析交通数据,从而评估不同地区的交通可达性情况。
数据STUDIO
2024-05-20
1200
用于时间序列概率预测的蒙特卡罗模拟
蒙特卡罗模拟这个名称源自于摩纳哥王国的蒙特卡罗城市,这里曾经是世界著名的赌博天堂。在20世纪40年代,著名科学家乌拉姆和冯·诺依曼参与了曼哈顿计划,他们需要解决与核反应堆中子行为相关的复杂数学问题。他们受到了赌场中掷骰子的启发,设想用随机数来模拟中子在反应堆中的扩散过程,并将这种基于随机抽样的计算方法命名为"蒙特卡罗模拟"(Monte Carlo simulation)。
数据STUDIO
2024-05-20
1330
Kaggle Solo第一!
第一名方案主要由4个XGBoost模型(2个不同的标签)以及2个GRU模型(2个不同模型)组成。
数据STUDIO
2024-05-20
660
为什么我们公司还在用 Python 开发项目?
一直很想了解那些仍在坚持使用 Python,且支撑业务量有一定规模的公司是如何使用 Python 技术栈做开发的、会遇到哪些困难/教训、有什么样的优秀经验?
数据STUDIO
2024-05-11
1320
点击加载更多
社区活动
AI代码助手快速上手训练营
鹅厂大牛带你玩转AI智能结对编程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档