优化问题是量化中经常会碰到的,之前写的风险平价/均值方差模型最终都需要解带约束的最优化问题,本文总结用python做最优化的若干函数用法。
本文介绍了如何使用深度学习算法进行股票价格预测,并通过一个具体的例子进行了说明。首先介绍了股票价格预测的背景和意义,然后介绍了深度学习算法的原理和实现,最后通过一个具体的例子说明了该算法的有效性。
选自Technica Curiosa 作者:Nishant Shukla 机器之心编译 参与:Jane W 本文的作者 Nishant Shukla 为加州大学洛杉矶分校的机器视觉研究者,从事研究机器人机器学习技术。Nishant Shukla 一直以来兼任 Microsoft、Facebook 和 Foursquare 的开发者,以及 SpaceX 的机器学习工程师。他还是《Haskell Data Analysis Cookbook》的作者。 TensorFlow 入门级文章: 深度 | 机器学习敲门砖
在本文中,我们介绍了一种流行的生存分析算法,Cox比例风险模型¹。然后,我们定义了其对数部分似然和梯度,并通过一个实际的Python示例对其进行优化,以找到最佳的模型参数集。
方法:定义一个条件概率,如p(Y|X)相当于用模型来捕获输入X和输出Y之间的关系,如
在开篇之初,我们提到了最简单的AI算法:线性回归 (Linear Regression)。让我们重温一下一元线性回归算法的公式:
参与方式:https://github.com/apachecn/interpretable-ml-book-zh/blob/master/CONTRIBUTING.md
Scipy 提供了多种优化算法,用于求解最小化或最大化问题。这些问题可以涉及到拟合模型、参数优化、函数最优化等。在本篇博客中,我们将深入介绍 Scipy 中的优化功能,并通过实例演示如何应用这些算法。
剖析第一个例子 学习《机器学习》,很多IT高手是直接去翻看TensorFlow文档,但碰壁的很多。究其原因,TensorFlow的文档跨度太大了,它首先假设你已经对“机器学习”和人工智能非常熟悉,所有的文档和样例,都是用于帮助你从以前的计算平台迁移至TensorFlow,而并不是一份入门教程。 所以本文尽力保持一个比较缓慢的节奏和阶梯,希望弥合这种距离。本文定位并非取代TensorFlow文档,而是希望通过对照本文和TensorFlow文档,帮助你更顺利的进入Google的机器学习世界。 基于这个思路,
在本文,我们将考虑观察/显示所有变量的模型,以及具有潜在变量的模型。第一种有时称为“路径分析”,而后者有时称为“测量模型”。
1 拟合 形象的说,拟合就是把平面上一系列的点,用一条光滑的曲线连接起来。因为这条曲线有无数种可能,从而有各种拟合方法。拟合的曲线一般可以用函数表示,根据这个函数的不同有不同的拟合名字。 2 过拟合 上学考试的时候,有的人采取题海战术,把每个题目都背下来。但是题目稍微一变,他就不会做了。因为他非常复杂的记住了每道题的做法,而没有抽象出通用的规则。 所以过拟合有两种原因: 训练集和测试机特征分布不一致(白天鹅黑天鹅) 或者模型太过复杂(记住了每道题)而样本量不足 解决过拟合也从这两方面下手,收集多样化的
🙋♂️声明:本人目前大学就读于大二,研究兴趣方向人工智能&硬件(虽然硬件还没开始玩,但一直很感兴趣!希望大佬带带)
【深度学习 | 非线性拟合】那些深度学习路上必经的核心概念,确定不来看看? (一) 作者: 计算机魔术师 版本: 1.0 ( 2023.8.27 )
地理加权回归分析完成之后,与OLS不同的是会默认生成一张可视化图,像下面这张一样的:
等渗回归是很少被谈论但肯定是最酷的回归技术之一。我之所以说“很少谈论”,是因为与线性回归不同,它不经常被讲授或使用。等渗回归做出一个更笼统的假设,即最能代表数据的函数是单调的,而不是线性的(是的,线性也是单调的,反之亦然)。
工业控制系统在现代工业中扮演着重要角色,实现了自动化生产和优化生产过程。闭环控制系统是一种常见的控制方法,除了传统的比例-积分-微分(PID)控制器外,还存在许多其他闭环控制方法和技术。本文将重点介绍这些闭环控制系统,并提供实际应用案例,以增加文章的实用性。
XGBoost是一种强大的机器学习算法,但在处理大规模数据时,传统的CPU计算可能会变得缓慢。为了提高性能,XGBoost可以利用GPU进行加速。本教程将介绍如何在Python中使用XGBoost进行GPU加速以及性能优化的方法,并提供相应的代码示例。
\[ \begin{align} &minimize \, f_0(x) \\ &subject \, to \, f_i(x)≤b_i, \, i=1,...,m \tag{1.1} \end{align} \]
(1)Field of study that gives computers the ability to learn without being explicitly programmed 在没有显示编程的情况下,让计算机具有学习的能力
捕食者和被捕食者模型(Predator-Prey Model),这是生态学中非常经典的一个模型。
选自Medium 作者:Prashant Gupta 机器之心编译 参与:陈韵竹、刘晓坤 训练机器学习模型的要点之一是避免过拟合。如果发生过拟合,模型的精确度会下降。这是由于模型过度尝试捕获训练数据集的噪声。本文介绍了两种常用的正则化方法,通过可视化解释帮助你理解正则化的作用和两种方法的区别。 噪声,是指那些不能代表数据真实特性的数据点,它们的生成是随机的。学习和捕捉这些数据点让你的模型复杂度增大,有过拟合的风险。 避免过拟合的方式之一是使用交叉验证(cross validation),这有利于估计测试集中
时间序列是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列。统计学上,一个时间序列即是一个随机过程的实现。时间序列按其统计特性可以分为平稳时间序列和非平稳时间序列两类。在实际生活中遇到的序列,大多数是不平稳的。
在机器学习任务中,特征工程是至关重要的一步。对于分类特征的处理尤为重要,而CatBoost是一种能够自动处理分类特征的梯度提升决策树算法。本教程将详细介绍如何在Python中使用CatBoost进行自动分类特征处理,并提供相应的代码示例。
Plotly:协同 Python 和 matplotlib 工作的 web 绘图库 官网链接:https://plot.ly/python/
本章中,将会利用TensorFlow实现一个简单的模型:线性回归。通过本示例,我会分析一些代码基础及说明如何在学习过程中调用各种重要组件,比如cost function或梯度下降算法。 变量间关系的模型 线性回归是用来度量变量间关系的统计技术。有意思的是该算法的实现并不复杂,但可以适用于很多情形。正是因为这些原因,我非常乐意以线性回归作为开始学习TensorFlow的开始。 请记住,不管在两个变量(简单回归)或多个变量(多元回归)情形下,线性回归都是对一个依赖变量,多个独立变量xi,一个随机值b间的关系建模
Machine Learning Mastery 机器学习算法教程 机器学习算法之旅 利用隔离森林和核密度估计的异常检测 机器学习中的装袋和随机森林集成算法 从零开始实现机器学习算法的好处 更好的朴素贝叶斯:从朴素贝叶斯算法中收益最大的 12 个技巧 机器学习的提升和 AdaBoost 选择机器学习算法:Microsoft Azure 的经验教训 机器学习的分类和回归树 什么是机器学习中的混淆矩阵 如何使用 Python 从零开始创建算法测试工具 通过创建机器学习算法的目标列表来获得控制权 机器学习中算法
The least absolute shrinkage and selection operator (LASSO) method is very similar to ridge regression and LARS. It's similar to Ridge Regression in the sense that we penalize our regression by some amount, and it's similar to LARS in that it can be used as a parameter selection, and it typically leads to a sparse vector of coefficients.
g 代表一个常用的逻辑函数(logistic function)为S形函数(Sigmoid function),公式为:
大数据文摘作品 作者:Emil Wallnér 编译:高宁、Happen、陈玲、Alieen 深度学习的浪潮在五年前开始兴起。随着计算能力的爆炸型增长和几个成功的案例,深度学习引起了大肆宣传。深度学习技术可以用来驾驶车辆,在Atari游戏中进行人机对抗,以及诊断癌症。 开始学习神经网络时,我花了两周的时间进行探索,选择合适的工具,对比不同的云服务以及检索在线课程。但回想起来,我还是希望我可以从第一天就能创建神经网络,这也是这篇文章的目的。 你不需要有任何预备知识。当然如果你对Python,命令行和Jupyt
训练机器学习模型的主要方面之一是避免过度拟合。如果模型过于拟合,则模型的准确性会较低。发生这种情况是因为您的模型过于努力地捕获训练数据集中的噪声。噪声是指数据点并不能真正代表数据的真实属性,而是随机的机会。学习此类数据点,会使您的模型更加灵活,存在过度拟合的风险。
数据科学的一个重要方面,是发现数据可以告诉我们什么未来的事情。气候和污染的数据说了几十年内温度的什么事情?根据一个人的互联网个人信息,哪些网站可能会让他感兴趣?病人的病史如何用来判断他或她对治疗的反应?
到目前为止,我们已经非常熟悉选择模型和相应损失函数的过程,并通过选择最小化损失函数的
回归最初是遗传学中的一个名词,是由英国生物学家兼统计学家高尔顿首先提出来的,他在研究人类身高的时候发现:高个子回归人类的平均身高,而矮个子则从另一方向回归人类的平均身高; 回归整体逻辑 回归分析(Regression Analysis) 研究自变量与因变量之间关系形式的分析方法,它主要是通过建立因变量y与影响它的自变量 x_i(i=1,2,3… …)之间的回归模型,来预测因变量y的发展趋向。 回归分析的分类 线性回归分析 简单线性回归 多重线性回归 非线性回归分析 逻辑回归 神经网络 回归分析的步骤 根据预
梯度下降算法主要用户优化单个参数的取值,而反向传播算法给出了一个高效的方式在所有参数上使用梯度下降算法,从而使神经网络模型在训练数据上的损失函数尽可能小。反向传播算法是训练神经网络的核心算法,他可以根据定义好的损失函数优化神经网络中参数的取值,从而使神经网络在训练数据集上的损失函数达到一个最小值。神经网络模型中参数的优化过程直接决定了模型的质量,是使用神经网络时非常重要的一步。
启动jupyter notebook,使用新增的pytorch环境新建ipynb文件,为了检查环境配置是否合理,输入import torch以及torch.cuda.is_available() ,若返回TRUE则说明研究环境配置正确,若返回False但可以正确导入torch则说明pytorch配置成功,但研究运行是在CPU进行的,结果如下:
机器之心报道 编辑:蛋酱 对于机器学习领域的初学者来说,这会是很好的入门课程。目前,课程的笔记、PPT 和视频正在陆续发布中。 2020 年就这么悄无声息地走完了,想必大多数人,尤其是在校学生唯一的感觉就是:「又是毫无学术进展的一年。」 别慌,只要马上开始学习,什么时候都不算晚。 近日,威斯康辛大学麦迪逊分校助理教授 Sebastian Raschka 在推特上宣布了威斯康辛大学《机器学习导论》2020 秋季课程的完结:「教授两个班级和 230 个学生是相当不错的体验,对于那些感兴趣的人,我整理了一页记
本文试图成为理解和执行线性回归所需的参考。虽然算法很简单,但只有少数人真正理解了基本原理。
本文介绍了如何利用深度学习实现图像分类和物体检测。首先介绍了深度学习的基本原理,然后详细讲解了如何构建一个图像分类的深度学习模型,包括选择合适的模型、训练模型、使用测试数据集进行模型性能评估等。同时,还介绍了一种基于深度学习的目标检测模型,以及如何使用深度学习模型进行目标检测。
T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。T-SNE 基于随机邻域嵌入,是一种非线性降维技术,用于在二维或三维空间中可视化数据。
https://github.com/SciML/DifferentialEquations.jl
T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。T-SNE 基于随机邻域嵌入,是一种非线性降维技术,用于在二维或三维空间中可视化数据
问题描述 采用MATLAB、Python对数据拟合时(函数形式如y=1-c*exp(k*x^t)),程序有时能够完美运行,给出你想要的结果,然而有时候竟然报错,运行不出结果,或者给出的结果明显不对,让你时常怀疑电脑是不是中病毒了,😅,为什么交给电脑同样的任务(拟合求参数),电脑还需要根据自身心情来决定是否给你想要的结果? 昨天,硕士好友王博士同样也遇见这个问题,现分析其具体原因?于此同时,针对疲劳裂纹扩展具体的工程问题,对最小二乘法拟合(疲劳裂纹扩展速率以及应力强度因子)实验数据的基本过程进行简要介绍,具体
我们要解决的是一个过于简单且不现实的问题,但其好的一面是便于我们了解机器学习和 TensorFlow 的概念。我们要预测一个基于单一特征(房间面积/平方米)的单标量输出(房价/美元)。这样做消除了处理多维数据的需要,使我们能够在 TensorFlow 中只专注于确定、实现以及训练模型。
选自 kdnuggets 作者:Soon Hin Khor 机器之心编译 参与:Rick、吴攀、李亚洲 本文是日本东京 TensorFlow 聚会联合组织者 Hin Khor 所写的 TensorFlow 系列介绍文章的前两部分,给出了关于 TensorFlow 的 gentlest 的介绍。谈到单一特征问题的线性回归问题以及训练(training)的含义 第一部分 引言 我们要解决的是一个过于简单且不现实的问题,但其好的一面是便于我们了解机器学习和 TensorFlow 的概念。我们要预测一个基于
在机器学习任务中,特征选择是提高模型性能和减少过拟合的重要步骤之一。LightGBM作为一种高效的梯度提升决策树算法,提供了内置的特征重要性评估功能,帮助用户选择最重要的特征进行模型训练。本教程将详细介绍如何在Python中使用LightGBM进行特征选择与重要性评估,并提供相应的代码示例。
本文总结了常用的数学模型方法和它们的主要用途,主要包括数学和统计上的建模方法,关于在数学建模中也挺常用的机器学习算法暂时不作补充,以后有时间就补。至于究竟哪个模型更好,需要用数据来验证,还有求解方法也不唯一,比如指派问题,你可以用线性规划OR动态规划OR整数规划OR图与网络方法来解。
Machine Learning Mastery 计算机视觉教程 通道在前和通道在后图像格式的温和介绍 深度学习在计算机视觉中的 9 个应用 为 CNN 准备和扩充图像数据的最佳实践 8 本计算机视觉入门书籍 卷积层在深度学习神经网络中是如何工作的? DeepLearningAI 卷积神经网络课程(复习) 如何在 Keras 中配置图像数据扩充 如何从零开始为 CIFAR-10 照片分类开发 CNN 用于 Fashion-MNIST 服装分类的深度学习 CNN 如何为 MNIST 手写数字分类开发 CNN
领取专属 10元无门槛券
手把手带您无忧上云