TOMOCAT

LV0
发表了文章

[Skill]从零掌握正则表达式

无论你是出于什么原因需要掌握正则表达式(诸如爬虫、文本检索、后端服务开发或Linux脚本),如果之前从没接触过正则表达式(比如我)很容易在如山般的公式中迷失,以...

TOMOCAT
发表了文章

[Skill]程序员须掌握的概率统计基础知识

计算机科学作为理工科一个独特的分支,本质上仍然是建立在逻辑思维上的一门科学,良好的概率论思维有助于设计高效可行的算法。

TOMOCAT
发表了文章

[R语言]数据可视化的最佳解决方案:ggplot2

ggplot是一个拥有一套完备语法且容易上手的绘图系统,在Python和R中都能引入并使用,在数据分析可视化领域拥有极为广泛的应用。本篇从R的角度介绍如何使用g...

TOMOCAT
发表了文章

[机器学习必知必会]损失函数与风险函数

未知,风险函数的值并不能直接计算,所以监督学习就称为一个病态问题ill-formed problem。

TOMOCAT
发表了文章

[机器学习算法]从实例理解主成分分析原理

在对实际问题进行数据挖掘时,涉及到的特证数即数据维度往往是成百上千的,出于以下两个原因可能导致数据集质量不佳:

TOMOCAT
发表了文章

python可视化利器:pyecharts

前面我们提及ggplot在R和Python中都是数据可视化的利器,在机器学习和数据分析领域得到了广泛的应用。pyecharts结合了Python和百度开源的Ec...

TOMOCAT
发表了文章

[shell脚本]可视化输出表格数据

我们可以在执行shell脚本时实时传递参数从而指定某些具体的参数(在本例中包括表格的样式、颜色等),脚本中获取参数的格式为$n。其中除n为0表示执行的文件名外,...

TOMOCAT
发表了文章

[Go实战]golang使用mysql实例和第三方库Gendry

Builder用于生成sql语句,手写sql简单直观但是可维护性差,并且硬编码容易出错,如果遇到大where in查询,且in的集合内容又是动态的就很麻烦了。

TOMOCAT
发表了文章

[机器学习必知必会]交叉验证

当我们根据数据训练出一个机器学习模型时,我们希望它在新的数据上也保持较高的准备率,这就需要我们对学习到的不同模型有一个模型评估准则。

TOMOCAT
发表了文章

[机器学习必知必会]牛顿法与拟牛顿法

同梯度下降法一样,牛顿法和拟牛顿法也是求解无约束最优化问题的常用方法。牛顿法本身属于迭代算法,每一步需要求解目标函数的海赛矩阵的逆矩阵,计算比较复杂。拟牛顿法通...

TOMOCAT
发表了文章

[机器学习算法]定序回归

传统的线性回归模型预测的因变量取值范围为任意实数,在实际应用中我们常常需要对非连续型数据建模,其中一类的典型的数据即是定序数据ordinal data。

TOMOCAT
发表了文章

[机器学习必知必会]机器学习是什么

Tom Mitchell将机器学习任务定义为任务Task、训练过程Training Experience和模型性能Performance三个部分。 以分单引擎...

TOMOCAT
发表了文章

[机器学习算法]泊松回归

对因变量是离散型变量的问题建模时,普通的线性回归模型、定序回归模型和逻辑回归模型已经能解决我们大部分的需求。但有一类特殊的因变量记录某个特定事件出现的次数(有序...

TOMOCAT
发表了文章

[机器学习算法]朴素贝叶斯

表示样本空间中各类别样本所占的比例,根据大数定律,当训练集包含充分的独立同分布样本时,因此

TOMOCAT
发表了文章

[机器学习算法]逻辑回归模型

线性回归模型可以用于回归模型的学习,当我们需要用线性模型实现分类问题比如二分类问题时,需要用一个单调可微函数将线性回归的连续结果映射到分类回归真实标记的离散值上...

TOMOCAT
发表了文章

[机器学习算法]线性回归模型

同大多数算法一样,多元线性回归的准确性也基于它的假设,在符合假设的情况下构建模型才能得到拟合效果较好的表达式和统计性质较优的估计参数。

TOMOCAT
发表了文章

[机器学习必知必会]集成学习

集成学习指先产生一组弱学习器week learner(指泛化性能略优于随机猜测的学习器),随后根据某种策略将这些弱学习器组合起来得到最终预测结果的方法。

TOMOCAT
发表了文章

[机器学习算法]Adaboost与提升树

前面我们已经通过数学公式验证过,将众多“好而不同”的弱学习器组合起来可以提升模型的准确性。并且根据个体学习器之间是否存在强依赖关系,我们将集成学习分为boost...

TOMOCAT
发表了文章

[机器学习算法]支持向量机

在样本空间中找到一个划分超平面,将不同类别的样本区分开。但是事实上,能将训练样本划分开的超平面可能有很多,如下图所示,我们的任务就是寻找到最优的划分超平面。

TOMOCAT
发表了文章

[机器学习算法]XGBoost

XGBoost算法是以CART为基分类器的集成学习方法之一,由于其出色的运算效率和预测准确率在数据建模比赛中得到广泛的应用。与随机森林赋予每一颗决策树相同的投票...

TOMOCAT

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券