魏晓蕾

LV0
发表了文章

pip工具的使用及在Win10中用pip安装Tensorflow

魏晓蕾
发表了文章

【Flink】Flink 中的 ProcessFunction API 和 状态一致性保证

我们之前学习的 转换算子是无法访问事件的时间戳信息和水位线信息的。而这在一些应用场景下,极为重要。例如 MapFunction 这样的 map 转换算子就无法访...

魏晓蕾
发表了文章

【Flink】基于 Flink 的电商用户行为分析(二)

继续在 UserBehaviorAnalysis 下新建一个 maven module 作为子项目,命名为 MarketAnalysis。 这个模块中我们没有...

魏晓蕾
发表了文章

【Flink】基于 Flink 的电商用户行为分析(一)

电商平台中的用户行为频繁且较复杂,系统上线运行一段时间后,可以收集到大量的用户行为数据,进而利用大数据技术进行深入挖掘和分析,得到感兴趣的商业指标并增强对风险的...

魏晓蕾
发表了文章

【Flink】Flink中的窗口函数、时间语义及watermark

Flink 流应用程序处理的是以数据对象表示的事件流。所以在 Flink 内部,我们需要能够处理这些对象。它们需要被序列化和反序列化,以便通过网络传送它们;或者...

魏晓蕾
发表了文章

【Flink】Flink 运行架构及 Flink 流处理 API

Flink 运行时架构主要包括四个不同的组件,它们会在运行流处理应用程序时协同工作:作业管理器(JobManager)、资源管理器(ResourceManage...

魏晓蕾
发表了文章

【Flink】Flink简介及Standalone、Yarn和Kubernetes模式的部署

Flink 起源于 Stratosphere 项目,Stratosphere 是在 2010~2014 年由 3 所地处柏林的大学和欧洲的一些其他的大学共同进行...

魏晓蕾
发表了文章

数据挖掘和关联规则基本概念

关联规则(Association Rule)是数据挖掘中最典型的工作之一,也是现阶段来讲数据挖掘产生利益价值的一个比较核心的技术,也称为购物篮分析。

魏晓蕾
发表了文章

机器学习过程中的数据预处理和特征选择方法

数据清洗(data cleaning)是在机器学习过程中一个不可缺少的环节,其数据的清洗结果直接关系到模型效果以及最终的结论。在实际的工作中,数据清洗通常占开发...

魏晓蕾
发表了文章

解决文本中词语和主题分布的主题模型LSA和LDA详述

潜在语义分析(Latent Semantic Analysis, LSA),也叫做Latent Semantic Indexing(LSI),是一种常用的简单...

魏晓蕾
发表了文章

隐马尔可夫模型及其相关算法详述

−1​无关,即条件分布函数满足下列等式,此性质称为马尔可夫性质。如果随机过程满足马尔可夫性,则该过程称为马尔可夫过程。

魏晓蕾
发表了文章

EM算法及高斯混合模型GMM详述

最大似然估计(Maximum Likelihood Estimation,MLE)就是利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值的计算过程...

魏晓蕾
发表了文章

朴素贝叶斯算法及贝叶斯网络详述

朴素贝叶斯(Naive Bayes, NB)是基于“特征之间是独立的”这一朴素假设,应用贝叶斯定理的监督学习算法。对应给定的样本X的特征向量x1,x2,…,xm...

魏晓蕾
发表了文章

单标签多分类及多标签多分类算法

单标签二分类这种问题是我们最常见的算法问题,主要是指label标签的取值只有两种,并且算法中只有一个需要预测的label标签。直白来讲就是每个实例的可能类别只有...

魏晓蕾
编程算法
发表了文章

一文读懂七大设计原则及GoF 23种设计模式

GoF23种设计模式来源于《Design Patterns: Elements of Reusable Object-Oriented Software》,即后...

魏晓蕾
发表了文章

支持向量机SVM和核函数详述

作为一种优化算法,拉格朗日乘子法主要用于解决约束优化问题,它的基本思想就是通过引入拉格朗日乘子来将含有n个变量和k个约束条件的约束优化问题转化为含有(n+k)个...

魏晓蕾
发表了文章

K-Means算法、层次聚类、密度聚类及谱聚类方法详述

(1)什么是聚类? 聚类就是对大量未知标注的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据比较相似,类别之间的数据相似度比较小...

魏晓蕾
发表了文章

集成学习、Bagging、随机森林、Boosting和Stacking方法的对比详述

(1)集成学习概述 集成学习的思想是将若干个学习器(分类器和回归器)组合之后产生一个新学习器。弱分类器(weak learner)指那些分类准确率只稍微好于随...

魏晓蕾
发表了文章

决策树基本算法及其剪枝优化

(1)比特化 假设存在一组随机变量X,各个值出现的概率关系为:P(X=A)=1/4,P(X=B)=1/4,P(X=C)=1/4,P(X=D)=1/4。现在有一...

魏晓蕾
发表了文章

回归算法实例一:家庭用电预测——时间与功率、功率与电流、时间与电压之间的关系

魏晓蕾

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券