首页
学习
活动
专区
工具
TVP
发布

Brian

专栏作者
72
文章
127844
阅读量
22
订阅数
深入浅出云计算VPC网络之VXLAN
云计算三大组成部分:计算、存储和网络。VXLAN属于云计算虚拟化网络的非常重要的一部分,现在大多数云计算虚拟化网络都是基于此协议实现数据中心互联和虚拟机迁移 ,在数量级很大的虚拟机上完成这些工作是一个非常大的挑战。主要面临以下挑战:
吕海峰
2020-06-18
6.8K0
R语言性能Tips和GC
最近团队在使用R语言作为算法的实践语言,通过人工策略和xgboost算法进行一些价格算法的控制和输出,发现一些代码中对于内存、CPU、程序设计思想以及现代统计算法并不是很熟悉,于是特写此篇普及一下知识,也算是我对R语言的入门文章吧。
吕海峰
2018-08-08
1.6K0
结构化机器学习流程
机器学习可以通过结构化的流程来梳理:1.定义问题和需求分析->2.数据探索->3.数据准备->4.评估算法->5.优化模型->6.部署。
吕海峰
2018-08-08
1.1K0
Windows Azure 机器学习与云计算概述
Azure 机器学习是集成式的端到端数据科学和高级分析解决方案。 它可让数据科学家以云的规模准备数据、开发试验和部署模型。 Azure 机器学习的主要组件包括:
吕海峰
2018-08-08
1.1K0
机器学习常用算法-k近邻算法
概述 今天介绍一下机器学习常用算法,以及常用的数据处理技巧等。我们都知道机器学习针对特定任务从经验中学习,并且使得我们的任务效果越来越好。我们看一机器学习的workflow,如下所示: 数据采集和标记->数据清洗->特征选择->模型选择->模型训练和测试->模型性能评估和优化->模型使用即上线。 我们一般通过Python来实现机器学习常用算法的程序,所以基于Python语言常用的机器学习类库及其第三方扩展库有:IPython,Jupyter,numpy,matplotlib,scipy,scikit-lea
吕海峰
2018-07-03
8310
机器学习常用算法-线性回归算法
概述 有时候我们需要预测连续值的映射关系,比如房价预测问题。不想之前的是几个类别,它的输出值是实数。这个时候一般通过线性回归算法进行拟合。 线性回归 h_\theta(x)=\theta_0+\theta_1x 上面这个例子是针对数据集x和y,预测函数根据数据输入x会预测出h(x),我们的目的是找出一个合适θ参数值,是的预测值h(x)和y值的整体误差最小。我们一般通过均方差成本函数来衡量模型对训练样本拟合的好坏程度。如下: J(\theta)=J(\theta_0,\theta_1)=\frac 1{2
吕海峰
2018-06-13
6760
深度学习笔记-深度学习实战
深度学习实战 前面总结了吴恩达的深度学习课程笔记,博主把后续的深度学习课程笔记总结记录到个人博客里面,以供学习和交流使用。今天总结的是深度学习的超参数调试、正则化和梯度检验。 改善神经网络 依次通过数
吕海峰
2018-06-13
1.4K0
Ubuntu 16.04 Install OpenCV3.4 Pytorch Mxnet Tensorflow
概述 由于需要在Ubuntu 16.04安装多个深度学习框架所以通过博客记录一下安装过程中的坑以及一些关键步骤。这个时候我们需要安装自己需要包装。下面我们通过一步一步开始安装自己数据。记录安装了如下软件和支持: * Cuda 9.1 * cuDnn 9.0 * OpenCV 3.4 Support Python2.7 Python3.4 Cuda OpenGL OpenBLAS * Mxnet Pytorch Tensorflow 安装 安装预编译包 我们先来安装cuda,首先通过官网下载你所需要
吕海峰
2018-04-16
1.2K0
熵的理解
---- 熵 熵在信息论中代表随机变量不确定度的度量。一个离散型随机变量X的熵H(X)定义为: image.png 明确定义的科学名词且与内容无关,而且不随信息的具体表达式的变化而变化。是独立于形式,反映了信息表达式中统计方面的性质。是统计学上的抽象概念。信息熵的一种解释是,它表示的是最短的平均编码长度。同样的,不确定性越大,熵就越大。信息熵的单位是比特(bit)。我们举两个简单的例子: 第一个例子: 32支球队,在无任何先验信息的前提下,用二分法猜冠军队伍,最多猜5次,即: image.png 第二个例子
吕海峰
2018-04-03
6900
深入浅出Logistic Regression之二分类
---- 概述 在深度学习笔记-神经网络基础文章里面介绍过Logistic Regression模型进行二分类和推导。比如:我们现在有一张彩色图片让计算机自己识别图片中的动物是否是cat(猫)。下面我
吕海峰
2018-04-03
1.9K0
机器学习性能度量
---- 概述 我们在进行机器学习时需要衡量机器学习的优劣和本身模型的准确程度,比如简单的衡量数据的准确率和错误率,但是我们更关心的是模型的泛化能力的指标,即基于模型的所选的item相关性以及模型分类指标的好坏。 机器学习度量 error rate(错误率):把分类错误的样本数占样本总数的比例。E=a/m accuracy(精确度):分类正确的样本数占样本总数的比例。acc=1-E training error(训练误差):学习器在训练集上的误差。 generalization error(泛华误差):在新
吕海峰
2018-04-03
5940
Python进阶教程(一)
概述 hi,朋友们大家好,今天将英文原著作者 @yasoob《Intermediate Python》进行翻译和在工作中使用的Python技巧进行了总结。Gitbook里面有翻译的版本,大家可以下载下来看看。我今天主要是将该英文原著翻译成适合自己的理解的语言,并附加一些自己在工作中使用Python的技巧。废话少说,下面我们依次来学习一下@yasoob的原著。 Intermediate Python 中译 如果在翻译过程中有问题或者code无法运行,还请各位大侠指正。 *args和**kwargs 我们在函数
吕海峰
2018-04-03
1K0
Python进阶教程(二)
概述 在上一篇博客中,我们介绍了Python进阶教程(一),还有一些新的技巧没有翻译完,我们下面来继续我们的翻译。 Intermediate Python 中译(二) Decorators Decorators装饰器是Pytho非常重要的特性,相当于Java注解功能。装饰器是修饰函数的一种语法特性,可以使其功能发生一些改变。在Python函数也是第一等公民,可以直接赋值对象和使用。 def hi(name="brian"): return "hi,"+name print(hi()) #输出 hi
吕海峰
2018-04-03
1.7K0
Python进阶教程(三)
Python 进阶 我们在Python进阶教程(二),介绍了一些Python进阶用法。今天给大家介绍的是和c/c++混合编程的用法。我们都知道特别是Python2.x版本GIL的影响造成多线程计算方面是鸡肋,并且常常在高性能计算方面依赖很多包。如果我们想切合我们自己的业务处理,比如高性能部分我们用C/C++生成动态链接库,Python调用该动态链接库。我们今天主要介绍Python在和c/c++混合编程。 Python和C/C++混合编程 在和C/C++代码进行混合编程时,我们通常需要采用以下几个技术点: C
吕海峰
2018-04-03
9190
C/C++ Development using Visual Studio Code, CMake and LLDB
概述 由于我工作环境是Linux和Mac,个人的工作目录和开发环境一直来回切换,之前一直使用emacs。不可否认,emacs非常强大和可定制化。昨天由于个人电脑系统损坏,重装了osx。在好基友的推荐下,试用vscode,发现非常不错。于是记录和分享到博客中。今天主要给大家讲解的vscode配置c/c++ ide开发环境,当然官网支持很多种可定制化的配置。 开发环境搭建 我们首先安装vscode,官网是:vscode。我们下面来安装支持c/c++开发环境的安装包。 cpptools cmake C/C++ C
吕海峰
2018-04-03
1.7K0
VPC 深入浅出解析
概述 今天给大家介绍一下博主最近做的一个项目:VPC.VPC(Virtual Private Cloud)虚拟私有云,租户可以在云中预置一个逻辑隔离分区,自己定义的虚拟网络中启动虚拟化资源。 功能特性: 网络隔离(二层网络隔离) 网络虚拟化,基于EVPN的OverLay技术在物理基础上虚拟化网络。 VPC与VPC间是完全隔离,通过VXLAN协议对每个VPC进行隔离,这样就保证了L2的逻辑隔离。 灵活定制网络环境 自定义子网网段、路由表等。 与公网互通 通过EIP可实现与公网互通,通过NAT网关支持SNAT配
吕海峰
2018-04-03
3.7K0
Hadoop和Zookeeper安装过程中出现的问题解决
概述 我最近在搭建一套大数据生态系统,安装分布式Hadoop和Zookeeper时出现了一些问题。我的分布式环境是由三个节点构成的,分比为:master,slave1和slave2。安装过程在后面文章里面列出来,这里记录一些安装之后启动Hadoop和Zookeeper出现的问题。 问题一 Hadoop2.2.0 不能访问站点http://master:8088 1.可能由于安装的资源管理器正在运行,通过资源管理器占用使用TCP6代替TCP。这样的话可以通过两种方式来解决它: 在linux上禁用IPV6,然
吕海峰
2018-04-03
6260
搭建分布式Spark计算平台
集群机器规划 三台机器的操作系统全部为CentOS7.2. 主机名称 IP地址 master 192.168.1.106 slave1 192.168.1.107 slave2 192.168.1.108 其中master为hadoop的namenode,slave1和slave2为hadoop的datananode。如果安装spark的话,master、slave1和slave2都是worker。 环境准备 设置IP地址 在我们进入安装之前,首先要把服务器的网络、安全和登录等配置设
吕海峰
2018-04-03
2K0
C++ Virtual And Pure Virtual Explained
---- Virtual Virtual Function是成员函数,其行为在派生类中被覆盖。与非虚函数不同的是,即使没有关于类的实际类型的编译时信息,也会保留重写的行为。如果派生类使用指针或者对基类的引用进行处理,则对被覆盖的虚函数的调用将调用派生类中定义的行为。 #include <iostream> struct Base { virtual void f() { std::cout << "base\n"; } }; struct Derived : Base {
吕海峰
2018-04-03
8980
机器学习系列-机器学习是什么?
概述 机器学习现在已经运用在很多领域和行业,比如通过机器学习系统来提高自己系统的准确率和目标、进行商业数据的分析与预测等等。机器学习是关于计算机基于数据构建的概率统计模型并运用模型对数据进行预测和分析。 机器学习:一个系统能够通过执行某个过程改进它的性能,它的对象是数据,从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析和预测中去。 机器学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。 机器学习方法 机器学习致力于研究如何通过计算的手段,利用经验来改
吕海峰
2018-04-03
7950
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
热点技术征文第五期
新风口Sora来袭,普通人该如何把握机会?
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档