进击的程序猿

77 篇文章
13 人订阅

全部文章

zhuanxu

EM 算法的 9 重境界之第3重三个硬币GMM模型参考

之前写过一篇文章EM 算法的 9 重境界之前两重,里面讲述了em算法的过程,本文是对前一篇文章的补充。

752
zhuanxu

xgboost 库使用入门

本文 github 地址:1-1 基本模型调用. ipynb,里面会记录自己kaggle大赛中的内容,欢迎start关注。

944
zhuanxu

贝叶斯推断:Metropolis-Hastings 采样

前面一篇文章贝叶斯统计:初学指南介绍了最简单的 Metropolis 采样方法,本文将介绍另一种采样 Metropolis-Hastings ,并且会对前文介绍...

511
zhuanxu

进击算法:字符串匹配的 BM 算法

各种文本编辑器的 "查找" 功能(Ctrl+F),大多采用 Boyer-Moore 算法。

722
zhuanxu

经典检索算法:BM25原理

bm25 是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法,再用简单的话来描述下bm25算法:我们有一个query和一批文档Ds,...

901
zhuanxu

基于隐变量的推荐模型基于隐变量的推荐模型

上一篇介绍了协同过滤,其重点就是在人-物品矩阵上,其中心思想是去对人或者物品进行聚类,从而找到相似人或者相似物品,用群体的智慧为个人进行推荐,但是,这种近邻模型...

833
zhuanxu

贝叶斯统计:初学指南

在statistical inference上,主要有两派:频率学派和贝叶斯学派。

743
zhuanxu

实战:基于 docker 的 HA-hadoop 集群搭建

Hadoop的master和slave分别运行在不同的Docker容器中,其中hadoop-master容器中运行NameNode和ResourceManage...

752
zhuanxu

卷积神经网络基础知识

传统的机器学习大多数都需要我们手工去建立feature,这种方法建立出来的feature,大多都是有物理意义的,所以算法最终好不好,就看你特征工程做的怎么样!

884
zhuanxu

推荐系统之用户行为分析

基于用户行为的推荐,在学术界名为协同过滤算法。 协同过滤就是指用户可以齐心协力,通过不断地和网站互动,使 自己的推荐列表能够不断过滤掉自己不感兴趣的物品,从而...

734
zhuanxu

神经网络基础知识

我们可以调整参数/权重W,使得映射的结果和实际类别吻合,而损失函数用来来衡量吻合度。

672
zhuanxu

cs224d-第二课-word2vec

首先我想说下为什么会去学习cs224d,原先我一直是做工程的,做了大概3年,产品做了好多,但是大多不幸夭折了,上线没多久就下线,最后实在是经受不住心灵的折磨,转...

591
zhuanxu

第2章:spring 依赖第2章:spring 依赖

另外在声明具体的值上,我们可以是 Straight values(primitives, Strings),也可以使idref元素,或者是对其他bean的指向,...

633
zhuanxu

第1章: Spring 基础第1章:Spring 基础

为了体验spring,所以建立的是一个 maven quick start 的项目,建立后的 pom.xml 配置如下:

684
zhuanxu

Kaggle初探--房价预测案例之数据分析

本文数据来源kaggle的House Prices: Advanced Regression Techniques大赛。

863
zhuanxu

Kaggle初探--房价预测案例之模型建立

本文数据来源kaggle的House Prices: Advanced Regression Techniques大赛。

772
zhuanxu

ElasticSearch学习笔记2

假设现在我们有3个node,6个shard,则每个node上分配2个shard,此时最多容忍1台机器挂了,因为2台机器有4个shard,能存放下3个primar...

522
zhuanxu

ElasticSearch学习笔记1

先看第一个问题,如果我们用数据来实现搜索功能,可能的语句就是对 string 建立索引,或者直接 like 关键字。带来的问题是什么?

432
zhuanxu

C++奇淫巧技之SFINAE

SFINAE 技术,即匹配失败不是错误,英文Substitution Failure Is Not An Error,其作用是当我们在进行模板特化的时候,会去选...

543
zhuanxu

TensorFlow 学前班

本文我参加Udacity的深度学习基石课程的学习的第3周总结,主题是在学习 TensorFlow 之前,先自己做一个miniflow,通过本周的学习,对于Te...

592

扫码关注云+社区