首页
学习
活动
专区
工具
TVP
发布

进击的程序猿

专栏作者
79
文章
70849
阅读量
18
订阅数
c++奇淫技巧之完美转发
我们猜下,上面会输出什么。 ===============================留你思考=================================
zhuanxu
2020-07-21
5080
造轮子系列之Protobuf
作为一个程序猿,对造轮子这事情可以说是情有独钟,几乎程序猿内心都存在一个梦想是去将开源的技术都实现一遍,所有从本篇开始,我会开一个造轮子系列。
zhuanxu
2019-05-15
8060
EM 算法的 9 重境界之第3重三个硬币GMM模型参考
之前写过一篇文章EM 算法的 9 重境界之前两重,里面讲述了em算法的过程,本文是对前一篇文章的补充。
zhuanxu
2018-09-07
7530
xgboost 库使用入门
本文 github 地址:1-1 基本模型调用. ipynb,里面会记录自己kaggle大赛中的内容,欢迎start关注。
zhuanxu
2018-09-07
1.5K0
贝叶斯推断:Metropolis-Hastings 采样
前面一篇文章贝叶斯统计:初学指南介绍了最简单的 Metropolis 采样方法,本文将介绍另一种采样 Metropolis-Hastings ,并且会对前文介绍的例子给出证明,为什么 Metropolis 采样work。
zhuanxu
2018-09-07
1.2K0
进击算法:字符串匹配的 BM 算法
各种文本编辑器的 "查找" 功能(Ctrl+F),大多采用 Boyer-Moore 算法。
zhuanxu
2018-09-07
1.6K0
经典检索算法:BM25原理
bm25 是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法,再用简单的话来描述下bm25算法:我们有一个query和一批文档Ds,现在要计算query和每篇文档D之间的相关性分数,我们的做法是,先对query进行切分,得到单词$q_i$,然后单词的分数由3部分组成:
zhuanxu
2018-09-07
6.1K0
基于隐变量的推荐模型基于隐变量的推荐模型
上一篇介绍了协同过滤,其重点就是在人-物品矩阵上,其中心思想是去对人或者物品进行聚类,从而找到相似人或者相似物品,用群体的智慧为个人进行推荐,但是,这种近邻模型也存在好多问题:
zhuanxu
2018-09-07
1.6K0
贝叶斯统计:初学指南
在statistical inference上,主要有两派:频率学派和贝叶斯学派。
zhuanxu
2018-09-07
5633
实战:基于 docker 的 HA-hadoop 集群搭建
Hadoop的master和slave分别运行在不同的Docker容器中,其中hadoop-master容器中运行NameNode和ResourceManager,hadoop-slave容器中运行DataNode和NodeManager。NameNode和DataNode是Hadoop分布式文件系统HDFS的组件,负责储存输入以及输出数据,而ResourceManager和NodeManager是Hadoop集群资源管理系统YARN的组件,负责CPU和内存资源的调度。
zhuanxu
2018-09-07
3.4K1
卷积神经网络基础知识
传统的机器学习大多数都需要我们手工去建立feature,这种方法建立出来的feature,大多都是有物理意义的,所以算法最终好不好,就看你特征工程做的怎么样!
zhuanxu
2018-09-07
5090
推荐系统之用户行为分析
基于用户行为的推荐,在学术界名为协同过滤算法。 协同过滤就是指用户可以齐心协力,通过不断地和网站互动,使 自己的推荐列表能够不断过滤掉自己不感兴趣的物品,从而越来越满足自己的需求。
zhuanxu
2018-09-07
2.9K0
神经网络基础知识
我们可以调整参数/权重W,使得映射的结果和实际类别吻合,而损失函数用来来衡量吻合度。
zhuanxu
2018-09-07
2800
cs224d-第二课-word2vec
首先我想说下为什么会去学习cs224d,原先我一直是做工程的,做了大概3年,产品做了好多,但是大多不幸夭折了,上线没多久就下线,最后实在是经受不住心灵的折磨,转行想做大数据,机器学习的,前不久自己学习完了Udacity的深度学习,课程挺好,但是在实际工作中,发现课程中的数据都是给你准备好的,实践中哪来这么多好的数据,只能自己去通过各种手段搞数据,苦不堪言。在找数据的过程中,发现做多的数据还是文本数据,不懂个nlp怎么处理呢,于是就来学习cs224d这门课程,希望在学习过程中能快速将课程所学应用到工作中,fighting!
zhuanxu
2018-08-23
6570
第2章:spring 依赖第2章:spring 依赖
另外在声明具体的值上,我们可以是 Straight values(primitives, Strings),也可以使idref元素,或者是对其他bean的指向,下面分别举例子:
zhuanxu
2018-08-23
2550
第1章: Spring 基础第1章:Spring 基础
为了体验spring,所以建立的是一个 maven quick start 的项目,建立后的 pom.xml 配置如下:
zhuanxu
2018-08-23
2190
Kaggle初探--房价预测案例之数据分析
本文数据来源kaggle的House Prices: Advanced Regression Techniques大赛。
zhuanxu
2018-08-23
1.6K0
Kaggle初探--房价预测案例之模型建立
本文数据来源kaggle的House Prices: Advanced Regression Techniques大赛。
zhuanxu
2018-08-23
2.7K0
ElasticSearch学习笔记2
假设现在我们有3个node,6个shard,则每个node上分配2个shard,此时最多容忍1台机器挂了,因为2台机器有4个shard,能存放下3个primary shard。此时如果我们进行水平扩容,将node变为6个,则每个node有1个shard,每个shard能使用的IO/CPU/Memory资源更多,性能会更好。 另外假设我们现在还是3个node,但是将shard变为9个,则每个node有3个shard,此时虽然每个shard使用的资源少了,但是容错性提高了,最多能容忍2个node故障,因为剩余的1个node还有3个shard,能包含所有数据。
zhuanxu
2018-08-23
2430
ElasticSearch学习笔记1
先看第一个问题,如果我们用数据来实现搜索功能,可能的语句就是对 string 建立索引,或者直接 like 关键字。带来的问题是什么?
zhuanxu
2018-08-23
3370
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
热点技术征文第五期
新风口Sora来袭,普通人该如何把握机会?
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档