首页
学习
活动
专区
工具
TVP
发布

进击的程序猿

专栏作者
79
文章
71998
阅读量
18
订阅数
xgboost 库使用入门
本文 github 地址:1-1 基本模型调用. ipynb,里面会记录自己kaggle大赛中的内容,欢迎start关注。
zhuanxu
2018-09-07
1.5K0
贝叶斯推断:Metropolis-Hastings 采样
前面一篇文章贝叶斯统计:初学指南介绍了最简单的 Metropolis 采样方法,本文将介绍另一种采样 Metropolis-Hastings ,并且会对前文介绍的例子给出证明,为什么 Metropolis 采样work。
zhuanxu
2018-09-07
1.2K0
进击算法:字符串匹配的 BM 算法
各种文本编辑器的 "查找" 功能(Ctrl+F),大多采用 Boyer-Moore 算法。
zhuanxu
2018-09-07
1.6K0
经典检索算法:BM25原理
bm25 是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法,再用简单的话来描述下bm25算法:我们有一个query和一批文档Ds,现在要计算query和每篇文档D之间的相关性分数,我们的做法是,先对query进行切分,得到单词$q_i$,然后单词的分数由3部分组成:
zhuanxu
2018-09-07
6.3K0
基于隐变量的推荐模型基于隐变量的推荐模型
上一篇介绍了协同过滤,其重点就是在人-物品矩阵上,其中心思想是去对人或者物品进行聚类,从而找到相似人或者相似物品,用群体的智慧为个人进行推荐,但是,这种近邻模型也存在好多问题:
zhuanxu
2018-09-07
1.6K0
贝叶斯统计:初学指南
在statistical inference上,主要有两派:频率学派和贝叶斯学派。
zhuanxu
2018-09-07
5773
第2章:spring 依赖第2章:spring 依赖
另外在声明具体的值上,我们可以是 Straight values(primitives, Strings),也可以使idref元素,或者是对其他bean的指向,下面分别举例子:
zhuanxu
2018-08-23
2590
Kaggle初探--房价预测案例之数据分析
本文数据来源kaggle的House Prices: Advanced Regression Techniques大赛。
zhuanxu
2018-08-23
1.7K0
Kaggle初探--房价预测案例之模型建立
本文数据来源kaggle的House Prices: Advanced Regression Techniques大赛。
zhuanxu
2018-08-23
2.8K0
ElasticSearch学习笔记2
假设现在我们有3个node,6个shard,则每个node上分配2个shard,此时最多容忍1台机器挂了,因为2台机器有4个shard,能存放下3个primary shard。此时如果我们进行水平扩容,将node变为6个,则每个node有1个shard,每个shard能使用的IO/CPU/Memory资源更多,性能会更好。 另外假设我们现在还是3个node,但是将shard变为9个,则每个node有3个shard,此时虽然每个shard使用的资源少了,但是容错性提高了,最多能容忍2个node故障,因为剩余的1个node还有3个shard,能包含所有数据。
zhuanxu
2018-08-23
2490
ElasticSearch学习笔记1
先看第一个问题,如果我们用数据来实现搜索功能,可能的语句就是对 string 建立索引,或者直接 like 关键字。带来的问题是什么?
zhuanxu
2018-08-23
3460
C++奇淫巧技之SFINAE
SFINAE 技术,即匹配失败不是错误,英文Substitution Failure Is Not An Error,其作用是当我们在进行模板特化的时候,会去选择那个正确的模板,避免失败
zhuanxu
2018-08-23
5080
如何生成一幅艺术作品
假设我们有一幅大师的画作了,我们怎么能够提取出“大师作品”中的纹理和颜色这些细节让我们的计算机知道,而不是只看到画的整体造型呢?
zhuanxu
2018-08-23
4460
图数据库奥秘初探
主要参考书籍:graph database 近期工作中要做一些图谱的应用,于是这几天就调研了下图数据库,最后就有了本文。ps:本人第一次做图谱相关的应用,具体怎么构建也还不清楚,大家有什么资料、建议欢迎私信、留言的。
zhuanxu
2018-08-23
7930
神经网络实践之情感分类神经网络实践之情感分类
最近报名了Udacity的深度学习基石,这是第二周的课程,主要是介绍了运用神经网络进行情感分类,课程中是对英文进行了分类,我这边改为了中文。 首先是中文切词,使用的是结巴。 本文notebook地址是:https://github.com/zhuanxuhit/nd101/blob/master/1.Intro_to_Deep_Learning/3.How_to_Do_Sentiment_Analysis/Words2Vec.ipynb
zhuanxu
2018-08-23
9260
doctrine 缘来 之 初次使用
本系列是读php data persistence with doctrine2 orm的笔记,本文是第二篇:doctrine的使用
zhuanxu
2018-08-23
6970
袖珍分布式系统(四)
本文是Distributed systems for fun and profit的第四部分,本文是阅读该文后的一些记录。
zhuanxu
2018-08-23
3380
分布式计算中的8个谬论
Eight-Fallacies-of-Distributed-Computing-Tech-Talk
zhuanxu
2018-08-23
4900
线性回归背后的数学
本文是YouTube上视频How to Do Linear Regression the Right Way笔记
zhuanxu
2018-08-23
4960
袖珍分布式系统(三)
本文是Distributed systems for fun and profit的第三部分,本文是阅读该文后的一些记录。
zhuanxu
2018-08-23
5020
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档