小萌哥

LV0
发表了文章

Python加速运行技巧

Python 是一种脚本语言,相比 C/C++ 这样的编译语言,在效率和性能方面存在一些不足。但是,有很多时候,Python 的效率并没有想象中的那么夸张。本文...

小萌哥
发表了文章

特征工程的黑色艺术

想象一下,当今社会备受瞩目的人工智能和数据挖掘算法工程师每天大部分时间都在做什么呢?是花大量时间手推公式,还是思考各种trick对算法调参,还是一遍遍清洗数据和...

小萌哥
发表了文章

算法工程师-SQL进阶:温柔的陷阱-NULL

我们以往遇到的编程语言基本都是基于二值逻辑的,即逻辑真值只有true和false两个。而 SQL 语言则采用一种特殊的逻辑体系——三值逻辑,逻辑真值除了true...

小萌哥
发表了文章

算法工程师-SQL进阶:神奇的自连接与子查询

自连接与子查询是SQL中非常重要的两项技术,自连接是针对相同的表的联结方法,是SQL语言面向集合编程思想的集中体现,而子查询有很多变式,关联子查询技术是在实际中...

小萌哥
发表了文章

算法工程师-SQL进阶:集合之间的较量

集合在数据库领域表示记录的集合。SQL是一门面向集合的语言,四则运算里的和、差、积已经加入到标准SQL,但由于其标准化进程比较缓慢,一些集合运算在主流的数据库如...

小萌哥
发表了文章

算法工程师-SQL进阶:强大的Case表达式

相信大家对SQL都非常熟悉了,可能有些小伙伴会有疑问,算法工程师不是跑模型的吗?还需要学SQL?其实,很有必要!原因大概有以下几点吧:

小萌哥
发表了文章

你的模型需要解释(二)

广义上的可解释性指在我们需要了解或解决一件事情的时候,我们可以获得我们所需要的足够的可以理解的信息。比如我们在调试bug的时候,需要通过变量审查和日志信息定位到...

小萌哥
发表了文章

协同过滤推荐算法

相信大家对推荐系统已经很熟悉了,它通过分析用户的历史行为,挖掘用户的兴趣爱好,预测并推荐给用户其接下来有可能感兴趣的事物,例如商品推荐、音乐推荐、新闻以及最近很...

小萌哥
发表了文章

Python实现6种排序算法,快排只有6行?

小萌哥
发表了文章

主成分分析(PCA)

内容来源:https://zhuanlan.zhihu.com/p/36318506?utm_source=wechat_session&utm_medium=...

小萌哥
发表了文章

探索性数据分析,Seaborn必会的几种图

探索性数据分析(Exploratory Data Analysis,简称EDA),是指对已有的数据在尽量少的先验假设下进行探索,通过作图、制表、方程拟合、计算特...

小萌哥
发表了文章

推荐系统冷启动

冷启动是推荐系统的重要挑战之一。那么,什么是冷启动?如何设计一个好的冷启动方案?本文将主要从以下7个方面给大家讲清楚这些问题:

小萌哥
发表了文章

特征工程(下 )- 特征评估

作者会在本文中结合自己在视频推荐方面的工作经验,着重从工程实现方面,讲述如何对特征进行评估的问题。下文中,我们首先会厘清“特征评估”的概念,然后讲述特征评估的标...

小萌哥
发表了文章

特征工程(中)- 特征表达

从一个完整的机器学习任务来看,在选择完特征之后,特征表达的任务就是要将一个个的样本抽象成数值向量,供机器学习模型使用。因此,特征表达就要兼顾特征属性和模型需求这...

小萌哥
发表了文章

特征工程(上)- 特征选择

构建特征是一个很大的工程,总体来讲包括“特征选择”、“特征表达”和“特征评估”3个部分。我们也按这3个部分,并结合自己的具体实践,用3篇文章来和大家聊一下特征工...

小萌哥
发表了文章

盘点 | Python自带的那些数据集

在学习Pandas透视表的时候,大家应该注意到,我们使用的案例数据"泰坦尼克号"来自于seaborn自带的在线数据库,我们可以通过seaborn提供的函数loa...

小萌哥
发表了文章

Python面试必刷题系列(2)

python提供了将变量或值从一种类型转换成另一种类型的内置函数。比如int函数能够将符合数学格式数字型字符串转换成整数。否则,返回错误信息。

小萌哥
发表了文章

海量数据面试题总结(2)-BitMap

所谓BitMap就是用一个bit位来标记某个元素所对应的value,而key即是该元素,由于BitMap使用了bit位来存储数据,因此可以大大节省存储空间。

小萌哥
发表了文章

海量数据面试题总结(1)-Hash映射+Hash统计+归并排序

首先考虑是否需要将大文件分成小文件,针对数据太大,内存受限,只能是将大文件化成小文件(取模映射);

小萌哥
发表了文章

机器学习必刷题-手撕推导篇(2):BP算法推导

本文是【机器学习必刷题-手撕推导篇】第2篇文章,主要介绍BP反向传播算法原理,纯纯的干货,目的是面试刷题能够快速回忆,算法详细介绍参考文末链接。

小萌哥

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券