暂无搜索历史
XGBoost是经典的提升树学习框架,其配套论文和PPT分享也相当经典,本文简单梳理其思路,原文见XGBoost原理简介。
Linear/Logistic/Softmax Regression是常见的机器学习模型,且都是广义线性模型的一种,有诸多相似点,详细对比之。原文见Linear...
所以实际模型中0-1 Loss用的很少,后续介绍的误差,多数可看做0-1 Loss的一个上界。
algo-decision-tree-conditional-probability
Pandas是Python数据科学生态中重要的基础成员,功能强大,用法灵活,简单记录之。
Andrew CS230: Deep Learning课程笔记。Logistic Regression with a Neural Network mindse...
开公众号啦,分享读书心得,欢迎一起交流成长。 qr-code.png 1. Import the numpy package under the name n...
MATLAB, and pyplot, have the concept of the current figure and the current axes....
发现一个很怪的id: )chailed (104: Connection reset by pee,确认一下是不是在.
利用Pandas模块直接获取雅虎财经数据,方便之极。注意把官方提示把from pandas.io import data, wb替换为from pandas_d...
经常用match = re.search(pat, str)的形式。因为有可能匹配不到,所以re.search()后面一般用if statement。
简单的理解,我有一组数据,比如每个数据都是n维向量,那么我们可以在n维空间表示这个数据,这些数据都有对应的标签值,也就是我们感兴趣的预测变量。那么当我们接到一个...
map()函数接收两个参数,一个是函数,一个是序列,map将传入的函数依次作用到序列的每个元素,并把结果作为新的list返回,比循环更简洁,更易读。
Spark可以从本地CSV,HDFS以及Hive读取结构化数据,直接解析为DataFrame,进行后续分析。
set是无序unique值的集合,常用来去重,检验membership等。set类似一个词典,但只有键key,没有值value,好多操作也类似,但不支持索引,切...
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。
read_html依赖一些库,比如html5lib,lxml,beautiful soup等,如果没有安装会报错。
原文见Mac必备软件 - yongle 。Mac上有很多优秀的软件,可以极大地提升效率和工作体验。
NumPy是Python数据科学生态中重要的基础成员,其中有几个概念比较tricky,简单记录之。更佳阅读体验,可移步NumPy核心概念。
算法工作中,经常要对模型进行评估,由此衍生出很多指标。比如Accuracy、Precision、Recall、F1-score、AUC等等。准确理解各指标的内涵...
暂未填写公司和职称
暂未填写个人简介
暂未填写学校和专业
暂未填写个人网址