首页
学习
活动
专区
工具
TVP
发布

信数据得永生

专栏作者
1385
文章
1544461
阅读量
53
订阅数
SciPyCon 2018 sklearn 教程(下)
在前面的章节和笔记本中,我们将数据集分为两部分:训练集和测试集。 我们使用训练集来拟合我们的模型,并且我们使用测试集来评估其泛化能力 - 它对新的,没见过的数据的表现情况。
ApacheCN_飞龙
2022-12-02
8590
计算与推断思维 十三、预测
数据科学的一个重要方面,是发现数据可以告诉我们什么未来的事情。气候和污染的数据说了几十年内温度的什么事情?根据一个人的互联网个人信息,哪些网站可能会让他感兴趣?病人的病史如何用来判断他或她对治疗的反应?
ApacheCN_飞龙
2022-12-01
2.3K0
写给人类的机器学习 四、神经网络和深度学习
使用深度学习,我们仍然是习得一个函数f,将输入X映射为输出Y,并使测试数据上的损失最小,就像我们之前那样。回忆一下,在 2.1 节监督学习中,我们的初始“问题陈述”:
ApacheCN_飞龙
2022-12-01
3360
Python 数据科学手册 5.7 支持向量机
支持向量机(SVM)是一种特别强大且灵活的监督算法,用于分类和回归。 在本节中,我们将探索支持向量机背后的直觉,及其在分类问题中的应用。
ApacheCN_飞龙
2022-12-01
9050
Python 数据科学手册 5.6 线性回归
就像朴素贝叶斯(之前在朴素贝叶斯分类中讨论)是分类任务的一个很好的起点,线性回归模型是回归任务的一个很好的起点。 这些模型受欢迎,因为它们可以快速拟合,并且非常可解释。 你可能熟悉线性回归模型的最简单形式(即使用直线拟合数据),但是可以扩展这些模型,来建模更复杂的数据行为。
ApacheCN_飞龙
2022-12-01
5520
Scikit-learn 秘籍 第五章 模型后处理
这个秘籍中,我们会创建交叉验证,它可能是最重要的模型后处理验证练习。我们会在这个秘籍中讨论 k-fold 交叉验证。有几种交叉验证的种类,每个都有不同的随机化模式。K-fold 可能是一种最熟知的随机化模式。
ApacheCN_飞龙
2022-12-01
4140
Scikit-learn 秘籍 第三章 使用距离向量构建模型
这一章中,我们会涉及到聚类。聚类通常和非监督技巧组合到一起。这些技巧假设我们不知道结果变量。这会使结果模糊,以及实践客观。但是,聚类十分有用。我们会看到,我们可以使用聚类,将我们的估计在监督设置中“本地化”。这可能就是聚类非常高效的原因。它可以处理很大范围的情况,通常,结果也不怎么正常。
ApacheCN_飞龙
2022-12-01
7860
ApacheCN 深度学习译文集 2020.9
协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 不要担心自己的形象,只关心如何实现目标。——《原则》,生活原则 2.3.c 在线阅读 ApacheCN 面试求职交流群 724187166 ApacheCN 学习资源 目录 TensorFlow 1.x 深度学习秘籍 零、前言 一、TensorFlow 简介 二、回归 三、神经网络:感知器 四、卷积神经网络 五、高级卷积神经网络 六、循环神经网络 七、无监督学习 八、自编码器 九、强化学习 十、移动计算 十一、生成模型和 CapsNet
ApacheCN_飞龙
2020-09-29
1.3K0
DeepLearningAI 学习笔记 1.2 logistic 回归
logistic 回归属于广义线性回归。所谓广义线性回归,就是在线性回归的模型上加一些东西,使其适应不同的任务。
ApacheCN_飞龙
2019-02-15
3880
TensorFlow HOWTO 1.1 线性回归
导入数据,并进行预处理。我们使用鸢尾花数据集中的后两个品种,根据萼片长度预测花瓣长度。
ApacheCN_飞龙
2019-02-15
4460
【番外】线性回归和逻辑回归的 MLE 视角
y=z+ϵ, ϵ∼N(0,σ2)y = z + \epsilon, \, \epsilon \sim N(0, \sigma^2)y=z+ϵ,ϵ∼N(0,σ2)
ApacheCN_飞龙
2019-02-15
4570
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档