信数据得永生-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

信数据得永生

专栏成员

1757

文章

1733172

阅读量

60

订阅数

数据科学和人工智能技术笔记十八、Keras

keras scikit-learn 机器学习深度学习人工智能

在 Keras 中，我们可以通过在我们的网络架构中添加Dropout层来实现丢弃。每个Dropout层将丢弃每批中的一定数量的上一层单元，它是由用户定义的超参数。请记住，在 Keras 中，输入层被假定为第一层，而不是使用add添加。因此，如果我们想要将丢弃添加到输入层，我们在其中添加的图层是一个丢弃层。该层包含输入层单元的比例，即0.2和input_shape，用于定义观测数据的形状。接下来，在每个隐藏层之后添加一个带有0.5的丢弃层。

ApacheCN_飞龙

2022-12-02

2.4K0

数据科学和人工智能技术笔记十五、支持向量机

scikit-learn 机器学习神经网络深度学习人工智能

SVC 使用超平面来创建决策区域，不会自然输出观察是某一类成员的概率估计。但是，我们实际上可以通过一些技巧输出校准的类概率。在 SVC 中，可以使用 Platt 缩放，其中首先训练 SVC，然后训练单独的交叉验证逻辑回归来将 SVC 输出映射到概率：

ApacheCN_飞龙

2022-12-02

1K0

数据科学和人工智能技术笔记十四、K 最近邻

scikit-learn 机器学习神经网络深度学习人工智能

: 研究者指定的正数。 K 表示最接近特定观测的观测数，它定义了“邻域”。例如，K = 2意味着每个观测都有一个邻域，包含最接近它的另外两个观测。

ApacheCN_飞龙

2022-12-02

7100

数据科学和人工智能技术笔记十一、线性回归

scikit-learn 机器学习神经网络深度学习人工智能

表示两者之间的交互。使用 scikit-learn 的PolynomialFeatures，来为所有特征组合创建交互术项会很有用。然后，我们可以使用模型选择策略，来识别产生最佳模型的特征和交互项的组合。

ApacheCN_飞龙

2022-12-02

1.1K0

数据科学和人工智能技术笔记十二、逻辑回归

正则表达式 scikit-learn 机器学习神经网络深度学习

scikit-learn 的LogisticRegressionCV方法包含一个参数C。如果提供了一个列表，C是可供选择的候选超参数值。如果提供了一个整数，C的这么多个候选值，将从 0.0001 和 10000 之间的对数标度（C的合理值范围）中提取。

ApacheCN_飞龙

2022-12-02

7350

数据科学和人工智能技术笔记九、模型验证

腾讯云测试服务 scikit-learn 机器学习神经网络深度学习

在本教程中，我们将使用着名的鸢尾花数据集。鸢尾花数据包含 150 种鸢尾花的四个测量值，以及它的品种。我们将使用支持向量分类器来预测鸢尾花的品种。

ApacheCN_飞龙

2022-12-02

9410

数据科学和人工智能技术笔记二、数据准备

scikit-learn 机器学习神经网络深度学习人工智能

波士顿住房数据集是 20 世纪 70 年代的着名数据集。它包含506个关于波士顿周边房价的观测。它通常用于回归示例，包含 15 个特征。

ApacheCN_飞龙

2022-12-02

3080

SciPyCon 2018 sklearn 教程（上）

数据库数据结构 sql 机器学习 scikit-learn

机器学习是自动从数据中提取知识的过程，通常是为了预测新的，看不见的数据。一个典型的例子是垃圾邮件过滤器，用户将传入的邮件标记为垃圾邮件或非垃圾邮件。然后，机器学习算法从数据“学习”预测模型，数据区分垃圾邮件和普通电子邮件。该模型可以预测新电子邮件是否是垃圾邮件。

ApacheCN_飞龙

2022-12-02

1.2K0

Python 数据科学手册 5.8 决策树和随机森林

决策树 scikit-learn 机器学习神经网络深度学习

之前，我们深入研究了简单的生成分类器（见朴素贝叶斯分类）和强大的辨别分类器（参见支持向量机）。这里我们来看看另一个强大的算法的动机 - 一种称为随机森林的非参数算法。随机森林是组合方法的一个例子，这意味着它依赖于更简单估计器的整体聚合结果。这种组合方法的结果令人惊讶，总和可以大于部分：即，多个估器中的多数表决最终可能比执行表决的任何个体的估计更好！我们将在以下部分中看到这个例子。我们从标准导入开始：

ApacheCN_飞龙

2022-12-01

3520

Python 数据科学手册 5.7 支持向量机

线性回归人脸识别 scikit-learn 机器学习

支持向量机（SVM）是一种特别强大且灵活的监督算法，用于分类和回归。在本节中，我们将探索支持向量机背后的直觉，及其在分类问题中的应用。

ApacheCN_飞龙

2022-12-01

9310

Python 数据科学手册 5.6 线性回归

线性回归 scikit-learn 机器学习神经网络深度学习

就像朴素贝叶斯（之前在朴素贝叶斯分类中讨论）是分类任务的一个很好的起点，线性回归模型是回归任务的一个很好的起点。这些模型受欢迎，因为它们可以快速拟合，并且非常可解释。你可能熟悉线性回归模型的最简单形式（即使用直线拟合数据），但是可以扩展这些模型，来建模更复杂的数据行为。

ApacheCN_飞龙

2022-12-01

5820

Python 数据科学手册 5.2 Scikit-Learn 简介

scikit-learn api 聚类算法编程算法监督学习

有几个 Python 库提供一系列机器学习算法的实现。最著名的是 Scikit-Learn，一个提供大量常见算法的高效版本的软件包。 Scikit-Learn 的特点是简洁，统一，流线型的 API，以及非常实用和完整的在线文档。这种一致性的好处是，一旦了解了 Scikit-Learn 中一种类型的模型的基本用法和语法，切换到新的模型或算法就非常简单。

ApacheCN_飞龙

2022-12-01

3490

Scikit-learn 秘籍第三章使用距离向量构建模型

线性回归图像处理 scikit-learn 机器学习神经网络

这一章中，我们会涉及到聚类。聚类通常和非监督技巧组合到一起。这些技巧假设我们不知道结果变量。这会使结果模糊，以及实践客观。但是，聚类十分有用。我们会看到，我们可以使用聚类，将我们的估计在监督设置中“本地化”。这可能就是聚类非常高效的原因。它可以处理很大范围的情况，通常，结果也不怎么正常。

ApacheCN_飞龙

2022-12-01

8650

数据科学 IPython 笔记本 8.6 可视化误差

matlab numpy scikit-learn api

对于任何科学测量，误差的准确计算几乎与数字本身的准确报告一样重要，甚至更重要。例如，假设我正在使用一些天体物理观测来估计哈勃常数，即宇宙膨胀率的局部测量值。我知道目前的文献显示，它是大约71 (km/s)/Mpc，我用我的方法测得的值为74 (km/s)/Mpc。这些值是否一致？鉴于此信息，唯一正确的答案是：没有办法知道。

ApacheCN_飞龙

2022-05-07

2850

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态