腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >Python中的这条random.uniform行到底是做什么的？

问Python中的这条random.uniform行到底是做什么的？
EN

Stack Overflow用户

提问于 2015-12-06 01:15:28

回答 3查看 813关注 0票数 1

我正在跟踪一个关于在Python中使用随机森林的安德鲁·克罗斯的教程。我可以很好地运行代码，并且在很大程度上我理解输出。然而，我不清楚这一行到底是做什么的：

df['is_train'] = np.random.uniform(0, 1, len(df)) <= .75

我知道它“在0到1之间创建了一个(随机)均匀分布，并将3/4的数据分配到训练子集中。”然而，训练子集并不总是子集的3/4。有时更小，有时更大。那么，是否选择了一个随机大小的子集，大约为75%？为什么不让它总是75%呢？

random-forest

python

random

游戏加速分发场景解决方案

帮助解决游戏内的卡顿和高延时现象，为玩家提供更好的游戏体验

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-12-06 01:27:23

np.random.uniform(0, 1, len(df))创建一个len(df)随机数数组。

然后，<= .75创建另一个数组，其中包含数字匹配条件的True，以及其他地方的False。

然后，代码在找到True的索引中使用数据。因为随机分布是..。嗯，随机的，你不会得到精确的75%的数值。

票数 4

Stack Overflow用户

发布于 2015-12-06 01:32:05

它不将数据的3/4分配到训练子集中。

它将数据在训练子集中的概率指定为3/4。

示例：

>>> import numpy as np
>>> sum(np.random.uniform(0, 1, 10) < .75)
8
>>> sum(np.random.uniform(0, 1, 10) < .75)
10
>>> sum(np.random.uniform(0, 1, 10) < .75)
7

80%的数据在第一个示例中的训练子集中。
100% -在第二次
70%

平均而言，应该是75%。

票数 4

Stack Overflow用户

发布于 2015-12-06 01:38:43

如果您想更严格地随机选择一个训练集(总是接近75% )，可以使用如下代码：

d = np.random.uniform(0, 1, 1000)
p = np.percentile(d, 75)

print(np.sum(d <= p))   # 750
print(np.sum(d <= .75)) # 745

在你的例子中：

d = np.random.uniform(0, 1, len(df))
p = np.percentile(d, 75)
df['is_train'] = d <= p

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34115808

复制

float到底是干什么的？

css

划重点 float的真正用途不是我们平时用于将同模块下的元素并行显示，也不是为了实现将元素放在某一特殊位置时使用！ float正真的作用是！各位老爷可以去考证！float的真正作用是叫做：是元素具有包裹性，最直观的体现效果就是我们world里面常用文字环绕图片

星尘的一个朋友

2020/11/25

9180

java中volatile关键字到底是干什么的？

java

我们先简要了解一下java虚拟机的内存模型。就像数据从物理内存拷贝到cpu高速缓存，进行操作完，再把数据返回到内存一样，为了屏蔽CPU高速缓存和内存复杂细节且赢得跨平台的效果，java把所有的变量都存在主存（相当于物理内存）当中，每个线程都有自己的工作内存（相当于CPU高速缓存）。线程在自己的工作内存做操作，不能直接对主存进行操作，最后把结果返回到主存。如果一个变量有volatile（易变的意思）修饰词，这意味着当有一个线程修改了这个变量，系统会把工作内存当中的变化强制立刻反应在主存当中。其他线程要想读这个变量，也会被强迫读变化了的新值。volatile其实就保证了此变量无论怎么变，任何线程看都是最新的。当两个线程，根据一个共同的信号，做互动时，一定要加volatile，保证这个信号是最新的。

马克java社区

2021/04/26

4910

java的反射机制到底是做什么的？

打包 java spring jvm

通过wiki百科可知：在计算机学中，反射（英语：reflection）是指计算机程序在运行时（runtime）可以访问、检测和修改它本身状态或行为的一种能力。[1]用比喻来说，反射就是程序在运行的时候能够“观察”并且修改自己的行为。

袁新栋-jeff.yuan

2020/08/26

6340

java中接口到底是干什么的，怎么用，深入剖析。

java

通过以上的学习，我们知道，所有定义在接口中的常量都默认为public、static和final。所有定义在接口中的方法默认为public和abstract。马克-to-win：当时Sun公司为什么要把java的接口设计发明成这样？

马克java社区

2021/03/31

5080

运维工作到底是做什么的?

运维数据库 sql 数据备份 cdn

互联网运维工作，以服务为中心，以稳定、安全、高效为三个基本点，确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。

用户6543014

2019/10/25

2.8K0

DevOps工程师到底是做什么的？

devops 自动化运维 cci 持续集成腾讯云测试服务

兔云小新LM

2019/07/24

1.6K0

算法工程师到底是做什么的？

编程算法监督学习无监督学习强化学习机器学习

前者如实现一个功能、搭建一个服务、实现一种展现交互方式等。更关注的是如何实现功能，如何对于各种复杂甚至小众的场景都不出错。互联网中典型的后端、前端、平台、网络工程师的主要工作是这一类。

大数据文摘

2021/02/08

2K0

TIDB 的大脑 PD 到底是干什么的

数据库 sql 分布式 TDSQL MySQL 版压力测试

PD Server --- placement driver 是管理整体TIDB 元数据的功能模块，为分布式系统分配全局统一的事务ID, 存储整体TIKV分布式数据库的实时元数据信息,和TIDB的数据库整体的结构. 提供TIDB 监控管理的UI 界面. 除此以外PD 还上报整体TIKV数据存储的分布情况,以及后面根据相关的情况来调整数据的在多个TIKV节点的分布. PD 本身需要基数节点部署,并且PD包含了ETCD分布式,保证PD的高可用.

AustinDatabases

2021/09/24

2.2K0

Python 中的数字到底是什么？

python https 网络安全

花下猫语：在 Python 中，不同类型的数字可以直接做算术运算，并不需要作显式的类型转换。但是，它的“隐式类型转换”可能跟其它语言不同，因为 Python 中的数字是一种特殊的对象，派生自同一个抽象基类。在上一篇文章中，我们讨论到了 Python 数字的运算，然后我想探究“Python 的数字对象到底是什么”的话题，所以就翻译了这篇 PEP，希望对你也有所帮助。

Python猫

2020/09/14

1K0

这些「神秘」团队到底是做什么的？| PingCAP 招聘季

分布式 TDSQL MySQL 版数据库 sql 开源

本篇将带大家速览我司各个研发团队的定位和分工，并回答一个热门问题「在 PingCAP 工作是什么样的体验？」

PingCAP

2019/03/04

1.3K0

我到底是被如何骗上“人工智能”这条路？

人工智能自动化

今天幂次妹讲的是4个关于“人工智能”的故事，来看看那么多人为什么选择“人工智能”。

昱良

2018/08/20

2700

真实！数据分析师到底是做什么的？

数据分析编程算法大数据

现在有关数据分析的文章满天飞，很多小伙伴好奇：到底数据分析是做什么的？今天小熊妹给大家捋一捋，就拿几个大家常问的问题举例吧。

码工小熊

2021/08/19

6660

PostgreSQL Postgres-XL GTM 到底是干什么的

云数据库 postgresql postgresql http 网络安全 TDSQL MySQL 版

GTM 提供分布式数据库中所有事务的GXID,并且这些GXID 是唯一的并且是有序的,在事务的开始和结束这段时间保证来控制所有节点中的tuple的可见性.这个功能称之为global snapshot. 并且保证事务的一致性.

AustinDatabases

2021/09/02

9970

在Mysql中CHAR和VARCHAR如何选择？给定的长度到底是用来干什么的？

存储数据库管理数据库 sql 编程算法

在MySQL数据库中，用的最多的字符型数据类型就是Varchar和Char.。这两种数据类型虽然都是用来存放字符型数据，但是无论从结构还是从数据的保存方式来看，两者相差很大。而且其具体的实现方式，还依赖与存储引擎。我这里就以大家最常用的MYISAM存储引擎为例，谈谈这两种数据类型的差异。在后续建议中，也是针对这种存储类型而言的。

袁新栋-jeff.yuan

2020/08/26

3.7K0

Python中的字典到底是有序的吗

ide 腾讯云开发者社区存储腾讯云测试服务

之前写了文章介绍python中的列表和字典，在文章中描述到了python中的列表是有序的，字典是无序的，后来有粉丝在群里提醒我，说python3.6的版本之后，字典是有序的，因此，我找了一个低版本的python来验证一下效果：

小博测试成长之路

2021/10/13

1.9K0

java开发是什么_java开发到底是做什么的

java https 网络安全

在互联网迅猛发展的时代，而我们如果对互联网一无所知，那就相当于文盲。所以很多人都想去了解它，去学习他。而作为互联网的产物——java，是一门非常不错的技术，学精通之后，你的未来不会再担心就业。那么下面小编给大家说说java开发到底是做什么的，希望能对你有些帮助。

全栈程序员站长

2022/09/08

4650

Spring系列第9篇：depend-on到底是干什么的？

xml spring 容器

本文主要讨论一下bean的创建和销毁的顺序，如何来干预bean的创建和销毁的顺序。

路人甲Java

2020/02/26

6490

Python中的id函数到底是什么？

python

Return the “identity” of an object. This is an integer (or long integer) which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same id() value.

py3study

2020/01/10

1.5K0

点击加载更多

相似问题

这条crontab行是做什么的？

这条jQuery行是做什么的？

Python的"==“到底是做什么的

python中的KFold到底是做什么的？

"python下载en“到底是做什么的？

活动推荐

提供大模型在企业的应用构建、高效便捷

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问Python中的这条random.uniform行到底是做什么的？
EN

游戏加速分发场景解决方案

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

这条crontab行是做什么的？

这条jQuery行是做什么的？

Python的"==“到底是做什么的

python中的KFold到底是做什么的？

"python下载en“到底是做什么的？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python中的这条random.uniform行到底是做什么的？EN

游戏加速分发场景解决方案

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

这条crontab行是做什么的？

这条jQuery行是做什么的？

Python的"==“到底是做什么的

python中的KFold到底是做什么的？

"python下载en“到底是做什么的？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python中的这条random.uniform行到底是做什么的？
EN