Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Python中的这条random.uniform行到底是做什么的?

Python中的这条random.uniform行到底是做什么的?
EN

Stack Overflow用户
提问于 2015-12-06 01:15:28
回答 3查看 813关注 0票数 1

我正在跟踪一个关于在Python中使用随机森林的安德鲁·克罗斯的教程。我可以很好地运行代码,并且在很大程度上我理解输出。然而,我不清楚这一行到底是做什么的:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df['is_train'] = np.random.uniform(0, 1, len(df)) <= .75

我知道它“在0到1之间创建了一个(随机)均匀分布,并将3/4的数据分配到训练子集中。”然而,训练子集并不总是子集的3/4。有时更小,有时更大。那么,是否选择了一个随机大小的子集,大约为75%?为什么不让它总是75%呢?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-12-06 01:27:23

np.random.uniform(0, 1, len(df))创建一个len(df)随机数数组。

然后,<= .75创建另一个数组,其中包含数字匹配条件的True,以及其他地方的False

然后,代码在找到True的索引中使用数据。因为随机分布是..。嗯,随机的,你不会得到精确的75%的数值。

票数 4
EN

Stack Overflow用户

发布于 2015-12-06 01:32:05

它不将数据的3/4分配到训练子集中。

它将数据在训练子集中的概率指定为3/4

示例:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>>> import numpy as np
>>> sum(np.random.uniform(0, 1, 10) < .75)
8
>>> sum(np.random.uniform(0, 1, 10) < .75)
10
>>> sum(np.random.uniform(0, 1, 10) < .75)
7
  • 80%的数据在第一个示例中的训练子集中。
  • 100% -在第二次
  • 70%

平均而言,应该是75%。

票数 4
EN

Stack Overflow用户

发布于 2015-12-06 01:38:43

如果您想更严格地随机选择一个训练集(总是接近75% ),可以使用如下代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
d = np.random.uniform(0, 1, 1000)
p = np.percentile(d, 75)

print(np.sum(d <= p))   # 750
print(np.sum(d <= .75)) # 745

在你的例子中:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
d = np.random.uniform(0, 1, len(df))
p = np.percentile(d, 75)
df['is_train'] = d <= p
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34115808

复制
相关文章
float到底是干什么的?
划重点 float的真正用途不是我们平时用于将同模块下的元素并行显示,也不是为了实现将元素放在某一特殊位置时使用! float正真的作用是!各位老爷可以去考证!float的真正作用是叫做:是元素具有包裹性,最直观的体现效果就是我们world里面常用文字环绕图片
星尘的一个朋友
2020/11/25
9180
float到底是干什么的?
java中volatile关键字到底是干什么的?
我们先简要了解一下java虚拟机的内存模型。就像数据从物理内存拷贝到cpu高速缓存,进行操作完,再把数据返回到内存一样,为了屏蔽CPU高速缓存和 内存复杂细节且赢得跨平台的效果,java把所有的变量都存在主存(相当于物理内存)当中,每个线程都有自己的工作内存(相当于CPU高速缓存)。线程在 自己的工作内存做操作,不能直接对主存进行操作,最后把结果返回到主存。如果一个变量有volatile(易变的意思)修饰词,这意味着当有一个线程修改了这个变量,系 统会把工作内存当中的变化强制立刻反应在主存当中。其他线程要想读这个变量,也会被强迫读变化了的新值。volatile其实就保证了此变量无论怎么变, 任何线程看都是最新的。当两个线程,根据一个共同的信号,做互动时,一定要加volatile,保证这个信号是最新的。
马克java社区
2021/04/26
4910
java中volatile关键字到底是干什么的?
java的反射机制到底是做什么的?
通过wiki百科可知: 在计算机学中,反射(英语:reflection)是指计算机程序在运行时(runtime)可以访问、检测和修改它本身状态或行为的一种能力。[1]用比喻来说,反射就是程序在运行的时候能够“观察”并且修改自己的行为。
袁新栋-jeff.yuan
2020/08/26
6340
java中接口到底是干什么的,怎么用,深入剖析。
通过以上的学习, 我们知道,所有定义在接口中的常量都默认为public、static和final。所有定义在接口中的方法默认为public和abstract。马克-to-win:当时Sun公司为什么要把java的接口设计发明成这样?
马克java社区
2021/03/31
5080
java中接口到底是干什么的,怎么用,深入剖析。
运维工作到底是做什么的?
互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。
用户6543014
2019/10/25
2.8K0
运维工作到底是做什么的?
DevOps工程师到底是做什么的?
DevOps是当前的最新趋势,但是有很多朋友还是不知道DevOps工程师到底是做什么的? DevOps工程师以最纯粹的方式弥合了软件开发和运维团队之间的差距,以提高软件的交付率。 DevOps工程师带
兔云小新LM
2019/07/24
1.6K0
算法工程师到底是做什么的?
前者如实现一个功能、搭建一个服务、实现一种展现交互方式等。更关注的是如何实现功能,如何对于各种复杂甚至小众的场景都不出错。互联网中典型的后端、前端、平台、网络工程师的主要工作是这一类。
大数据文摘
2021/02/08
2K0
TIDB 的大脑 PD 到底是干什么的
PD Server --- placement driver 是管理整体TIDB 元数据的功能模块, 为分布式系统分配全局统一的事务ID, 存储整体TIKV分布式数据库的实时元数据信息,和TIDB的数据库整体的结构. 提供TIDB 监控管理的UI 界面. 除此以外PD 还上报整体TIKV数据存储的分布情况,以及后面根据相关的情况来调整数据的在多个TIKV节点的分布. PD 本身需要基数节点部署,并且PD包含了ETCD分布式,保证PD的高可用.
AustinDatabases
2021/09/24
2.2K0
TIDB  的大脑 PD 到底是干什么的
​Python 中的数字到底是什么?
花下猫语:在 Python 中,不同类型的数字可以直接做算术运算,并不需要作显式的类型转换。但是,它的“隐式类型转换”可能跟其它语言不同,因为 Python 中的数字是一种特殊的对象,派生自同一个抽象基类。在上一篇文章 中,我们讨论到了 Python 数字的运算,然后我想探究“Python 的数字对象到底是什么”的话题,所以就翻译了这篇 PEP,希望对你也有所帮助。
Python猫
2020/09/14
1K0
​Python 中的数字到底是什么?
这些「神秘」团队到底是做什么的?| PingCAP 招聘季
本篇将带大家速览我司各个研发团队的定位和分工,并回答一个热门问题「在 PingCAP 工作是什么样的体验?」
PingCAP
2019/03/04
1.3K0
我到底是被如何骗上“人工智能”这条路?
今天幂次妹讲的是4个关于“人工智能”的故事,来看看那么多人为什么选择“人工智能”。
昱良
2018/08/20
2700
我到底是被如何骗上“人工智能”这条路?
真实!数据分析师到底是做什么的?
现在有关数据分析的文章满天飞,很多小伙伴好奇:到底数据分析是做什么的?今天小熊妹给大家捋一捋,就拿几个大家常问的问题举例吧。
码工小熊
2021/08/19
6660
PostgreSQL Postgres-XL GTM 到底是干什么的
GTM 提供分布式数据库中所有事务的GXID,并且这些GXID 是唯一的并且是有序的,在事务的开始和结束这段时间保证来控制所有节点中的tuple的可见性.这个功能称之为global snapshot. 并且保证事务的一致性.
AustinDatabases
2021/09/02
9970
在Mysql中CHAR和VARCHAR如何选择?给定的长度到底是用来干什么的?
在MySQL数据库中,用的最多的字符型数据类型就是Varchar和Char.。这两种数据类型虽然都是用来存放字符型数据,但是无论从结构还是从数据的保存方式来看,两者相差很大。而且其具体的实现方式,还依赖与存储引擎。我这里就以大家最常用的MYISAM存储引擎为例,谈谈这两种数据类型的差异。在后续建议中,也是针对这种存储类型而言的。
袁新栋-jeff.yuan
2020/08/26
3.7K0
在Mysql中CHAR和VARCHAR如何选择?给定的长度到底是用来干什么的?
Python中的字典到底是有序的吗
之前写了文章介绍python中的列表和字典,在文章中描述到了python中的列表是有序的,字典是无序的,后来有粉丝在群里提醒我,说python3.6的版本之后,字典是有序的,因此,我找了一个低版本的python来验证一下效果:
小博测试成长之路
2021/10/13
1.9K0
Python中的字典到底是有序的吗
java开发是什么_java开发到底是做什么的
在互联网迅猛发展的时代,而我们如果对互联网一无所知,那就相当于文盲。所以很多人都想去了解它,去学习他。而作为互联网的产物——java,是一门非常不错的技术,学精通之后,你的未来不会再担心就业。那么下面小编给大家说说java开发到底是做什么的,希望能对你有些帮助。
全栈程序员站长
2022/09/08
4650
java开发是什么_java开发到底是做什么的
Spring系列第9篇:depend-on到底是干什么的?
本文主要讨论一下bean的创建和销毁的顺序,如何来干预bean的创建和销毁的顺序。
路人甲Java
2020/02/26
6490
Python中的id函数到底是什么?
Return the “identity” of an object. This is an integer (or long integer) which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same id() value.
py3study
2020/01/10
1.5K0
点击加载更多

相似问题

这条crontab行是做什么的?

36

这条jQuery行是做什么的?

20

Python的"==“到底是做什么的

10

python中的KFold到底是做什么的?

30

"python下载en“到底是做什么的?

22
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文