如果我有四组100个项目，有没有办法在R中随机选择其中的10个，使它们在某个变量上的分布最均匀？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

c/c++产生随机数

转自：http://blog.csdn.net/beyond0824/article/details/6009908

04

【翻译/介绍】jump consistent hash 零内存消耗，均匀，快速，简洁，来自Google的一致性哈希算法

jump consistent hash是一种一致性哈希算法, 此算法零内存消耗，均匀分配，快速，并且只有5行代码。

01

您找到你想要的搜索结果了吗？

是的

没有找到

读书_爱上统计学

概率与分布硬币的例子正态曲线推论统计检验方法参数检验两个独立群体均值的t检验概述效应量相关群体均值的t检验简单方差分析析因分析相关系数线性回归检验和测量信度和效度测量尺

07

数据分析师必看的5大概率分布

原文链接：https://blog.csdn.net/yoggieCDA/article/details/100703311

02

【Excel系列】Excel数据分析：抽样设计

一、随机数发生器 1. 随机数发生器主要功能 “随机数发生器”分析工具可用几个分布之一产生的独立随机数来填充某个区域。可以通过概率分布来表示总体中的主体特征。例如，可以使用正态分布来表示人体身高的总

08

机器学习基础与实践（一）——数据清洗

想写这个系列很久了，最近刚好项目结束了闲下来有点时间，于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书，每本书都各有侧重点，机器学习实战和集体智慧编程更偏向与实战，侧重于对每个算法的实际操作过程，但是没有对整个数据挖掘项目做介绍，李航老师的统计学习方法和周志华老师的机器学习这两本书侧重对原理的讲解和公式的推导，但是实战方面可能会少一点。我结合之前看过的书，以及自己的一些项目经验做了一些总结，一是回顾自己还有哪些遗漏，二是希望给新入门的同学一个参考。至于编程语言，主要用python，也会有少部

07

机器学习算法原理系列详解-机器学习基础与实践（一）-数据清洗

作者：Charlotte77 数学系的数据挖掘民工博客专栏：http://www.cnblogs.com/charlotte77/ 个人公众号：Charlotte数据挖掘（ID：CharlotteDataMining）想写这个系列很久了，最近刚好项目结束了闲下来有点时间，于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书，每本书都各有侧重点，机器学习实战和集体智慧编程更偏向与实战，侧重于对每个算法的实际操作过程，但是没有对整个数据挖掘项目做介绍，李航老师的统计学习方法和周志华老师的机器学习

06

【DL碎片4】深度学习中的的超参数调节

从【DL笔记1】到【DL笔记N】，是我学习深度学习一路上的点点滴滴的记录，是从Coursera网课、各大博客、论文的学习以及自己的实践中总结而来。从基本的概念、原理、公式，到用生动形象的例子去理解，到动手做实验去感知，到著名案例的学习，到用所学来实现自己的小而有趣的想法......我相信，一路看下来，我们可以感受到深度学习的无穷的乐趣，并有兴趣和激情继续钻研学习。正所谓 Learning by teaching，写下一篇篇笔记的同时，我也收获了更多深刻的体会，希望大家可以和我一同进步，共同享受AI无穷的乐趣。

04

[MCSM] Slice Sampler

之前介绍的MCMC算法都具有一般性和通用性（这里指Metropolis-Hasting 算法），但也存在一些特殊的依赖于仿真分布特征的MCMC方法。在介绍这一类算法（指Gibbs sampling）之前，本节将介绍一种特殊的MCMC算法。我们重新考虑了仿真的理论基础，建立了Slice Sampler。

02

什么是随机和伪随机

互联网公司的年会抽奖环节正常都是用自己写的软件抽奖的，然后我们经常会看到每年年会期间有些公司会在年会上现场 review抽奖代码，基本都是觉得他丫的这是不是真的随机抽奖？

02

蒙特卡洛法求积分

问题一：我们如何用蒙特卡洛方法求积分？问题二：如何近似求一个随机变量的数学期望？问题三：估计的误差是多少？问题四：如何从理论上对蒙特卡洛估计做分析？结论

01

R语言广义线性混合模型（GLMM）bootstrap预测置信区间可视化

通过线性模型和广义线性模型（GLM），预测函数可以返回在观测数据或新数据上预测值的标准误差（点击文末“阅读原文”获取完整代码数据）。

01

概率分布的转换

前段时间有幸读到了@老师木的文章1,里面在探讨一个问题，为什么在神经网络的节点上面使用的是sigmoid函数？其中谈到一个点：

03

机器学习基础与实践（一）----数据清洗

本博客所有内容以学习、研究和分享为主，如需转载，请联系本人，标明作者和出处，并且是非商业用途，谢谢！　　想写这个系列很久了，最近刚好项目结束了闲下来有点时间，于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书，每本书都各有侧重点，机器学习实战和集体智慧编程更偏向与实战，侧重于对每个算法的实际操作过程，但是没有对整个数据挖掘项目做介绍，李航老师的统计学习方法和周志华老师的机器学习这两本书侧重对原理的讲解和公式的推导，但是实战方面可能会少一点。我结合之前看过的书，以及自己的一些项目经验做了一些总结

06

卡方检验spss步骤_数据分析–学统计&SPSS操作

我是一个在教育留学行业8年的老兵，受疫情的影响留学行业受挫严重，让我也不得不积极寻找新的职业出路。虽然我本身是留学行业，但对数据分析一直有浓厚的兴趣，日常工作中也会做一些数据的复盘分析项目。加上我在留学行业对于各专业的通透了解，自2016年起，在各国新兴的专业–商业分析、数据科学都是基于大数据分析的专业，受到留学生的火爆欢迎，可见各行各业对于数据分析的人才缺口比较大，所以数据分析被我作为跨领域/转岗的首选。对于已到而立之年的我，这是一个重要的转折点，所以我要反复对比课程内容选择最好的，在7月中旬接触刚拉勾教育的小静老师后，她给我详细介绍了数据分析实战训练营训练营的情况，但我并没有在一开始就直接作出决定。除了拉勾教育之外，我还同时对比了另外几个同期要开设的数据分析训练营的课程，但对比完之后，基于以下几点，我最终付费报名了拉勾教育的数据分析实战训练营：

01

不得不学的统计学基础知识（二）

接上一期的分享，今天继续学习统计学的相关知识，今天涉及到的五个知识点主要包括离散型概率分布、连续型概率分布、假设检验、假设检验的运用（一类错误与二类错误）以及相关、因果以及回归关系。

01

我是如何击败Java自带排序算法的

Java 8 对自带的排序算法进行了很好的优化。对于整形和其他的基本类型， Arrays.sort() 综合利用了双枢轴快速排序、归并排序和启发式插入排序。这个算法是很强大的，可以在很多情况下通用。针对大规模的数组还支持更多变种。我拿自己仓促写的排序算法跟Java自带的算法进行了对比，看看能不能一较高下。这些实验包含了对特殊情况的处理。

01

斯坦福大学密码学-绪论 01

争取这周看完斯坦福大学Dan Boneh 教授的密码学课程，fighting !!!

04

用 subsetting 限制连接池中的连接数量

内网使用服务发现后，服务与其它服务的实例之间使用一条 TCP 长连接进行通信。这种情况下常见的做法是按照 registry 下发的 host:port 列表来直接建连。

01

异常检测算法在审计智能化的应用

引用MBA智库百科的原文：内部审计，是建立于组织内部、服务于管理部门的一种独立的检查、监督和评价活动，它既可用于对内部牵制制度的充分性和有效性进行检查、监督和评价，又可用于对会计及相关信息的真实、合法、完整，对资产的安全、完整，对企业自身经营业绩、经营合规性进行检查、监督和评价。

02

病毒入侵：全靠分布式

我现在已经有 100 nm 大小了，我还有很多触角，人类把我的触角称为冠，所以给我起了个学术名：冠状病毒。对于这个学术名，我一直不满意，怎么能用外貌来取名呢，这是以貌取毒。

02

DAY4-R语言基础

01

random — 伪随机数生成器（史上总结最全）

random 模块基于 Mersenne Twister 算法提供了一个快速的伪随机数生成器。Mersenne Twister 最初开发用于为蒙特卡洛模拟器生成输入，可生成具有分布均匀，大周期的数字，使其可以广泛用于各种应用。

03

【R系列】概率基础和R语言

R语言是统计语言，概率又是统计的基础，所以可以想到，R语言必然要从底层API上提供完整、方便、易用的概率计算的函数。让R语言帮我们学好概率的基础课。 1. 随机变量 · 什么是随机变量？ · 离散型随机变量 · 连续型随机变量 1). 什么是随机变量？随机变量（random variable）表示随机现象各种结果的实值函数。随机变量是定义在样本空间S上，取值在实数载上的函数，由于它的自变量是随机试验的结果，而随机实验结果的出现具有随机性，因此，随机变量的取值具有一定的随机性。 R程序：生成一个在(0,1,

08

机器学习数学基础：常见分布与假设检验

所谓机器学习和深度学习，背后的逻辑都是数学，所以数学基础在这个领域非常关键，而统计学又是重中之重，机器学习从某种意义上来说就是一种统计学习。

01

GWAS分析中QQ图和曼哈顿图如何看？

大家好，我是邓飞，GWAS分析应该是可视化最靓的仔了，五颜六色，形状各异，真叫人眼花缭乱，看了又看。

03

如何解读GWAS分析中QQ图和曼哈顿图

最近有老师问GWAS可视化的内容，GWAS分析结果没有曼哈顿图和QQ图是没有灵魂的，这两个图究竟怎么看呢，下面介绍一下：

06

如何通过可视化解读GWAS分析结果

最近有老师问GWAS可视化的内容，GWAS分析结果没有曼哈顿图和QQ图是没有灵魂的，这两个图究竟怎么看呢，下面介绍一下：

01

R语言用综合信息准则比较随机波动率（SV）模型对股票价格时间序列建模

随机波动率（SV）模型是常用于股票价格建模的一系列模型。在所有的SV模型中，波动率都被看作是一个随机的时间序列。然而，从基本原理和参数布局的角度来看，SV模型之间仍有很大的不同。因此，为一组给定的股票价格数据选择最合适的SV模型对于对股票市场的未来预测非常重要。为了实现这一目标，可以使用留一交叉验证（LOOCV）方法。然而，LOOCV方法的计算成本很高，因此它在实践中的应用非常有限。在对SV模型的研究中，我们提出了两种新的模型选择方法，即综合广泛适用信息准则（iWAIC）和综合重要性抽样信息准则（iIS-IC），作为近似LOOCV结果的替代品。在iWAIC和iIS-IC方法中，我们首先计算每个观测值的期望似然，作为相对于相应的潜变量（当前的对数波动参数）的积分。由于观测值与相应的潜变量高度相关，每个第 t 个观测值（y obs t）的综合似然值期望接近于以 y obs t 为保持数据的模型所计算的 y obs t 的期望似然值。其次，在计算信息标准时，综合期望似然被用作期望似然的替代。由于相对于潜变量的整合在很大程度上减少了模型对相应观测值的偏差，因此整合后的信息标准有望接近LOOCV结果。为了评估iWAIC和iIS-IC的性能，我们首先使用模拟数据集进行了实证研究。该研究结果表明，iIS-IC方法比传统的IS-IC有更好的性能，但iWAIC的性能并不优于非综合WAIC方法。随后，利用股票市场收益数据进行了进一步的实证研究。根据模型的选择结果，对于给定的数据，最好的模型是具有两个独立自回归过程的SV模型，或者是具有非零预期收益的SV模型。

06

用综合信息准则比较随机波动率（SV）模型对股票价格时间序列建模

随机波动率（SV）模型是常用于股票价格建模的一系列模型。在所有的SV模型中，波动率都被看作是一个随机的时间序列。然而，从基本原理和参数布局的角度来看，SV模型之间仍有很大的不同。因此，为一组给定的股票价格数据选择最合适的SV模型对于对股票市场的未来预测非常重要。为了实现这一目标，可以使用留一交叉验证（LOOCV）方法。然而，LOOCV方法的计算成本很高，因此它在实践中的应用非常有限。在对SV模型的研究中，我们提出了两种新的模型选择方法，即综合广泛适用信息准则（iWAIC）和综合重要性抽样信息准则（iIS-IC），作为近似LOOCV结果的替代品。在iWAIC和iIS-IC方法中，我们首先计算每个观测值的期望似然，作为相对于相应的潜变量（当前的对数波动参数）的积分。由于观测值与相应的潜变量高度相关，每个第 t 个观测值（y obs t）的综合似然值期望接近于以 y obs t 为保持数据的模型所计算的 y obs t 的期望似然值。其次，在计算信息标准时，综合期望似然被用作期望似然的替代。由于相对于潜变量的整合在很大程度上减少了模型对相应观测值的偏差，因此整合后的信息标准有望接近LOOCV结果。为了评估iWAIC和iIS-IC的性能，我们首先使用模拟数据集进行了实证研究。该研究结果表明，iIS-IC方法比传统的IS-IC有更好的性能，但iWAIC的性能并不优于非综合WAIC方法。随后，利用股票市场收益数据进行了进一步的实证研究。根据模型的选择结果，对于给定的数据，最好的模型是具有两个独立自回归过程的SV模型，或者是具有非零预期收益的SV模型。

02

病毒入侵：全靠分布式

我现在已经有 100 nm 大小了，我还有很多触角，人类把我的触角称为冠，所以给我起了个学术名：冠状病毒。对于这个学术名，我一直不满意，怎么能用外貌来取名呢，这是以貌取毒。

02

java random函数原理_详解JAVA中Random()函数的用法

有时候，我们会用到随机数。java中自带的Random()函数让我们可以很方便的产生随机数。本文介绍它的一些用法。

01

跨境上网_数据跨境传输

设计思想是这样子的，一开始是全局特征，把整张图片输入，我们提取它的特征，用这种特征比较 Loss 或比较图片距离。但这时我们发现有一些不显著的细节，还有出现频率比较低的特征会被忽略。比如衣服上有个 LOGO，但不是所有衣服上有 LOGO，只有部分人衣服上有 LOGO。全局特征会做特征均匀化，LOGO 的细节被忽略掉了。

01

统计分布讲解

随机现象中，变量的取值是不确定的，称之为随机变量。描述随机变量取值概率的函数称为概率分布。对于随机变量，通常主要关心它的两个主要数字特征：数学期望用于描述随机变量的平均值，方差用于描述随机变量分布的差异程度，方差的算术平方根称为均方差。另外协方差和相关系数用于描述两个变量的线性关联程度。

01

机器学习9：采样

采样本质上是对随机现象的模拟，根据给定的概率分布，来模拟产生一个对应的随机事件。采样可以让人们对随机事件及其产生过程有更直观的认识。

03

Copula估计边缘分布模拟收益率计算投资组合风险价值VaR与期望损失ES|附代码数据

在这项工作中，我通过创建一个包含四只基金的模型来探索 copula，这些基金跟踪股票、债券、美元和商品的市场指数

01

Copula估计边缘分布模拟收益率计算投资组合风险价值VaR与期望损失ES|附代码数据

在这项工作中，我通过创建一个包含四只基金的模型来探索 copula，这些基金跟踪股票、债券、美元和商品的市场指数

00

深度学习应用篇-推荐系统[11]：推荐系统的组成、场景转化指标（pv点击率,uv点击率,曝光点击率）、用户数据指标等评价指标详解

在网络技术不断发展和电子商务规模不断扩大的背景下，商品数量和种类快速增长，用户需要花费大量时间才能找到自己想买的商品，这就是信息超载问题。为了解决这个难题，个性化推荐系统（Recommender System）应运而生。

03

Copula估计边缘分布模拟收益率计算投资组合风险价值VaR与期望损失ES|附代码数据

在这项工作中，我通过创建一个包含四只基金的模型来探索 copula，这些基金跟踪股票、债券、美元和商品的市场指数

03

一文了解采样方法

作者 | DarkScope，蚂蚁金服高级算法工程师，致力于算法技术的创新和实际应用，乐于通过博客的方式对技术进行分享和探讨。

02

matlab产生高斯白噪声

matlab里和随机数有关的函数：（1） rand：产生均值为0.5、幅度在0~1之间的伪随机数。（2） randn：产生均值为0、方差为1的高斯白噪声。（3） randperm(n)：产生1到n的均匀分布随机序列。（4） normrnd(a,b,c,d)：产生均值为a、方差为b大小为cXd的随机矩阵。

02

Copula估计边缘分布模拟收益率计算投资组合风险价值VaR与期望损失ES|附代码数据

在这项工作中，我通过创建一个包含四只基金的模型来探索 copula，这些基金跟踪股票、债券、美元和商品的市场指数

00

Copula估计边缘分布模拟收益率计算投资组合风险价值VaR与期望损失ES

在这项工作中，我通过创建一个包含四只基金的模型来探索 copula，这些基金跟踪股票、债券、美元和商品的市场指数。然后，我使用该模型生成模拟值，并使用实际收益和模拟收益来测试模型投资组合的性能，以计算风险价值(VaR)与期望损失(ES)。

02

金融量化 - scipy 教程(01)

前篇已经大致介绍了NumPy，接下来让我们看看SciPy能做些什么。NumPy替我们搞定了向量和矩阵的相关操作，基本上算是一个高级的科学计算器。SciPy基于NumPy提供了更为丰富和高级的功能扩展，在统计、优化、插值、数值积分、时频转换等方面提供了大量的可用函数，基本覆盖了基础科学计算相关的问题。

01

深度学习应用篇-推荐系统[11]：推荐系统的组成、场景转化指标（pv点击率,uv点击率,曝光点击率）、用户数据指标等评价指标详解

在网络技术不断发展和电子商务规模不断扩大的背景下，商品数量和种类快速增长，用户需要花费大量时间才能找到自己想买的商品，这就是信息超载问题。为了解决这个难题，个性化推荐系统（Recommender System）应运而生。

02

DAG的妙用（一）——记账新方法前言什么是DAG?基于DAG的交易模型

本文转载自公众号：[区块链中那些事儿] 作者：区块君的《DAG的妙用（一）——记账新方法》，已获授权。

02

产生随机数算法[通俗易懂]

两个办法帮你解决如何在Java中产生随机数　　随机数在日常的应用和开发中经常会见到，比如说某些系统会为用户生成一个最初的初始化密码，这就是一个随机数。如何生成这个随机数，不同的开发工具的方法也不一样。在应用中，Java是应用最为广泛的开发工具之一，如何在Java中产生随机数，也是很多开发者在初学随机数时的一个必修课，在此为读者贡献两个办法帮你解决如何在Java中产生随机数。

04

【应用】从业务数据分析到机器学习应用的一次经历

本文通过一次完整的项目经历，从业务数据的分析开始，到产品优化建议，再到通过机器学习进行进一步的处理进行了比较完成的提炼。腾讯电脑管家作为一款目前最流行的pc端软件之一，如何提升市场份额同时提升用户体验是我们一直在探索和考虑的问题。业务数据分析方面主要是考虑产品优化的建议；机器学习方面，特征构造、模型选型、ABtest等都有比较充分的描述和说明。希望能够对大家在数据分析的工作能有一定的启发，如有不足之处还望大家多指教。

00

《从业务数据分析到机器学习应用的一次经历》

本文通过一次完整的项目经历，从业务数据的分析开始，到产品优化建议，再到通过机器学习进行进一步的处理进行了比较完成的提炼。

Day4_R语言基础—CG

从RStudio官网下载MacOS版本RStudio安装包。对于MacOS，安装选择默认路径即可。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭