mysql 按比例抽取样本_mysql 根据比例抽取_在R中按组抽取不同大小n的k个样本 - 腾讯云开发者社区

我的数据集有90%的负样本和10%的正样本，这是非常不平衡的。我尝试使用scale_pos_weight的参数，并将其设置为9。这个参数的机制是什么？我很好奇这到底是什么意思:这是不是意味着重复9次阳性样本？或者每次抽取1/9的负样本并多次训练模型。此外，如果我有一个数据集，其负样本仅比正样本多一点，我是否需要再次指定该参数？

浏览 4提问于2017-06-20得票数 9

3回答

有没有办法从特定的类别变量中过滤出固定百分比的样本？

、、、

假设我有1000名患者，他们的性别数据。我被要求抽取一个大小为n的样本，严格满足65%的男性。一些样本数据(在这里，性别分布是50%-50%)： data <- data.frame(patient_id = 1:1000, sex = append(rep("male", 500), rep("female", 500)) ) 我真的看不到在dplyr中使用sample_n或sample_frac来解决这个问题的方法。对于n=

浏览 21提问于2021-10-22得票数 1

回答已采纳

1回答

关于如何平衡不平衡的数据

、、

当我在Scikit学习中阅读决策树时，我发现：在训练前平衡数据集，以防止树偏向于占主导地位的类。类平衡可以通过从每个类中抽取相同数量的样本来实现，或者最好通过将每个类的样本权重(sample_weight)的总和归一化为相同的值来实现。在链接中：我很困惑。 (1) 类平衡可以通过从每个类中抽取相同数量的样本来实现。如果我这样做，应该为每个类中的每个样本添加一个适当的样本权重(或者添加类样本.)。例如，如果我有两个类:A和B，有示例数 A:100 B:10000 我可以为每个样本输入10000个样本并设定权重：输入样本A:10000，输入样本B:10000

浏览 2提问于2016-08-24得票数 1

1回答

如何确定一个样本或两个样本检验、Z检验或t检验

、

如果你想知道两个不同的群体(假设A和B)在态度上是否存在显着差异。我从A中抽取了31个样本，并从33个B中抽取了一个样本。鉴于以下事实，这两个样本是相互独立的： 1)我需要运行一个样本还是两个样本测试，为什么?2)考虑到样本大小，我应该运行T测试还是Z测试，为什么? 3)它是单尾测试还是双尾测试，为什么？

浏览 0提问于2016-11-09得票数 0

1回答

某些地层过小时的分层样品

、、

我需要在每个地层中抽取一个带有n观测的分层样本，但有些地层的观测量要比n少。如果一个层的观测量太少(例如，k<n观测)，我想从该层中抽取所有的k观测数据。 require(sampling) n <- 10 geo_ID <- c(rep(1, times = 20), rep(2, times = 20), rep(c(1, 2, 3, 4), times = 5)) set.seed(42) V1 <- rnorm(60, 0, 1) V2 <- rnorm(60, 2, 1) DF <- data.frame(geo_ID = geo_ID

浏览 17提问于2014-04-24得票数 1

回答已采纳

2回答

如何快速抽取numpy数组？

、、

我需要一个函数来抽取，去掉numpy数组中n中的m。例如，删除2中的1或删除3中的2。因此，一个数组是：[7, 4, 3, 5, 9, 2, 4, 1, 6, 8] 按1:2抽取将变成：[7, 3, 9, 4, 6] 我想知道是否有可能将数组从一维N长重塑为二维N/2，2长的数组，然后去掉额外的维数？理想情况下，我希望找到每组值(本例中的值对)的最大值，而不是只转储抽取后的样本。例如：[7, 5, 9, 4, 8] 有没有办法找到每个集合的最大值，而不是直接丢弃它？增加的挑战是，这里的重点是绘制这些值。抽取是必需的，因为绘制每个值花费的时间太长，这意味着我必须在绘制之前减小数组

浏览 36提问于2019-06-14得票数 3

1回答

pandas中使用概率列的随机抽样行

、、

我正在使用python和pandas从数据帧中随机抽取样本。我的数据帧如下所示：第一列包含时间，第二列是平均速率，第三列是1-sigma，第四列是与该行描述的事件相关的概率。 ? 我知道我可以使用下面的代码来绘制加权样本： random=df.sample(n=100000, replace=True, weights='P>0', axis=0) 但我不确定在这里使用概率是正确的“权重”。简而言之，我需要具有较低P>0的值的采样频率低于具有P>0的值的采样频率。有人愿意在这方面分享意见/不同的选择吗？谢谢!

浏览 24提问于2020-04-24得票数 1

回答已采纳

2回答

潘达斯分层样本

、

我有一只熊猫DataFrame，看上去大致如下： cli_id | X1 | X2 | X3 | ... | Xn | Y | ---------------------------------------- 123 | 1 | A | XX | ... | 4 | 0.1 | 456 | 2 | B | XY | ... | 5 | 0.2 | 789 | 1 | B | XY | ... | 5 | 0.3 | 101 | 2 | A | XX | ... | 4 | 0.1 | ... 我有客户id，很少有分类属性，Y是一个事件的概率，

浏览 3提问于2016-12-08得票数 15

回答已采纳

1回答

如何使用Keras ImageDataGenerator为自己的数据集，来训练卷积自动编码器？

、、

谁能告诉我，ImageDataGenerator是在训练时随机抽取一批原始数据，还是在每个时期按顺序抽取，就像第一次迭代中的前100个样本，第二次迭代中的第二个100个样本，等等？我需要理解这一点，因为我正在训练卷积自动编码器，并且输入也作为输出在model.fit()中传递。所以两者应该是正确对应的。该数据集具有3200张大小为360x640的图像。到目前为止，我有这样的想法： gen = ImageDataGenerator() train_im = ImageDataGenerator( rescale=1./255, sh

浏览 34提问于2021-04-15得票数 1

1回答

用RAND()改进大型表中的顺序

、

我有一个很大的表，大约有660万条记录，我想随机抽取10万条记录。 SELECT column FROM table ORDER BY RAND() LIMIT 100000 每一张唱片都非常慢。我还没有找到一个与MySQL/MariaDB一起使用的解决方案来提取10万条记录的随机样本。请给我建议。谢谢。

浏览 4提问于2022-01-12得票数 1

1回答

基于经验分布的SAS Proc IML模拟

、、

我正在尝试使用经验分布来模拟数据。例如，假设有五种概率的结果，如下向量所示： PROBABILITY_VECTOR = [0.1, 0.2, 0.3, 0.25, 0.15] PROBABILITY_VECTOR是根据经验数据计算的-因此，对于该向量中的第一个类别，虽然平均概率为0.1，但样本之间存在相当大的差异。同样，最后一个类别，虽然所有样本的平均值为0.15，但有相当大的方差。概率为0.3和0.25的中间类别相当紧凑。我使用PROC IML，并使用以下语句： CALL RANDSEED(12345); CALL RANDGEN(SAMPLE, "TABLE", PRO

浏览 52提问于2021-09-02得票数 1

回答已采纳

1回答

多标签分层采样自定义ImageDataGenerator

、、、

我正在研究multi-label classification问题，large-scale数据是高度imbalanced的。因此，我需要根据直觉应用stratified sampling，即我的ImageDataGenerator按比例从each class中抽取every batch中的数据。如有任何建议/解决方案，将不胜感激。

浏览 8提问于2022-01-04得票数 2

回答已采纳

1回答

学习曲线:训练集的大小应该递增还是随机选择？

、

我正在试着写一个定制的学习曲线函数。我想知道它通常是如何实现的。当训练集的大小增加时-通常是通过向已经存在的集合中增加新样本来增加的吗？或者训练大小是随机选择的？举个例子:假设训练集大小比率是0.2，0.3，0.4...，那么当我们从0.2增加到0.3时，我们是不是在以前(0.2)的基础上增加一个额外的0.1？或者我们只是从全套随机样本中获得另一个样本？

浏览 1提问于2018-05-30得票数 0

2回答

为分布的每个样本长度生成随机样本

、、、

我的目标是绘制500个样本点，取其平均值，然后从分布中抽取6000次。基本上：的样本长度从N=1到500不等。对于每个样本长度，抽取6000个样本，并从每个样本中估计平均值。计算每个样本长度的这些平均值的标准差，并以图形表示标准差的减小对应于平方根的缩减。我试着用伽马分布来做这件事，但是我所有的标准差都是零的.我不知道为什么。到目前为止，这是一个项目： import math import numpy as np import matplotlib.pyplot as plt from scipy import stats from scipy.stats import gamma

浏览 8提问于2021-05-13得票数 0

回答已采纳

2回答

如何在一行中按因子对列进行子集？

x <- c("a", 2, 3, 1.0) y <- c("b", 1, 6, 7.9) z <- c("c", 1, 8, 2.0) p <- c("d", 2, 9, 3.3) df1 <- data.frame(x,y,z,p) 这里有一个快速的示例数据集，但它并不完全反映我试图做的事情。假设我想从第2行的每个因子中抽取50个随机样本(在这种情况下，我们只有2个因子).我该如何有效地编码呢？我有一个在循环中工作的版本，但是它感觉没有必要复杂。编辑:当我说我想要随机抽取50个样本时，我的意思

浏览 3提问于2014-03-28得票数 0

回答已采纳

1回答

是否有一个R函数来抽样变量，而不是在情况下？

、、

绝对R初学者在这里，但是:我有一个潜在结构的k= 24指标。事实上，这些指标是可以互换的。为了减少用于度量潜在结构的指标的数量，我想从原始的k=18 (或k=12或k=6)指标中随机抽取k=24指标。使用随机抽样和替换，可以抽取许多样本(例如，n=1000)，然后检查兴趣统计量(例如均值、方差、与外部变量的关联)是否取决于k个指标的数量。问题是，我想从变量中抽取样本，而不是从案例中。因此，如果有人能帮助我处理这个任务，例如R代码，我将非常感激。最佳，E.

浏览 6提问于2021-12-11得票数 0

1回答

基于数据集的训练猪线性svm

、、

是否有人曾尝试根据TUD-brussel数据集(从本网站介绍)来训练猪线svm行人探测器：我试图通过visual studio 2012在opencv上实现它。我根据原始阳性图像的注释(总计约1777个样本)裁剪了阳性样本。从原始阴性图像中随机抽取阴性样本，每幅图像抽取20个样本(约3840个样本)。我还调整了两轮引导(检查硬件和再训练)以提高其性能。然而，该检测器在TUD-brussel上的测试结果糟糕，当FPPG(每幅图像假阳性)= 1时，失配率约为97%。我发现了另一篇论文，即用HOG(Figure3(A))在TUD-brussel上进行训练时取得了合理的结果：。有没有人想过在T

浏览 3提问于2016-03-25得票数 0

1回答

运行唯一样本

、、、

我编写了一些代码，根据特定的标准随机抽取样本，并循环使用标准来获取特定项目的特定数量的样本。随机样本正在收集ID。我需要随机的身份证，我要所有的都是独一无二的。如果随机样本的ID已经附加到完整的随机ID列表中，那么我希望它重新运行特定的迭代，直到在完整的附加列表中找不到随机样本中的ID为止。随机样本是一个列表。包含样例条件和我想要为该标准提取的样本数。Filtered_df包含我想要运行示例的数据。 def randomSample(df_column, EncounterID_column): ''' Output the Encounters fro

浏览 3提问于2022-06-07得票数 0

1回答

基于MediaCodec的视频解码器配置

、

我正在尝试使用MediaCodec API解码视频示例。我正在使用surfaceView显示呈现的示例。如果我按下主按钮，应用程序进入暂停状态和表面破坏。当我返回到恢复状态时，正在创建新的surfaceView引用，但是解码器无法在surfaceView上抽取样本。所以屏幕看起来是黑色的。视频配置:videoDecoder.configure(格式，曲面，null，0)；那么我如何在上面的语句中重新配置videoDecoder。它类似于下面的问题

浏览 0提问于2013-12-12得票数 1

2回答

实现随机抽取器

、、

随机抽取器是一个函数，它从高熵分布中抽取一个输入，输出一个接近均匀分布的值。它与PRG略有不同。PRGs采用均匀分布的采样输入，输出较大的长度字符串，计算上与均匀字符串是无法区分的。随机抽取器从高熵分布中抽取输入样本，输出较小的长度字符串，在统计上接近均匀分布。在我的方案中，我使用随机抽取器。在该方案中，提取器从Z_N^*的子群中提取一个均匀采样的元素，其中N是两个大素数的乘积。提取器需要输出一个位字符串。我想实现这个方案，但找不到随机抽取器的任何实现。sagemath中是否有任何随机抽取器，或者其他库？

浏览 0提问于2018-12-20得票数 4

5回答

如何渲染音频波形？

、、、、

是否有与音频/编程相关的堆栈交换站点？我正试着用制作WinForms 我应该使用什么算法？例如，如果我每像素有200个样本(垂直线)，我应该从200个样本中提取最低和最高的样本吗？或者我应该抽取低样本和高样本的平均值？也许两种颜色都不同？

浏览 14提问于2012-07-12得票数 5

回答已采纳

1回答

如何使用过采样和欠采样的组合？使用不平衡学习

、、、、

我想重新采样一些大数据(类大小: 8mio vs 2700)，我希望通过过采样类2和欠采样类1来获得每个样本的50.000个样本。imblearn似乎提供了过采样和欠采样的组合，但我不明白它是如何工作的。 from collections import Counter from imblearn.over_sampling import SMOTENC from imblearn.under_sampling import TomekLinks from imblearn.combine import SMOTETomek smt = SMOTETomek(random_state=1)

浏览 27提问于2019-10-12得票数 1

回答已采纳

1回答

如何更新大小为25的1000个随机样本的代码到一个大小为25的随机样本的1000个重采样

、、

我目前拥有的代码演示了为R中的分布Gamma(5,1)随机抽取1000个大小为25的样本。我的问题是更新此代码，以便表示从同一分布的一个大小为25的随机样本中抽取1000个重采样(带有替换)。正如我已经说过的，我已经有代码为Gamma(5,1)做大小为25的1000个随机样本。 set.seed(35) n <- 25 alpha <- 5 beta <- 1 sample.n <- 0 xbar.n <- 0 vars.n <- 0 k=1000 for (i in 1:k){ sample.n <- rgamma(n, alpha, sca

浏览 14提问于2019-04-15得票数 1

1回答

从数据帧的子集采样，其中该子集是以来自R中的另一个数据帧的值为条件的

、、

我在R中有两个数据帧。其中一行包含每个人及其居住的区域。例如。 df1 = data.frame(Person_ID = seq(1,10,1), Area = c("A","A","A","B","B","C","D","A","D","C")) 另一个数据框包含每个Area的人口统计信息。例如，用于性别df2 = data.frame(Area = c("A","A","B",&#

浏览 12提问于2020-07-21得票数 1

回答已采纳

1回答

在dplyr，R中取一个没有分组的样本。

、、、

我知道如何使用dplyr中的sample_n或sample_frac从数据中抽取每个组的随机样本，可以这样做， dataset %>% group_by(user_id) %>% sample_n(10) 然而，我有一个稍微不同的问题。我想从整个数据集中随机抽取一个样本。应该像这个一样简单， sample_n(dataset,10) 但是，由于在前面的示例中，我在dataset上使用了group_by命令，所以group_by似乎仍然在这里生效。第二个命令相当于这里的第一个命令。我想知道如何消除group_by的影响，从整个数据集中获取一个随机样本？

浏览 2提问于2016-08-18得票数 2

回答已采纳

2回答

熊猫通过采集样本读取csv

、、

我有一个很大的CSV文件，我只想从其中抽取1%的样本。有没有一种好方法可以直接将样本读取到pandas数据帧中，而不必读取整个文件，然后丢弃99%的数据？

浏览 4提问于2019-03-03得票数 3

回答已采纳

1回答

传感器抽取

、、

我有一个关于传感器数据抽取的快速问题，我相信这很容易，但我想我应该检查一下。我有一个以25 at采样的传感器，数据通过串行RS232连接发送到外部数据记录器，后者以10 at记录数据。我认为如果我想恢复一个真正的10 Hz信号，我应该将原始的25 Hz信号通过一个抽取过程(即先进行滤波，然后进行下采样)。这是正确的吗？如果它是正确的，我认为我应该通过一个截止频率为~10 Hz的低通滤波器来抽取原始的25 Hz信号，以去除较高频率的分量。然后，对滤波后的信号进行下采样，以产生最终信号。这种下采样将通过从滤波信号中每2.5个样本提取一个值来实现。因此，换句话说，最终信号的第一个值将是滤波信号

浏览 2提问于2016-07-05得票数 0

1回答

同步两个渲染通行证:颜色附件取样？

在Vulkan，假设我有两个呈现通行证： attachment.the第二次从该图像的片段着色器中(即通过组合图像采样器)从该图像中抽取第二个样本。呈现通行证是按该顺序提交的。同步这两个呈现传递的正确方法是什么，这样第二个呈现传递就不会在第一个呈现传递之前读取？在它们之间的图像上创建图像管道屏障是必要的和/或足够的吗？

浏览 2提问于2021-02-04得票数 3

回答已采纳

1回答

JMeter邮件读取器子样本提取

、、

我试图通过Regular Expression Extractor从Mail Reader Sampler的子样本中提取用户Id，但没有成功。我不明白为什么Regular Expression Extractor不检查我的Mail Reader Sampler的子样本。有什么提示可以提取用户id吗？我的邮件阅读器采样器我对邮件阅读器采样器的回应。Sub样例实际上包含了html格式的电子邮件。我的正则表达式抽取器电子邮件包含这样的部分，其中包含包含用户id的激活链接： <span class="link-ref"><a href=&#

浏览 1提问于2017-04-24得票数 2

回答已采纳

1回答

Scikit-学习，随机森林-每棵树包含多少样本？

、、

在scikit learn的RandomForestClassifier中，没有设置来指定应该从多少个样本构建每棵树。也就是说，从数据中随机抽取的子集应该有多大，以构建每棵树。我很难找到scikit-learn默认拉取的样本数量。有人知道吗？

浏览 1提问于2014-03-15得票数 3

1回答

负采样-如何从噪声分布中提取负样本？

、

据我所知，负采样随机抽样的K negative samples来自一个噪声分布，P(w)。噪声分布基本上是频率分布+对词的一些修正。通常我们选择K = 5 ~ 20阴性样本。 P(w) = Uw(w)^(3/4) / normalization_factor 我看到了这两个相同的方程，用两个不同的符号来表示：三个问题：蓝色盒子的意思是什么？j和i的意义何在？第二个方程似乎没有显示从噪声分布中“随机抽取”单词的任何东西。k在红色盒子里的意思是什么？如何从噪声分布中选择噪声样本？假设归一化噪声分布看起来像下面的字典： dist = {'apple&#

浏览 0提问于2019-04-24得票数 3

1回答

如何在R中抽取样本，使原始比例保持不变

、、、

我希望从数据中抽取一个样本，使变量的原始比例保持不变。例如，如果在我的原始数据中有1000个值，其中有100个a值，800个b值和100个c值。如果我要从这个原始数据中抽取100个值，它应该有10个a值，80个b值和10个c值。请帮助！

浏览 5提问于2017-07-06得票数 0

1回答

分层抽样变量选择

、、

我试图在R中进行分层抽样，从我的数据中抽取样本，其中一个参数是组，它从保持数据集的相同初始分布取变量名到样本。是否将响应作为分组变量包括在内是常见的，包括/排除它意味着什么？

浏览 0提问于2017-11-08得票数 2

3回答

在oracle中采样

、

我在试着从保险索赔数据库中提取样本。例如，从100万个索赔数据中随机抽取20%的样本，其中提供者类型为'25‘，年份为'2012’。数据在sqldeveloper中。我是一名具有基本SQL知识的统计学家。

浏览 3提问于2013-01-19得票数 0

3回答

来自每个类标签的样本X示例

、、、、

我有一个包含50 classes和9000个训练示例的数据集(numpy向量)。 x_train=(9000,2048) y_train=(9000,) # Classes are strings classes=list(set(y_train)) 我想构建一个子数据集，这样每个类将有5个示例这意味着l获得5*50=250训练示例。因此，我的子数据集将采用以下形式： sub_train_data=(250,2048) sub_train_labels=(250,) 备注:每个班级随机抽取5个样本(总班数=50个) 谢谢

浏览 0提问于2018-01-24得票数 1

1回答

从R中的数据帧中随机抽取行的样本，如何使用未被采样的行？

、、

在没有数据帧替换的情况下随机抽取样本。我把这个样本分配给了一个新的数据框架。我想使用从该示例中遗留下来的行。为了创建示例，我使用了： telemarketing_sample <- telemarketing[sample(1:nrow(telemarketing), 30000, replace=FALSE),]

浏览 2提问于2017-03-14得票数 0

回答已采纳

2回答

LFSR是否足以后处理有偏倚的TRNG？

、、、、

我正在构建一个基于环振荡器的FPGA上的TRNG。我发现线性反馈移位寄存器(LFSRs)通常用于TRNG的后处理.这是我的初步设计： 📷 假设TRNG核心块产生有偏差的输出(例如，比0多1s或该值更有可能在样本之间转换)。LFSR是否足以消除输入的偏差？用Von Neumann提取器来消除输入偏差会有益吗？一个相关的问题是--既然有偏差的输入有较少的熵-- LSFR是否能够通过执行更多的移位来提取随时间变化的随机性？如果是的话，我们如何估计必须从弱随机熵源输入LFSR的比特数，才能获得较强的输出？编辑： Clk是一个时钟，它速度较慢，与环形振荡器的振荡速度无关。

浏览 0提问于2021-05-01得票数 4

回答已采纳

2回答

在大查询中从每个组中抽取一个随机样本

、

我正在试图找出什么是最好的方法，为一个大查询中的一个表中的每个组随机抽取100个记录。例如，我有一个表，其中A列是唯一的recordID，B列是记录所属的groupID。对于每一个不同的groupID，我都想随机抽取100个记录I的样本。有什么简单的方法来完成这个任务吗？

浏览 7提问于2016-03-15得票数 6

回答已采纳

1回答

是否有一种方法可以在Google分析测量协议中使用采样率？

、

我们正在考虑实现谷歌分析测量协议，以跟踪可能没有启用js的旧设备。在使用此协议时，是否有方法设置采样率？我已经阅读过，但不确定你将如何使用G.A.M.P.引入样本率，甚至不确定如何实现自己的抽样率。

浏览 2提问于2016-12-14得票数 1

回答已采纳

1回答

从子查询/cte/temp表中排除匹配的in吗？

、

我不知道从何说起这件事. 我有一张桌子，里面有EMPLOYEE_ID，HOURS_WORKED，DEPARTMENT。我试着按这个层次顺序随机抽取顾客： (1.) --首先，我想要一个随机抽取500名雇员的样本 (2.) Next，我想要一个随机抽样的500名在B部门工作的雇员，并确保它不包括所有被拉进来的雇员ID (1.) (3.)我想要一个随机抽样的500名在C部门工作的雇员，并确保它不包括所有被拉进来的雇员ID (1.)和(2.) 有人能给我提供一些关于如何做这件事的细节吗？我对此很陌生，以前从未运行过这样的查询，因此越详细越好！我的直觉是，它将需要我做临时表的过程中，并使用一个联盟在

浏览 0提问于2019-01-14得票数 0

2回答

向图像添加像素独立噪声

、、、、

我的问题很简单:我有一个图像，我想在图像中添加像素独立的噪声。噪声可以从任何分布导出，例如高斯分布。numpy/scikit中有哪些可用模块-学习做同样的事情？我没有任何代码，但我正在学习模块，如numpy.random.normal等，我需要更多的澄清。没有一个模块明确表示，如果我多次从分布中抽取样本，则这些抽取将是独立的。谢谢你的建议。

浏览 12提问于2019-03-02得票数 0

1回答

计算这些概率的公式是什么？

、

从包中随机选择一颗红色大理石的概率是0.6。从袋子中随机抽取6个大理石样本(样本具有适当的二项式分布)。这些弹珠中有四个是红色的概率是多少？这些弹珠中有两个或更少是红色的概率是多少？

浏览 2提问于2020-04-01得票数 1

1回答

在实施分层时，我是否应该保留类别的比例？

、、、、

我有30,000个按情感分类的短语。我要用天真的贝斯。这是比例(情绪，->，短语的数量)。 anger 98 boredom 157 empty 659 enthusiasm 522 fun 1088 happiness 2986 hate 1187 love 2068 neutral 6340 relief 1021 sadness 4828 surprise 1613 worry 7433 因此

浏览 2提问于2017-12-09得票数 0

回答已采纳

1回答

特征抽取向量

、、

我有一个浮子阵列特征：：ArrayXf，我需要抽取它(即从f.i中选择一个。8个样本)。 Eigen::ArrayXf decimatedSignal = Eigen::Map<Eigen::ArrayXf, 0, Eigen::InnerStride<8> >(signal.data(), length, 1).eval(); 这是可行的，但有一个警告:我需要知道长度是多长，而且它可以指定太长，从而导致运行时错误。问:是否有一种方法可以抽取所有可能的结果长度为== signal.size() /8？

浏览 3提问于2015-04-29得票数 0

回答已采纳

1回答

NetLogo的多项式实现

、

NetLogo中有没有从多项分布中抽取样本的函数？我需要一个类似于numpy multinomial函数numpy.random.multinomial(n, pvals, size=None)的函数

浏览 18提问于2020-11-17得票数 0

回答已采纳

1回答

来自R中两个独特类别的样本

、、、、

我有100个独特的ID和8个独特的星期。我想要这样的样品，我想要一个唯一的ID和唯一的周样本。例如，ID1每周采样8次，ID2采样8次，依此类推。因此，我现在有800行。

浏览 2提问于2020-05-31得票数 0

3回答

基于分布的数据帧样本

、、

我试图从一个数据框架中进行抽样，但条件是，该示例以某种标准表示分布(在我的例子中)。数据框架的结构如下： df <- data.frame(Locaton = c(A, B, B, B, C, C, ...), Veg_Species = c(X, Y, Z, Z, Z, Z...), Date_Diff = c(2, 5, 2, 0, 4, 4...)) 重要的是要知道，Veg_Species的数量是不同的。这意味着X有25次出现，例如Y 45和Z 78。现在我想根据最小样本的Veg_Species分布从不同的Date

浏览 8提问于2020-08-09得票数 2

回答已采纳

1回答

仅显示一个标签的RGraphviz哈希图

、、、、

为了创建如下所示的Hasse图 ? 一种是使用下面的库 library(rPref) library(Rgraphviz) 一个是从自己的数据中抽取一小部分样本 df <- data[1:10,] 然后创建首选项 pref <- low(time) * low(MAPE) 和优于图(BTG) btg <- get_btg(df, pref) 为了显示包含相关值的节点的标签，可以按如下方式创建标签 labels <- paste0(df$time, "\n", df$MAPE) 然而，当一个人使用 plot_btg(df, pref, label

浏览 11提问于2021-02-02得票数 0

回答已采纳

1回答

如何在C中通过Rmath.h使用多项式函数

、、

我试图在Rmath.h的帮助下，在C中给定长度为4的概率向量下，从1,2,3,4中随机抽取一个样本。我发现这行代码可以帮我做到这一点。 inline void rmultinom(int n, double* prob, int k, int* rn) 例如，我可以编写它来随机抽取一个样本。 double p[4]={.1, .2, .3, .2}; rmultinom(1, p, 1, int* rn) 然而，我不知道第四个论点应该是什么。在R中，rmultinom函数只需要前三个参数。另一个问题是这个函数返回了什么。有没有什么方便的方法让它返回1，2，3，4中的一个？

浏览 26提问于2020-08-12得票数 3

回答已采纳

1回答