确定对数据进行入库的最优箱

是指在云计算中，根据一定的规则和算法，将数据存储到适合的存储设备或容器中的过程。

数据入库是指将数据从源头（例如传感器、移动设备、Web应用等）传输到云存储系统中进行长期保留和管理的操作。在进行数据入库时，需要考虑存储设备的类型、容量、性能、可靠性等因素，以及数据的访问模式、访问频率、访问方式等需求。

最优箱是指在数据入库过程中选择合适的存储设备或容器，以最大程度地满足数据存储的需求，并提高存储效率和性能。

在确定对数据进行入库的最优箱时，可以考虑以下几个因素：

存储需求分析：根据数据的类型、大小、访问模式等特点进行存储需求分析，确定存储设备的容量、性能等需求。
数据访问模式：根据数据的访问模式（例如随机读写、顺序读写、读多写少等），选择适合的存储设备或容器。例如，对于频繁读写的数据，可以选择高性能的闪存存储设备；对于冷数据（访问频率较低）可以选择低成本的磁盘存储设备。
数据备份与容灾：根据数据的重要性和可用性需求，选择具备数据备份和容灾功能的存储设备或容器，确保数据的安全性和可靠性。
数据压缩和加密：考虑数据的压缩和加密需求，选择支持数据压缩和加密功能的存储设备或容器，以减少存储空间占用和提高数据安全性。
数据迁移和迁移策略：考虑数据迁移的需求，选择支持数据迁移和数据迁移策略的存储设备或容器，以便在需要时能够顺利将数据迁移到其他存储设备或容器。

对于确定对数据进行入库的最优箱，腾讯云提供了一系列相关产品和服务，包括：

对象存储（COS）：腾讯云对象存储（COS）是一种简单、高效、低成本的云存储服务，适用于各种类型的数据存储需求。详情请查看：腾讯云对象存储（COS）
云数据库 MySQL：腾讯云提供的关系型数据库服务，适用于大规模Web应用、移动应用和互联网行业的数据存储和管理。详情请查看：云数据库 MySQL
云数据库 Redis：腾讯云提供的高性能内存数据库服务，适用于缓存、队列、实时分析等场景的数据存储和管理。详情请查看：云数据库 Redis
云硬盘：腾讯云提供的可扩展、高可靠的块存储服务，适用于云服务器、容器服务等场景的数据存储和管理。详情请查看：云硬盘

以上仅为腾讯云提供的一部分与数据入库相关的产品和服务，更多详情请参考腾讯云官网相关产品介绍页面。

确定对数据进行入库的最优箱

、、、、

我有X，Y数据，我想根据X值把它们放在一起。但是，我想根据得到的bin间隔和每个bin的平均Y来确定满足条件的X bin的最佳数量。例如，如果我有 X=[2,3,4,5,6,7,8,9,10] Y=[120,140,143,124,150,140,180,190,200] 我想确定满足此条件的最佳X bin数:Y bin/(X bin的8*宽度)的平均值应大于20，但应尽可能接近20。.我目前正在使用： b

浏览 18提问于2020-07-27得票数 0

1回答

大熊猫如何从聚合中按类别定位？

、

我有一些数据已经入库，然后按入库分组，使用.count对每个入库中的条目进行计数，并查询每个入库的样本数量import numpy as np valid_bins = df.groupby("bin")[["A"]].count().query("A > 310")

浏览 1提问于2018-01-08得票数 1

回答已采纳

4回答

数据直方图优化的联宽优化

、

我希望从给定的数据集生成数据直方图。我读过关于构造直方图的不同选项，我最感兴趣的是一种基于该方法采用估计法确定最优仓宽和最优分布，因为样本数据在分布上会发生变化，而且很难预先确定垃圾箱的数量和宽度。有人能推荐一个

浏览 2提问于2013-01-31得票数 3

回答已采纳

2回答

如何在R中绘制预先入库的直方图

、、、

对于一个相当大的数据集，我有一个预先入库的频率表。即，箱的单个列向量和与这些箱相关联的计数的单个列向量。我希望R通过对现有计数进行进一步的分类和求和来绘制此数据的直方图。例如，如果在预二进制数据中，我有类似于(0.01,5000)，(0.02,231)，(0.03,948)的数据，其中第一个数

浏览 1提问于2010-09-25得票数 10

1回答

什么时候应该在数据处理中使用数据入库？

、、、、

在数据预处理中，数据入库是一种将特征的连续值转换为分类值的技术。例如，有时，数据集中的age要素的值被替换为以下间隔之一： [10,20),[30,40].什么时候是使用数据入库的最佳时机？它是(总是)在预测系统中导致更好的结果，还是可以作为试错工作？

浏览 32提问于2020-12-28得票数 0

回答已采纳

1回答

入库逻辑中的Panda.qcut

、

我正在尝试用不同的方法对连续变量进行分类。我使用了两个方法- bin_sequence和entropy_based_binning方法qcut。为了测试，我创建了一个具有100个值的数据。我将前50条记录的值设置为1，接下来的几条记录设置为2，几条记录的值设置为5，12，然后随机设置几个数字，从而使数据倾斜。当我试图用数量=6的bins运行它时，它只用qcut方法创建了3个bins。从pandas文档中还不清楚它是如何处理倾斜<em

浏览 25提问于2020-09-09得票数 0

1回答

Seaborn.Distplot生成了一个直方图和一条带有不同x轴的KDE线--它们是如何在图中合并的？

、、

我使用this从Seaborn.Distplot中提取绘图数据。令人惊讶的是，直方图和KDE都返回不同的x轴值。首先，实用的问题是，这两个x轴是如何组合在同一个图中的？第二，理论上，问题是为什么垃圾箱不匹配-两个密度不应该用相同的底层垃圾箱创建吗？

浏览 29提问于2020-06-12得票数 0

回答已采纳

1回答

变量与R的独立性的卡方检验

、

我必须用R对两个物理变量进行卡方检验，我正在尝试：Library('gplots')pp<-

浏览 0提问于2012-03-03得票数 3

回答已采纳

1回答

Python/matplotlib在直方图中显示置信度

、、、、

这就是我的问题。我有一些数据，我把它们放入库中，得到一个“数字化”的pdf，这很好。现在，我想找到一种方法，通过对bin组进行不同的着色来表示不同的置信区间。特别是，从包含我想要找到的最高计数的垃圾箱开始，将所有面积总和小于.6的最高垃圾箱着色为红色。然后，总是通过递减计数来挑选新的垃圾桶，我想给那些将我的红色区域增加到橙色.8

浏览 0提问于2011-06-02得票数 3

回答已采纳

1回答

WEKA交叉验证离散化

、、

我试图通过应用无监督的离散化滤波器来提高我的WEKA模型的准确性。我需要决定回收箱的数量，以及是否应该使用等频率的装夹。通常情况下，我会使用一个训练集来优化这一点。但是，在使用交叉验证时，如何确定装箱的大小以及是否应该使用等频率的绑定？我最初的想法是在多次交叉验证测试中利用分类器的精度结果来找到最优的垃圾箱尺寸。然而，尽管使用交叉验证，使用同样<

浏览 1提问于2015-08-03得票数 1

回答已采纳

1回答

通过替换迭代更大的Bin大小的随机样本，bin列和聚合数据

、、、

", "l", "m", "p", "q", "s", "t", "u", "v","x", "z"), c("1", "2", "3", "4", "5", "6")) 我希望对列进行分组或bin，然后聚合每个

浏览 36提问于2019-09-24得票数 0

回答已采纳

4回答

在numpy中打包多维数组

、、

我有一个4Dnumpy数组(这些是成堆的成像数据)，我想沿着除一个轴之外的所有轴执行平均入库。从say开始 x=np.random.random((3,100,100,100)) 我想要对轴1,2,3应用箱大小为10的箱，并平均每个箱中的值。预期结果将是形状数组(3,10,10,10) 我对np.reshape的研究是这样的： result=x.reshape(3,-1,10,10

浏览 46提问于2021-05-05得票数 3

回答已采纳

2回答

使用入库列的平均值对新列进行入库和命名

我有一个数据集，其中列名是数字，行名是样例名(见下文)。599.828" "B" 0 0 0 0 0 1 0 3 "D" 3 0 0 0 3 1 0 0 "599.785&q

浏览 9提问于2013-07-12得票数 1

1回答

焦点和上下文图的数据分组- d3.js

、

我有一个使用d3.js开发的焦点和上下文条形图，它工作得很好，但当我缩小区域时，我想显示该图的分组值。如下面的屏幕截图所示，其中有两个值为1的条形图，但当我缩小显示它一个月的数据时，它只显示一个值为1的条形图。 this.rende

浏览 8提问于2014-02-28得票数 2

1回答

有效聚类算法

、、

我需要帮助(最好是一个完整的算法，但任何提示或参考将不胜感激)，有以下算法问题：假设我们在一个数字轴上有以下点：1，11

浏览 4提问于2017-11-16得票数 2

回答已采纳

1回答

在给定一些数据的情况下有多少个箱子

、、、、

我必须使用直方图绘制一些数据。我的数据在0,1之间，在任何特定的点上都没有很大的集中度。样本数和桶数(等长)之间的比例是多少？

浏览 2提问于2012-08-21得票数 2

回答已采纳

1回答

用最少的移动次数最小化装满球的桶的最大重量的算法

、

我想重复这个过程，直到我已经实现了最平衡的配置重量桶，采取最少的步骤。贪婪之树:从零开始，

浏览 2提问于2019-03-14得票数 0

回答已采纳

1回答

如何进行相对于项目位置的锈蚀链接搜索？

、

我正在创建一个C库的锈蚀包装器。我将C库放在lib目录中，并使用build.rs告诉编译器在哪里可以找到要链接的库：当我构建库时，这很好，但是依赖于包装库的下游库会导致编译失败：在编译客户端库时，这不是指向repository\checked_out_project\lib，而是在本地查找，因为在依赖

浏览 5提问于2017-01-29得票数 5

回答已采纳

1回答