我在试着申请未来的选择。问题是,使用整个数据帧会导致内存错误。因此,我决定削减我的数据,以便能够应用下一个未来的选择:
# this is original dataframes
X_full = df_train[df_train.columns[0:size]] # 76000(rows)*300(cols)
y_full = df_train[[len(df_train.columns)-1]] # 76000(rows)*1(col)
y_full包含0和1,数字1低于5%。所有其他列都只包含数字,但我们不知道它们的意思。
#this is way, I reduce the numb
所以我用请求从某个页面中获取了这个数据。现在我使用它的值来创建列表。我如何在列表中迭代以提取和使用每一项?我已经尝试过这样的方法:
for component in values:
if values.index(component) > 0:
value = values.pop()
但它只给了我一些东西,留下了另外一些东西。
这一切我都是新来的,所以温柔点:)。
我有一个大型的医学数据库,我需要根据选定的医生(S)为患者提取数据。
现在我建立了一个病人名单
SELECT patID
FROM appointments
WHERE docID IN ('docid1', 'docid2', ..... , 'docidn')
一旦我得到了我的病人列表,我就会在从一大堆病人相关的表中提取数据时使用它。
根据我最初的医生名单,我可能最终得到的病人名单是20,000+。该系统中病人总数接近100万人。
然后,我拿起我的病人名单,开始从其他表格中获取数据,大致如下
Sel
我有两个numpy数组,第一个是一维的A,第二个是B,在我所想到的应用程序中是二维的,但实际上可以有任何维度。B的每一个索引都与A的单个索引覆盖相同的范围。
现在,我想对A进行排序(按降序排列),但希望与其一起对B的每个维度进行排序。从数学上讲,如果P是排序A的置换矩阵,我想根据np.dot(P, np.dot(B, P.T))变换B。例如,考虑以下示例,其中排序巧合地对应于倒序:
In [1]: import numpy as np
In [2]: A = np.array([1,2,3])
In [3]: B = np.random.rand(3,3); B
Out[3]:
arra
我正在将相当大的数据集从json解析为“传统”数据框架(行作为观察,列作为变量)。json对象包含每个观察的特征列表。我想把它转换成一个零一向量,它表示所讨论的观测是否具有这种特性。
我拥有的是“主列表”(包含所有可能的特性的列表)和观察列表(如json )。假设所有特征的个数为K,则每个观测的输出应该是长度K的0-1列表,标记每个特征是否适用于该观测。
我目前的方法是“蛮力”迭代:
characteristics #master list of all possibilities
output_dataset = []
for observation in data:
chars =
所以,我有两个包含数据的列表。一个是关于一个物体从哪个高度掉下来的信息(称为heightsTotal),另一个是关于该物体掉下来所花费的时间的信息(称为timesTotal)。对于每个高度,一个物体会被抛出几次。我想要做的是从列表中提取元素,并根据时间对应的高度将它们排序到列表中。 我已经解决了这个问题,但它需要大量的代码。我的代码看起来像这样: timesAfterHeight = [[], [], [], [], []]
counter = 0
for i in heightsTotal:
if i == 0.2:
timesAfterHeight[0].app