我已经实现了以下部分代码:
array = [table.iloc[:, [0]], table.iloc[:, [i]]]它应该是由从先前导入的数据集中提取的两个向量组成的数据帧。我使用参数i,因为这段代码是循环的一部分,循环使用一个预定义的函数来分析一个固定变量[0]和其他变量之间的相关性-每次迭代都会检查与不同变量[i]的相关性。
当我将括号改为四舍五入时,Python将此对象视为列表或元组。我需要这个对象是一个数据帧(下一步是使用.dropna删除NaN值,这是一个df属性。
我该如何解决这个问题呢?
发布于 2019-07-09 19:48:48
如果我正确理解了您的问题,您希望从一个更大的数据帧中构建一个提取,该数据帧只包含2列,这些列的索引号是已知的。您可以简单地这样做:
sub = table.iloc[:, [0,i]]它将保留原始table数据帧中的所有属性(包括索引、列名和数据类型)。
发布于 2019-07-09 20:09:25
您使用数据帧的目标是什么?
dataframe是使用pandas进行数据分析时的常用术语
Pandas就是为了方便这种分析而开发的,在它中,获取.csv文件中的数据并将其转换为dataframe非常简单,如下所示:
import pandas as pd
df = pd.read_csv('my-data.csv')
df.info()或者来自字典或数组
df = pd.DataFrame(my_dict_or_array)然后你可以选择你想要的行
df.loc[:, ['INDEX_ROW_1', 'INDEX_ROW_2']]如果这是您要找的,请让我们知道
https://stackoverflow.com/questions/56951537
复制相似问题